
如果說(shuō)哪條大模型核心理論影響最為深遠(yuǎn),那么“Scaling Law”必然位列其中。
所謂“Scaling Law”,是指在深度學(xué)習(xí)中,增大數(shù)據(jù)量和模型參數(shù)能讓模型性能指標(biāo)提升,這種提升并非線性,而是遵循一種冪律關(guān)系。而OpenAI的GPT系列模型,無(wú)疑是這一理論最著名的成果展現(xiàn)。
但讓很多人意想不到的事,這個(gè)讓OpenAI “大力出奇跡”創(chuàng)造出GPT而一鳴驚人的理論,最早的研究起源其實(shí)是一家中國(guó)企業(yè)。

上個(gè)月,OpenAI論文的合著者、前OpenAI研究副總裁、Anthropic創(chuàng)始人Dario Amodei在一檔播客中提及,2014年他與吳恩達(dá)在百度研究AI時(shí),就已經(jīng)發(fā)現(xiàn)了模型發(fā)展規(guī)律Scaling Law這一現(xiàn)象,直到OpenAI在 2020年的Scaling Law研究中引用了百度研究人員2019年發(fā)表的論文,這個(gè)理論才真正被行業(yè)所熟知。

此外,Meta研究員、康奈爾大學(xué)博士候選人Jack Morris在社交媒體X上引用了一篇標(biāo)題為《Deep Learning Scaling is Predictable, Empirically》論文,該論文展示了在機(jī)器翻譯、語(yǔ)言建模、圖像處理和語(yǔ)音識(shí)別等四個(gè)領(lǐng)域中,隨著訓(xùn)練集規(guī)模的增長(zhǎng),DL 泛化誤差和模型大小呈現(xiàn)出冪律增長(zhǎng)(scaling)模式,與如今的“Scaling Law”理論如出一轍。
可見(jiàn),正是百度的早期研究,為AI大模型的發(fā)展奠定了理論基礎(chǔ)。
AI賽道上,中國(guó)企業(yè)并不落后
2023年,ChatGPT的問(wèn)世使大模型成為人工智能行業(yè)的焦點(diǎn)。雖然OpenAI在行業(yè)中引領(lǐng)風(fēng)潮,但后來(lái)者憑借規(guī)模與技術(shù)實(shí)力的積累,迅速呈現(xiàn)出百花齊放的狀態(tài),海外企業(yè)如谷歌、Meta、Anthropic等企業(yè),紛紛推出能力不亞于GPT-4的模型序列。
中國(guó)科技企業(yè)更是以驚人的速度奮起直追。百度、阿里等國(guó)內(nèi)巨頭的大模型開(kāi)始大規(guī)模落地,走進(jìn)千行百業(yè)。僅百度文心大模型,日均調(diào)用量便已超15億,自去年12月首次披露以來(lái)增長(zhǎng)30倍。同時(shí)基于頭部企業(yè)提供的基礎(chǔ)模型能力,國(guó)內(nèi)大模型應(yīng)用生態(tài)已經(jīng)初具規(guī)模。

盡管美國(guó)在AI模型創(chuàng)新方面一直被視為領(lǐng)先者,但最新討論顯示,中國(guó)在探索一些AI領(lǐng)域概念方面,比美國(guó)更為超前。
早在“大模型”技術(shù)爆發(fā)前,百度便已進(jìn)行技術(shù)儲(chǔ)備。2019年3月,百度發(fā)布文心大模型1.0版本,并緊隨GPT迭代速度進(jìn)行迭代,在2023年3月迅速推出文心大模型3.5,成為國(guó)內(nèi)首家推出大模型產(chǎn)品的大廠,同年10月進(jìn)一步發(fā)布文心大模型4.0版本,實(shí)現(xiàn)大模型核心能力的全面提升。據(jù)悉,百度還將在2025年初推出文心大模型全新版本。
隨著AI全面深入多模態(tài)領(lǐng)域,百度創(chuàng)始人李彥宏在百度世界2024上首發(fā)圖像檢索增強(qiáng)iRAG技術(shù),用以減輕圖像生成中的幻覺(jué)問(wèn)題,讓多模態(tài)技術(shù)可以更好落地產(chǎn)業(yè)。
在智能體方面,百度亦是業(yè)內(nèi)最早布局的大廠之一,2023年9月上線“靈境矩陣” (文心智能體平臺(tái)前身)。相比之下,谷歌、Meta等海外企業(yè)在2024年才正式發(fā)力智能體,而據(jù)OpenAI CEO山姆·奧特曼推文透露,其智能體產(chǎn)品需等到2025年才會(huì)正式發(fā)布。
掌握一定先發(fā)優(yōu)勢(shì),也讓國(guó)內(nèi)的大模型生態(tài)能夠先美國(guó)一步走進(jìn)產(chǎn)業(yè)。截至2024年11月,百度文心智能體平臺(tái)吸引了超過(guò)80萬(wàn)開(kāi)發(fā)者和15萬(wàn)家企業(yè)入駐,覆蓋教育、娛樂(lè)、零售、制造等多個(gè)行業(yè)領(lǐng)域。
中國(guó)也是全球AI的黃埔軍校
在全球頂尖AI企業(yè)與科學(xué)家群體中,華人已成為一股不可忽視的力量。
以O(shè)penAI為例,其早期團(tuán)隊(duì)中有9名華人,占團(tuán)隊(duì)總?cè)藬?shù)的10%。其中,5人本科畢業(yè)于中國(guó)高校,另外3人則在美國(guó)高校完成本科教育。更廣為人知的“AI教母”李飛飛,亦是華人出身,作為“空間智能”理論的奠基者,她的研究在全球范圍內(nèi)樹(shù)立了標(biāo)桿。
值得一提的是,如今在國(guó)際頂級(jí)AI機(jī)構(gòu)中擔(dān)任核心職位的諸多領(lǐng)軍人物,很多都曾在中國(guó)企業(yè)積累了寶貴的研發(fā)經(jīng)驗(yàn)。例如,2014年吳恩達(dá)加入百度擔(dān)任首席科學(xué)家,主導(dǎo)了“百度大腦”計(jì)劃的開(kāi)發(fā)。在他的邀請(qǐng)下, Dario Amodei斯坦福博士后畢業(yè)后,加入到了百度硅谷AI實(shí)驗(yàn)室,隨后又招募了Jim Fan來(lái)百度實(shí)習(xí)。如今,Dario Amodei成為Anthropic的創(chuàng)始人兼首席執(zhí)行官,而Jim Fan則是英偉達(dá)AI領(lǐng)域的核心人物。

這些從中國(guó)企業(yè)走向國(guó)際舞臺(tái)的頂尖人才,不僅展現(xiàn)了個(gè)人的卓越能力,也將中國(guó)企業(yè)在AI領(lǐng)域的深刻理解與實(shí)踐成果傳遞到全球。在這些AI頂尖人才身上,既凝聚了中國(guó)高校與企業(yè)的培養(yǎng)底蘊(yùn),也彰顯了中國(guó)作為全球AI“黃埔軍校”的重要地位。
自主可控的“母語(yǔ)”大模型
從產(chǎn)業(yè)格局看,為14億中國(guó)用戶量身定制、打造符合中國(guó)語(yǔ)言習(xí)慣的“母語(yǔ)AI”,既是中國(guó)AI企業(yè)的優(yōu)勢(shì)所在,也是不可或缺的戰(zhàn)略目標(biāo)。
早在2024年3月,百度李彥宏就公開(kāi)表示,“文心大模型4.0在中文處理上明顯超過(guò)GPT-4”,這得益于豐富的中文語(yǔ)料訓(xùn)練,以及深諳中文表達(dá)的本土工程師的精細(xì)調(diào)試。不僅如此,阿里通義、字節(jié)豆包、訊飛星火等國(guó)產(chǎn)大模型同樣實(shí)現(xiàn)了在中文語(yǔ)境中的超越,為中國(guó)用戶和產(chǎn)業(yè)提供了高質(zhì)量的人工智能服務(wù)。

更為重要的是,中國(guó)產(chǎn)業(yè)對(duì)“接地氣”的國(guó)產(chǎn)大模型有著巨大的需求。這些大模型能夠更加“近水樓臺(tái)”地接觸到產(chǎn)業(yè)的多樣化需求,并以更高效的方式提供定制化解決方案。在實(shí)際應(yīng)用場(chǎng)景中,中國(guó)企業(yè)正積極將AI技術(shù)擴(kuò)展至制造業(yè)、醫(yī)療、教育等領(lǐng)域。這種緊密結(jié)合實(shí)際需求的模式,使國(guó)產(chǎn)大模型在落地效果上具備顯著優(yōu)勢(shì)。
與此同時(shí),全球AI競(jìng)爭(zhēng)格局的演變,進(jìn)一步凸顯了自主可控的重要性。近日,特朗普提議設(shè)立人工智能部長(zhǎng),并將AI技術(shù)提升到國(guó)防戰(zhàn)略層面,直接引發(fā)了新一輪的“AI軍備競(jìng)賽”。這讓業(yè)界清醒地認(rèn)識(shí)到,只有構(gòu)建自主可控的大模型生態(tài),將關(guān)鍵技術(shù)牢牢掌握在自己手中,才能避免在國(guó)際競(jìng)爭(zhēng)中被“卡脖子”。
從“Scaling Law”背后的深厚積累,到國(guó)產(chǎn)大模型引領(lǐng)中文語(yǔ)境的突破,中國(guó)企業(yè)已經(jīng)從“追隨者”逐步邁向“領(lǐng)跑者”的角色,在技術(shù)研發(fā)、理論創(chuàng)新和產(chǎn)業(yè)落地的多維度競(jìng)爭(zhēng)中,中國(guó)AI企業(yè)展現(xiàn)出了極強(qiáng)的適應(yīng)性與開(kāi)拓力,在全球AI領(lǐng)域的影響力也與日俱增。
相信在諸多國(guó)內(nèi)領(lǐng)軍企業(yè)的推動(dòng)下,中國(guó)AI生態(tài)也必將越來(lái)越完善,為全球人工智能產(chǎn)業(yè)貢獻(xiàn)更多“中國(guó)智慧”。