
“大模型我們走在最前面,我們要去勇闖無人區,需要去冒前人沒有冒過的風險。”這句話出自日前百度一場內部頒獎活動中,百度創始人、董事長兼首席執行官李彥宏的講話。他還指出,百度一直堅信技術可以改變世界,會一直沿著這條路走下去。
李彥宏還在演講中,回顧了百度在過去一年中,在大模型領域取得的成果。李彥宏表示,文心一言在去年3月16日首發,歷經3.5、4.0版本不斷迭代,大模型的基礎能力始終走在中國大模型的最前列。他介紹說,自去年五月用大模型重構所有產品線以來,“今天,有10%的大搜流量,已經是通過文心一言的模型來生成的;今天,每天有250萬用戶,用到文庫的AI能力。”在回顧成果的興奮之余,李彥宏的神態依然保持著那份從容與堅定。事實上,無論是內部與外部的演講,李彥宏都是以從容的姿態示人。似乎在他看來相較于短期的成功與失敗,真正重要的是技術的長期價值和其對人類社會的深遠影響,只有持續的投入,才能換來通向通用人工智能(AGI)的曙光。
以技術為信仰,勇闖無人區
評價一家企業的價值,尤其是科技企業,核心點仍是關注企業的技術能力和壁壘。
在AI領域,百度發力最早,擁有的技術壁壘也是業內最高,不僅早在十幾年前即投入到AI研究中,而且在中國首發AI技術框架、生成式大模型產品,在AI基礎能力上,始終走在中國最前列。
這與李彥宏的技術信仰密不可分。如果說“用科技讓復雜的世界更簡單”的使命,是對于百度愿景最好的概括,那么百度的發展歷程,是對技術信仰的最好詮釋。

自1999年成立以來,百度便致力于為用戶提供更便捷、更智能的服務。早在回國創立百度前,李彥宏就已經研發出了全球第一個超鏈搜索引擎,并獲得了專利,比谷歌早了三年,而后這項專利后來被谷歌引用了數百次。
而這項技術,也埋下了百度未來發力人工智能的“種子”。
搜索與人工智能技術的聯系千絲萬縷,搜索引擎需要處理海量的信息,并根據用戶的需求進行智能匹配,這需要強大的人工智能技術作為支撐。而百度在搜索引擎領域的深厚積累,為其在人工智能領域的發展提供了堅實的基礎。
早在2010年,百度就成立了自然語言處理NLP部門,成為中國最早投入AI的公司,挺進人工智能發展的“無人區”,并在2013年成立了第一個深度學習實驗室。
2023年,伴隨ChatGPT的爆火,大模型技術走到了人工智能行業的聚光燈下。憑借著強大的理解、生成、邏輯、記憶能力,大模型不僅能夠處理海量的數據,還能從中學習到更加復雜、更加精細的知識模式,進而為各行各業提供更為精準、智能的解決方案。
而早在行業關注到大模型這一技術趨勢前,百度便已經率先開始相關的技術儲備。2019年3月,文心大模型發布1.0版本,彼時,國內對于大模型的關注還處于起步階段,ERNIE 1.0采用了多層雙向注意力機制,實現了在海量數據中自動學習知識表示,提升自然語言理解能力。
而在隨后ERNIE 2.0和ERNIE 3.0的更新中,文心大模型相繼引入了多模態學習技術、跨語言學習技術、以及動態知識更新技術,實現了模型持續的學習和進化。
多年在大模型領域的積累,也讓百度能夠在2023年大模型成為行業熱點之后,第一時間發布文心大模型3.5,并正式推出國內首款生成式AI產品文心一言。從2023年8月 31日面向全社會全面開放以來文心一言用戶數已經突破了2億,API日均調用量也突破了2億。
如今,文心大模型已經升級到4.0版本,并伴隨技術迭代,不斷擴展著能力的邊界。文心大模型的持續快速進化,得益于百度在芯片、框架、模型和應用上的全棧布局,尤其是飛槳深度學習平臺和文心的聯合優化。在上個月舉行的Create 2024百度AI開發者大會上,百度宣布文心大模型的周均訓練有效率達到98.8%,相比一年前文心一言發布時,訓練效率提升到當時的5.1倍,推理105倍。
百度在不斷提升大模型的效率和效果的同時,也在降低大模型的成本和門檻。
目前,文心大模型已廣泛應用于搜索、信息流、智能音箱等互聯網產品,并通過飛槳深度學習平臺、百度智能云賦能工業、能源、金融、通信、媒體、教育等各行各業。截至2024年3月,百度智能云的千帆大模型平臺已為8.5萬家企業提供服務,精調了1.4萬個大模型,并開發出超過19萬個大模型應用。同時三星、榮耀等手機品牌,也與百度智能云達成合作,為用戶提供優質的生成式AI服務。

如今,百度已經成為中國互聯網與人工智能技術的引領者,同時,百度還積極參與國際交流與合作,推動中國AI產業走向世界舞臺。近期由清華大學基礎模型研究中心聯合中關村實驗室研制的SuperBench大模型綜合能力評測中,文心一言4.0表現亮眼,與國際一流模型水平接近。
如今,眾多車企紛紛開始布局“智能駕駛”,但國內最早投身于自動駕駛技術研究的企業,也是百度,2013年開始率先投身國內自動駕駛的“無人區”,成為中國最早、投入最多的自動駕駛企業。

如今,在自動駕駛領域,百度自動駕駛出行服務商蘿卜快跑已經成為全球最大的自動駕駛出行服務商之一。目前,蘿卜快跑已經在北京、上海、廣州等多個城市開放運營,為更多用戶提供了優質的自動駕駛服務。
推動技術成果共享,促進大模型生態共贏
在輝煌成績背后,通常被人們所忽略的,是百度對技術研發的持續投入和人才培養的重視。百度十年如一日堅持壓強式、馬拉松式的研發投入,在AI領域投入超過1000億元,研發人員占比超過60%。這種長期且高強度的投入,成為百度在人工智能領域的技術創新的基石。
在這一過程中,百度也成為了中國乃至全球人工智能的“黃埔軍校”,提前完成5年為全社會培養500萬AI人才的目標,還培養并吸引了一批頂尖的技術人才,如吳恩達、余凱、林元慶等他們曾為百度的發展做出了重要貢獻。
除了內部培養,百度還積極開展校企合作,與眾多高校和研究機構建立了緊密的合作關系,共同開展科研項目,培養技術人才。這種“產學研”合作模式不僅為百度輸送了人才,也為學術界的研究提供了實踐場景,實現了真正的互利共贏。
在探索技術“無人區”的同時,百度更是勇于“搭橋鋪路”,將成果與合作伙伴共享,推動AI技術的行業進步,通過與各行各業的企業合作,共同打造繁榮的產業生態。
截至目前,飛槳文心生態已經凝聚了1295萬開發者,服務了24.4萬家企事業單位,并基于飛槳和文心創建了89.5萬個模型。這些數字背后,不僅彰顯了百度在AI領域的實力,也通過提供技術支持和解決方案,幫助各行各業實現了數字化轉型和智能化升級。
投入前沿技術需要創新、需要勇闖無人區,沒有作業可以抄,只能自己探索摸索。2024年也是大模型應用落地的關鍵之年,百度正在各個方面積極嘗試,這些嘗試都不容易,但如果能實現突破,就像李彥宏所說,“熬過去,就能化繭成蝶”。