
4月18日晚間,Meta正式發布全新一代開源模型Llama3。本次發布的Llama3涵蓋了兩個版本,即Llama3-8B和Llama3-70B,它以其8B的模型規模,超越了去年70B模型的性能。Meta宣稱Llama 3-8B和Llama 3-70B是目前同體量下,性能最好的開源模型。
在開源與閉源路線的長期“較量”中,Llama 3的問世,無疑為開源社區注入了一劑強心針,不僅是對開源模式潛力的有力證明,更激勵更多的企業和開發者加入到這一開放、協作的生態系統中。
針對Llama 3的具體能力表現,前不久,國內人工智能權威機構清華大學基礎模型研究中心正式發布《SuperBench大模型綜合能力評測報告》,測試了國內外數款大模型在語義、代碼、對齊、智能體和安全五個評測集中的表現。

根據報告的評分結果,Llama3-70B模型的表現出色,其得分在眾多國內外頂尖模型中位列第六位。
大模型之家還注意到,在SuperBench的評測榜單中,第一梯隊的大模型已經不再是海外大模型“霸榜”的局面,有兩款來自國內企業的大模型產品在語義理解能力表現中超越了Llama-3,其中一款是智譜AI開發的GLM-4,另一款是百度推出的文心一言4.0。可見,歷經一年的技術發展與沉淀,全球大模型技術能力的競爭格局正在悄然發生改變,中國最前沿的大型人工智能模型已經達到了國際領先水平,成為全球人工智能領域的引領者。
多項評分領先,國產大模型對癥下藥飛根據SuperBench發布的評測報告,GLM-4在各項子項評測中均展現出優秀的成績。特別是在知識-常識能力方面,GLM-4以77.3分的優異成績榮登全球第二、國內第一的寶座。同時其強大的多模態處理能力使GLM-4不僅能處理文本信息,更能理解和生成圖片、文件及視頻內容,從而在圖文理解和生成任務中脫穎而出,精準回應用戶的復雜需求。

在長文本處理能力上,GLM-4具備128k的上下文處理能力,能夠輕松應對長達300頁的文本。在MMLU、GSM8K、BBH、HellaSwag等多個數據集上,GLM-4的表現均達到了GPT-4相應性能的94%至100%,展現出卓越的性能。
通過有機整合來自不同模態的上下文信息,GLM-4增強了對整個交互情境的理解能力,這種整合能力使得模型在應對需要綜合多種信息源的復雜任務時,能夠提供更加精準和全面的回答,進一步提升用戶體驗。

此外,在智能體能力方面,GLM-4同樣表現出色,為產業化創造了條件。例如在電商場景中,依托出色的自然語言處理(NLP)能力,能夠理解和解釋用戶的查詢、評論以及商品描述,從而準確捕捉用戶的購物意圖和偏好。
通過先進的推薦系統技術,包括基于協同過濾、深度學習模型等,模型能夠根據用戶的個性化需求和行為數據,以及通過利用大規模數據處理和分析技術,實現對用戶提供更具針對性和前瞻性的服務。
大模型之家還了解到,智譜AI推出了GLMs個性化智能體定制功能,允許用戶無需具備編程基礎,通過簡單的語言提示輕松創建屬于自己的GLM智能體,大幅降低大模型的使用門檻。

此外,GLM-4模型在圖像生成和理解方面也實現了重大突破。通過集成CogView3代模型,GLM-4不僅能夠生成具有藝術感的高質量圖像,還能對圖像內容進行深入分析和理解。這種能力極大地豐富了模型在處理涉及視覺信息的任務時的表現,使得GLM-4能夠更準確地捕捉和回應圖像中的細節和上下文。
學術+商業雙管齊下,國產AI走向成熟
中國大模型技術的快速發展,也讓越來越多的國產大模型登上了世界權威評測的榜單。不僅是SuperBench評測,在OpenCompass2.0公布的2023年度大模型公開評測榜單中,也能夠看到智譜GLM-4、阿里巴巴Qwen-Max、百度文心一言4.0位列榜單前列,中美在人工智能領域的技術差距正在以超乎想象的速度拉近。

大模型的技術革命,不僅為人工智能賦予了“涌現”的能力,也為行業逐漸“涌現”出了各種機會,我國人工智能企業也在積累中迎來爆發,全球AI發展的態勢也逐漸將人工智能擺在了關鍵競爭高地。智譜AI CEO張鵬曾多次表示,智譜要將“實現大模型生成AI的全鏈路自主可控”作為企業的核心競爭力。
在學術領域,中國大模型從業者在多項研究領域都走在行業前沿。例如在近期研究中,智譜團隊證明了依靠更好的預訓練質量,在更小模型上也能實現了更優的模型能力,顛覆了大模型行業“大力出奇跡”的思維定勢。

此外,智譜AI帶來了提升大模型與人類偏好一致性的強化學習系統——ChatGLM-RLHF框架,該框架由三個主要部分組成:數據收集與處理、獎勵模型訓練和策略模型訓練。
首先,ChatGLM-RLHF通過從SFT模型生成的兩個輸出中選擇一個更優的響應,完成數據的收集。再利用收集到的偏好數據來訓練一個獎勵模型,預測最符合用戶偏好的回答。最后,使用獎勵模型來指導模型的優化過程,通過最大化累積獎勵來提升模型的表現。

在三個步驟的協同工作下,大模型能夠更加“通人性”,更清晰地理解人類的喜好與需求,才能夠更好地為用戶提供服務
在眾多權威評測中的亮眼表現以及在研發領域的累累碩果,見證著中國大模型企業的創新能力得到了國際認可。國內豐富的應用場景,也讓大模型產業落地走在世界前列,無論是智慧城市、智能制造,還是醫療健康、金融科技等領域都在探索利用大模型技術實現降本增效。
以智譜AI為例,在商業領域前已經有超過2000家生態合作伙伴,1000家規模化應用和200 家深度共創客戶。智譜清言作為一款免費的AI工具,為大眾用戶提供了一個接觸和體驗生成式AI的窗口。
未來,隨著技術的日益成熟和應用領域的不斷拓寬,我們滿懷信心地期待,我國大模型行業將不斷砥礪前行,在探索新的技術高峰的同時,享受到人工智能技術帶來的便捷與美好。