
“我們正在加大投資人工智能模型,為我們的產(chǎn)品賦予新的功能,并提升對內(nèi)容和廣告的精準推薦能力。我們不僅致力于將領(lǐng)先的人工智能能力定位為自身業(yè)務(wù)發(fā)展的倍增器,也讓其為我們的企業(yè)客戶,乃至整個社會創(chuàng)造價值。”騰訊董事會主席兼首席執(zhí)行官馬化騰在2023年第三季度財報中表示。

據(jù)悉,騰訊本季度總收入為人民幣1546億元,同比增長10%。同時財報中還表示,騰訊正在升級自研基礎(chǔ)模型騰訊混元,將其部署到內(nèi)部產(chǎn)品中,并向外部企業(yè)客戶開放使用。
隨著混元大模型的發(fā)布,騰訊也正式將全面擁抱大模型作為未來的發(fā)展方向。目前我國人工智能市場大模型數(shù)量已經(jīng)趨于飽和,如何通過大模型為企業(yè)開辟商業(yè)化路徑,為用戶賦能實際生產(chǎn)生活新方式已經(jīng)成行業(yè)新的競爭高地。

對此,大模型之家將依照《人工智能大模型產(chǎn)業(yè)創(chuàng)新價值研究報告》提出的“AQUA”評價體系,從模型能力、任務(wù)處理能力、應(yīng)用生態(tài)等六個維度對騰訊混元大模型展開多角度全方位的評測。
模型能力
模型規(guī)模:混元大模型的參數(shù)規(guī)模超過千億,是目前國內(nèi)最大的中文語言模型之一。模型規(guī)模的提升可以持續(xù)提高模型的泛化能力和通用能力,使模型能夠處理更多的場景和任務(wù)。
訓(xùn)練數(shù)據(jù)量:混元大模型的預(yù)訓(xùn)練語料超過2萬億tokens,覆蓋了多個領(lǐng)域和主題的中文文本。訓(xùn)練數(shù)據(jù)量的增加可以提升模型的語言理解和生成能力,使模型能夠?qū)W習(xí)到更豐富和更深層的語言知識。訓(xùn)練數(shù)據(jù)量是大語言模型優(yōu)化的關(guān)鍵,可以為模型提供更多的語言樣本和語言規(guī)律,提高模型的質(zhì)量和效果。
訓(xùn)練算力:混元大模型采用了騰訊自研的訓(xùn)練框架和優(yōu)化策略,利用騰訊云的高性能計算集群,實現(xiàn)了低成本、高效率的大模型訓(xùn)練。訓(xùn)練算力的提升可以縮短模型的訓(xùn)練時間,提高模型的訓(xùn)練質(zhì)量,使模型能夠快速迭代和優(yōu)化。訓(xùn)練算力作為大語言模型實現(xiàn)的基礎(chǔ),為大模型帶來更多的計算資源和計算能力,提高模型的性能和穩(wěn)定性。
任務(wù)處理能力
通過AQUA任務(wù)處理能力測試環(huán)節(jié),大模型之家發(fā)現(xiàn)混元大模型具有非常出色的聯(lián)系上下文能力,混元大模型能夠理解并保持對整個對話歷史的把握。其上下文理解能力使得模型能夠準確解讀前文的語境,從而更好地回應(yīng)用戶的提問。

再對評測問題的“追問”,混元大模型不僅可以給出正確的答案還可以在接下來的多輪對話中豐富用戶的需求,這樣的模型能夠保持一致性,確保在整個對話過程中回答的信息不產(chǎn)生矛盾。可以靈活地適應(yīng)對話中的變化,處理新引入的信息,能夠在對話的不同輪次中保持一致的語境。使得混元大模型更具智能,并且在復(fù)雜的任務(wù)中表現(xiàn)更為出色。
從混元大模型的任務(wù)處理表現(xiàn)上可以看出,模型在訓(xùn)練中使用了大規(guī)模的數(shù)據(jù)集,使其能夠涵蓋多樣的語境和主題,從而更全面地理解不同領(lǐng)域的知識。通過廣泛訓(xùn)練思路幫助模型在處理各種領(lǐng)域和主題的對話時表現(xiàn)得更為靈活和全面。大模型通常采用先進的注意力機制,能夠在處理長文本序列時更好地關(guān)注重要的部分,確保對話的一致性和準確性。

值得一提的是混元大模型在一輪對話中還設(shè)置了清除上下文關(guān)聯(lián)功能,通過此功能可以讓使用者快速的校準在對話出現(xiàn)問題或錯誤的情況,對于需要精準回答當前問題而不受先前對話歷史影響的場景,清除上下文關(guān)聯(lián)功能有助于控制對話的方向,確保模型專注于當前上下文而不被過去的信息干擾。

同時,該功能可以讓混元大模型更獨立于先前的語境,從而提高模型對于不同問題和場景的適應(yīng)性和魯棒性。

在測試中,大模型之家還發(fā)現(xiàn)混元大模型基本上在所有的回答后都會給出相應(yīng)的擴展內(nèi)容,特別是在客觀選擇題上,都會給出正確的答案以及各個選項的解釋。在內(nèi)容創(chuàng)作方面,混元大模型生成的答案不會吝惜文字,在目前市場上的同類產(chǎn)品具有很強的競爭力。
泛化能力
在泛化能力上,混元大模型可以通過語音、文字、圖片等多種方式與用戶交互,根據(jù)用戶的需求,提供相應(yīng)的輸出方式增加用戶的溝通效率和體驗,適應(yīng)不同的場景和設(shè)備。混元大模型可以對多種模態(tài)的信息進行理解和生成,如圖文對齊、圖像描述、圖像檢索、圖像問答、圖像摘要、圖像分類等。

除多模態(tài)能力外,在多場景支持領(lǐng)域,混元大模型目前支持如文檔場景、會議場景、廣告場景和營銷場景應(yīng)用,可以提供文檔創(chuàng)作、文本潤色、文本校閱、表格公式及圖表生成、智能問答、文本摘要、文本分類等能力,提高場景的適應(yīng)性和效率。
混元大模型會議場景
應(yīng)用應(yīng)用拓展能力

混元大模型不僅可以作為基底模型,為不同產(chǎn)業(yè)場景構(gòu)建專屬應(yīng)用,還可以作為基礎(chǔ)設(shè)施,支持騰訊的各種產(chǎn)品和應(yīng)用能力。目前,騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等超過50個騰訊業(yè)務(wù)和產(chǎn)品,已經(jīng)接入騰訊混元大模型測試,并取得初步效果。
其中,騰訊會議通過接入混元大模型實現(xiàn)了會前、會中、會后全流程的體驗重塑,從而有效提升了會議的效率和質(zhì)量。這也代表混元大模型在應(yīng)用拓展方面具備卓越的能力,能夠為各類產(chǎn)品和服務(wù)提供更為智能、高效、豐富的體驗。這表明混元大模型在騰訊多元化業(yè)務(wù)生態(tài)中發(fā)揮著關(guān)鍵的角色,并為不同業(yè)務(wù)領(lǐng)域的需求提供了有效的解決方案
開放性指標

在開放性指標中,騰訊云業(yè)務(wù)也為混元大模型帶來多重部署方式,面向豐富的業(yè)務(wù)場景,提供整套行業(yè)和技術(shù)解決方案。混元大模型作為騰訊云的核心產(chǎn)品之一,騰訊云業(yè)務(wù)提供的高性能計算資源為大模型的訓(xùn)練和推理提供了強有力的支持。

通過與騰訊云的其他產(chǎn)品和服務(wù)相結(jié)合,實現(xiàn)多語言、多模態(tài)、多場景的泛化能力,為用戶提供更智能、更便捷、更有趣的體驗,促進產(chǎn)品和服務(wù)的創(chuàng)新。同時,騰訊云還可以提供多層次的安全措施,包括數(shù)據(jù)加密、訪問控制等助力數(shù)據(jù)安全和隱私保護。
大模型之家認為,騰訊的龐大用戶基礎(chǔ)為騰訊在人工智能時代提供了先天性的資源優(yōu)勢。騰訊擁有超過10億的通信和社交用戶,以及超過1億的視頻、音樂、文學(xué)等數(shù)字內(nèi)容用戶,通過匯聚來自各種業(yè)務(wù)領(lǐng)域的龐大用戶群體的數(shù)據(jù),能夠為混元大模型提供豐富、多樣的訓(xùn)練樣本,從而提升模型的訓(xùn)練效果和泛化能力。這樣的數(shù)據(jù)基礎(chǔ)為模型的智能化和個性化提供了有力的支持,使其能夠更準確地理解用戶需求和行為。

