日韩欧美三级在线观看,www亚洲视频,国产毛片aaa

「大模型之家」獨家對話元象XVERSE：開源通用XVERSE-13B已基本實現(xiàn)國產(chǎn)可替代

在大模型蓬勃發(fā)展的推動下，人工智能正牽動著一場覆蓋全行業(yè)、全領(lǐng)域的科技變革，而開源大模型已在這場變革中樹立起不可或缺的地位。革命性的自然語言處理和生成能力賦予了企業(yè)和開發(fā)者前所未有的機會，構(gòu)建更智能、更高效的應(yīng)用和服務(wù)。在商業(yè)應(yīng)用、數(shù)據(jù)分析、教育培訓(xùn)等領(lǐng)域展現(xiàn)出巨大潛力。

8月7日，元象XVERSE公司宣布開源其百億參數(shù)的高性能通用大模型XVERSE-13B，可免費商用。據(jù)官方介紹，XVERSE-13B是目前同尺寸中效果最好的多語言大模型，在多項權(quán)威的標準中文和英文測評中，性能超越了Llama-2-13B、Baichuan-13B等國內(nèi)外開源模型代表。

對此，「大模型之家」獨家對話元象XVERSE，就開源大模型對企業(yè)、行業(yè)的價值與影響等多角度帶來專業(yè)的觀點與分析。以開源打造互聯(lián)網(wǎng)時代主流模式

元象XVERSE向大模型之家表示，XVERSE-13B是完全開源，支持免費商用。企業(yè)本意就是為了推動國產(chǎn)大模型開源生態(tài)與產(chǎn)業(yè)應(yīng)用的繁榮發(fā)展。如果技術(shù)發(fā)展，能推動生態(tài)和產(chǎn)業(yè)發(fā)展，我們自然能創(chuàng)造更多、更大的價值。

開源性質(zhì)將促進知識的共享和合作，打破信息孤島，使知識普惠化成為可能。這將使得知識和技術(shù)不再受限于特定的機構(gòu)或地區(qū)，有助于縮小數(shù)字鴻溝，提高社會中更多人的數(shù)字素養(yǎng)水平。

強大自然語言處理和生成能力將在各個行業(yè)和領(lǐng)域產(chǎn)生深遠影響。在醫(yī)療領(lǐng)域，它可以用于輔助醫(yī)療診斷、藥物研發(fā)等；在金融領(lǐng)域，可以用于智能投資分析、風(fēng)險評估等；在教育領(lǐng)域，可以推動個性化教育、智能輔導(dǎo)等；在媒體領(lǐng)域，可以改善內(nèi)容生成和新聞報道。

除此之外，開源大模型還有助于加速科研進展，為研究人員提供更強大的工具，推動各領(lǐng)域的創(chuàng)新。據(jù)元象XVERSE介紹，哈爾濱工業(yè)大學(xué)已經(jīng)率先使用XVERSE-13B大模型推進相關(guān)研究工作。哈工大計算機科學(xué)與技術(shù)學(xué)院張偉男教授表示，“開源是互聯(lián)網(wǎng)時代主流模式，不僅能貢獻社區(qū)，推動技術(shù)持續(xù)創(chuàng)新，還能利用協(xié)同解決算法透明性、穩(wěn)定性、公眾信任度等共性問題。”多數(shù)據(jù)領(lǐng)跑，讓AI寫作“用事實說話”

XVERSE-13B大模型基于標準Transformer結(jié)構(gòu)，在1.4萬億高質(zhì)量、多樣化tokens的訓(xùn)練數(shù)據(jù)上，從零訓(xùn)練（train from scatch）了130億參數(shù)大模型，支持40多種語言，上下文窗口大小為8192。

1.4萬億tokens為XVERSE-13B帶來了更豐富和多樣化的語言知識，能夠處理更復(fù)雜和多變的自然語言任務(wù)。8192的上下文窗口大小，說明模型能夠捕捉到更長距離的語義關(guān)系，但也需要更多的計算資源。

元象XVERSE向大模型之家介紹：“訓(xùn)練XVERSE-13B我們使用的是千卡算力，網(wǎng)絡(luò)采用ROCE（RDMA over Converged Ethernet）是一種基于以太網(wǎng)的RDMA（Remote Direct Memory Access）協(xié)議，單機規(guī)格1.6Tbps。提升推理速度和效果是我們正在探索的工作，也是后續(xù)的優(yōu)化方向。”

除此之外，大模型之家注意到在XVERSE-13B的測評過程中選擇了AGIEval、GAOKAO-Bench等評測方法進行測試，這些評測方法主要為圍繞一些國內(nèi)外專業(yè)的官方入學(xué)和職業(yè)資格考試。

在回答“當(dāng)面對非官方中文語言理解和邏輯推理時將如何避免XVERSE-13B回答出現(xiàn)‘幻覺’？”的問題時，對此元象XVERSE表示：好的團隊基因是大模型獲得良好的效果的重要原因。元象在2021年成立時就有完整的AI技術(shù)與人才布局。目前大模型團隊有多位來自騰訊、百度和IDEA研究院等機構(gòu)的技術(shù)專家，在NLP和搜索領(lǐng)域有深厚技術(shù)積累，對語言數(shù)據(jù)和高質(zhì)量語料理解深入，在快速迭代模型方面經(jīng)驗豐富。

為了避免回答出現(xiàn)幻覺，元象采用了多樣化且準確的數(shù)據(jù)進行訓(xùn)練，讓模型盡可能地多學(xué)習(xí)。從擬人的角度看，其實人有時候也會出現(xiàn)“空耳”以及理解偏差的情況，但元象會努力讓模型避免此類問題。從2022年開始，公司就針對“基于動態(tài)知識引入的事實一致性對話生成”這一關(guān)鍵核心課題進行深入研究，希望在結(jié)合上下文與背景信息時，減少與事實不符或錯誤背景描述的情況，讓AI實現(xiàn)從寫作“自然流暢”到“用事實說話”的技術(shù)跨越。深度結(jié)合自身業(yè)務(wù)，以AI驅(qū)動“端云協(xié)同”3D互動技術(shù)

元象作為國內(nèi)領(lǐng)先的AI與元宇宙技術(shù)服務(wù)公司，致力于打造AI驅(qū)動的3D內(nèi)容生產(chǎn)與消費一站式平臺，通過大模型賦能自身業(yè)務(wù)將成為公司未來發(fā)展的重要方向。元象表示：XVERSE-13B是一個通用大模型，能與任何有需要的行業(yè)和業(yè)務(wù)結(jié)合，企業(yè)認為它在醫(yī)療、教育、文旅、金融和娛樂等行業(yè)將具有更大的發(fā)展前景。

除此之外，大模型也可能會對高智能數(shù)字人、未來人機交互帶來顛覆性影響，這些是元宇宙內(nèi)容的重要組成部分，XVERSE-13B也將提供強大技術(shù)后盾。

基于強大的語言理解和生成能力，以及結(jié)合元象原有的3D圖形能力、語音技術(shù)能力，XVERSE-13B可以為高智能數(shù)字人提供更加豐富和多樣化的內(nèi)容來源和表現(xiàn)形式，使得高智能數(shù)字人更加逼真和智能。同時，由于大模型可以支持多種語言和任務(wù)，并且可以根據(jù)用戶輸入或反饋進行自適應(yīng)調(diào)整，它們可以為未來人機交互提供更加靈活和個性化的交互方式，使得未來人機交互更加自然和流暢。

元象XVERSE創(chuàng)始人姚星表示：“真實世界的感知智能（3D），與真實世界的認知智能（AI），是探索通用人工智能（AGI）的必由之路，也是元象持續(xù)探索3D與AI前沿技術(shù)的動力。”作為“端云協(xié)同”3D互動技術(shù)的引領(lǐng)者，元象通過自研引擎和前沿AI算法驅(qū)動，為用戶打造全新元宇宙體驗，助?各?業(yè)3D化，實現(xiàn)自由「定義你的世界」愿景。

在《人工智能大模型產(chǎn)業(yè)創(chuàng)新價值研究報告》中指出：大模型產(chǎn)業(yè)價值的關(guān)鍵，在于降低人工智能的使用門檻，將其特征與能力與各種場景結(jié)合，以實現(xiàn)場景效率的提升。開源大模型可以通過大規(guī)模的數(shù)據(jù)和參數(shù)，學(xué)習(xí)到更多的語言和知識，從而提高人工智能的通用性和泛化能力。同時，通過預(yù)訓(xùn)練和微調(diào)的機制，簡化人工智能的開發(fā)流程，降低人工智能的技術(shù)門檻和成本。

正如元象XVERSE所述，XVERSE-13B已基本實現(xiàn)國產(chǎn)可替代，公司也期待為國產(chǎn)大模型發(fā)展貢獻一份力量。開源大模型本意還是讓更多的開發(fā)者、用戶可以直接部署和使用，推動生態(tài)和產(chǎn)業(yè)的發(fā)展為主。同時企業(yè)也支持在許可范圍內(nèi)，開發(fā)者對XVERSE-13B 修改得到模型衍生品，對于模型衍生品中付出創(chuàng)造性勞動的部分，開發(fā)者可以主張該部分的知識產(chǎn)權(quán)。

大模型之家認為開源大模型為社會的可持續(xù)發(fā)展提供了豐富的資源和可能性，作為人類共同智慧的橋梁，開源大模型將為社會創(chuàng)造更加智能、包容和進步的未來，引領(lǐng)我們邁向一個全球化、數(shù)字化的智慧文明時代。

「大模型之家」獨家對話元象XVERSE：開源通用XVERSE-13B已基本實現(xiàn)國產(chǎn)可替代