
“這張海報就是由大模型生成的?!毙炝⒄f,“除了聚焦本身發布的參數之外,我們今年更多的關注了行業的場景落地,并以行業來驅動人工智能的爆發”。
4月23日,商湯技術交流日在上海臨港正式開幕,延續著上一次的開場方式,商湯科技董事長兼CEO徐立,依然在正式介紹前展示出了一張幻燈片:海報呈漆面工藝風格,主要景物以山、樹木等靜態物質為主。據悉,此次商湯科技推出的是全新版本的「日日新5.0」。

商湯科技董事長徐立強調:目前,日日新5.0大模型體系綜合能力全面對標GPT-4,技術領跑加速生成式AI向產業落地的全面躍遷,實現大模型按需所取。
高達200K的推理上下文窗口,日日新5.0全面對標GPT-4Turbo
2023年,AI浪潮來襲,商湯科技的大模型體系也在“大模型 + 大裝置”的戰略規劃下,持續高效的進行著優化與升級。
自去年4月商湯「日日新 SenseNova」大模型體系正式問世以來,其已正式推出五個大版本迭代。而今,商湯新一代「日日新 SenseNova 5.0」時隔一年正式問世,對已有的多個大模型進行全方位升級外,還創造了一些「嶄新的面孔」。

據悉,基于超過10TBtokens訓練、覆蓋大量合成數據,升級后的“日日新SenseNova 5.0”采用混合專家架構,推理時上下文窗口可以有效到 200K 左右。同時,日日新5.0在自然語言能力(大量中文預料的構建)、綜合推理(包括數字推理)、代碼生成、多模態交互等整體表現上「更上一層樓」,全面對標GPT-4 Turbo ,并且常用的客觀評測上達到或超GPT-4 Turbo系列模型。
首先,發布會上,商湯科技以“高考中紅樓夢的相關撰文需求”展示了日日新5.0的答題能力。測試結果發現,日日新5.0不僅解題速度十分優秀,還摒棄了大模型最常應用的傳統撰文套路,以發散的撰文思維及時下最熱互聯網“熱點”完成了此次創作。
數學題目測試中,商湯科技選擇了以“13個小朋友玩老鷹捉小雞,捉住了5只小雞外,還剩幾只小雞”為題干,讓ChatGPT4.0及日日新5.0分別進行回答。測試結果顯示,這兩款大模型在答數學題的能力上差異顯著。
可見,在數學能力方面,日日新5.0大模型面對邏輯謎題能夠跳出坑位,給出解決方案?;诖?,商湯科技董事長兼CEO徐立強調:“在很多情況下,如果說模行要有行業上的差異化,把行業化的數據,以及行業化數據背后的理解疊加,一定是形成一個差異化的競爭能力”。
其次,多模態方面,商湯科技以“一頭老象在茂密的森林中”為命題測試了日日新5.0生圖能力,并與行業內領先的一眾“對手”進行對比,測試結果顯示,這幾款大模型在生圖的能力上風格不同,各有千秋。

而在以“人”為主的生圖測試中,相較于之前,日日新5.0多模態的迭代能力有著十分明顯的提升,在人物細節構造上(即凌亂的頭發、復雜的皮膚紋理)都十分出色。反觀其他“幾個友商”都在皮膚及發型上有不同程度的模糊化加工。
在本質上將“合成與理解”放在一起的技術處理上,商湯科技以“未來派建筑,樓頂有一個白色陶瓷LOGO——Sensenova”為命題進行了測試。
從各家大模型的回復中,我們注意到,除日日新5.0外,對于文字嵌入建筑當中均有一定的缺失,包括文字的理解,及LOGO的擺放位置等等。
反觀日日新5.0,除了完全理解“需求”外,甚至對于LOGO細節處的倒影,及水面波浪式的紋理都做出了具象化的處理。
再有,數據推理多模態能力上。商湯科技以長圖嵌入數據分析為例,展示了圖片文字拆分,圖片文字理解,基于長圖思考形成邏輯性回答的能力。

值得注意的是,本次發布會的演示環節,依舊采取的現場直播演示,相較于上一個版本,日日新5.0的確在理解能力、邏輯能力以及數學能力的展示上更加全面及詳細。
大模型之家認為,作為商湯「日日新SenseNova」大模型體系的通用基礎模型,日日新5.0的大幅度升級使得人們在使用模型處理多樣化語言任務時更高效、更準確,讓國產大模型擁有了與 GPT-4 相媲美的使用體驗。
同時,對于整個行業來說,未來基于此模型基礎上開展的學術研究、技術創新、商業應用也有了更多機會。
推出企業級一體機,商湯朋友圈均有新動作
基礎模型升級之外,基于金融、代碼、醫療、政務等重點行業邊緣側日益增長的AI應用需求,商湯科技推出了企業級一體機,主打高性價比、開箱即用、數據安全及國產化芯片全適用。
據悉,一體機為2-42架構(即商湯獨創),可達到2P算力,256G顯存及448GB/s的連接??赏瑫r支持企業級千億模型加速和知識檢索硬件加速,實現本地化部署,即買即用,降低企業應用大模型的門檻。相比行業同類產品,推理成本節約80%,檢索大大加速,CPU工作負載50%。

此外,商湯科技還推出了創新的端云協同解決方案,該方案能夠智能地判斷并協同發揮端側與云端各自的優勢。在需要聯網搜索或處理復雜場景時,該方案能夠智能地將任務分流至云端處理,而在部分場景中,端側處理的占比甚至超過了80%,從而大幅降低了推理成本,提高了整體效率。
值得注意的是,商湯科技日日新·端側大語言模型的推理速度達到了業內最快水平。在中端平臺上,該模型能夠實現平均18.3字/s的生成速度,而在旗艦平臺上更是高達78.3字/s,為用戶提供了極速的語言處理能力。
而商湯科技的擴散模型,同樣在端側展現了業內最快的推理速度。其端側LDM-AI擴圖技術在某主流平臺上的推理速度小于1.5秒,相較于友商的云端應用,速度提升了驚人的10倍。更值得一提的是,該技術支持輸出1200萬像素及以上的高清圖片,并允許用戶在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能,為用戶帶來了極致的便捷和高效體驗。

而在自身應用方面,商湯“日日新SenseNova 5.0”在秒畫、如影、格物、瓊宇、大醫、小浣熊家族等產品均有重要更新。
此外,在發布會中,商湯還邀請了金山辦公、華為、小米、閱文集團等多位生態伙伴嘉賓,共同探討和交流大模型技術在辦公、金融、出行等不同領域的應用及前景。
金山辦公方面,基于“日日新”大模型的卓越代碼生成及工具調用能力,助力WPS365打造更高效釋放場景能力的辦公新質生產力平臺,為企業構建專屬的“企業大腦”。
海通證券方面,其攜手商湯科技共同推出了金融行業專用的多模態全棧式大模型。這一合作不僅助力雙方在智能客服、合規風控、代碼輔助、展業辦公助手等多個領域實現業務的實際應用,還共同深入研究了智能投顧、輿情監控等行業前沿場景,成功打通了證券行業大模型從研發到落地的全棧式能力。
小米則在旗下最新發布的SU7中應用了商湯的大模型技術,并基于商湯端云大模型解決方案,以小米小愛同學為車主提供智能化交互體驗。
華為方面則宣布了與商湯聯合發布面向金融、醫療、政務、代碼等行業的大模型,并強調,雙方將發揮各自在算力、數據、場景等方面優勢,共建大模型生態,加速人工智能走深走實。
AI競技,商湯底氣何在?
值此商湯技術交流日之際,截至今日收盤,商湯科技股價上漲1.67%,報收0.61元/股,可見資本對于日日新大模型5.0的看好。
聯想到實際業績上,據3月26日商湯科技發布的2023年業績報告顯示:2023年公司整體營業收入34億元人民幣,其中生成式AI收入達12億元,占集團總收入比例升至35%,實現近200%增長。這也是商湯成立十年以來,以最快速度實現從無到有,并取得超過10億收入體量的新業務。
對此,商湯集團董事長兼CEO徐立博士曾公開表示,“生成式AI對商湯來說已不僅僅是技術領域的變革性創新,更成為公司的核心業務。商湯生成式AI業務的增長,得益于各行各業對大模型的訓練和推理的廣泛需求,這預示著中國硬科技投資的新周期正式開啟。商湯通過在各業務層面深入融合生成式AI能力,正在贏得新客戶,并推動效率和生產力的全面提升?!睙o疑,全新的 AI 2.0 時代下,商湯正加速轉型變革,以通用人工智能(AGI)目標打造全新面貌的“商湯 2.0”。
眼下,AI賽道的戰火已經燃燒到了行業場景的落地上。而能夠引領大眾欣賞世界的大模型,不僅為用戶帶來了更多的想象力,也為整個行業帶來了更加具象化的商業應用憧憬。
在此背景下,為了在千行百業中用好它們,真正實現「行業場景落地」,一套完整的體系勢必能讓我們事半功倍。而從今日的技術交流日來看,在這一方面,商湯已經做好了準備。