
5月的第一個(gè)大模型來了,你看好訊飛星火嗎?
2022年11月OpenAI發(fā)布ChatGPT,隨即2023年1月BuzzFeed宣布與OpenAI合作來協(xié)助公司創(chuàng)意生成引爆二級(jí)市場(chǎng),國內(nèi)外以谷歌、微軟、百度、阿里巴巴、字節(jié)跳動(dòng)、騰訊、華為、科大訊飛在內(nèi)的互聯(lián)網(wǎng)企業(yè)紛紛宣布有GPT相關(guān)技術(shù)儲(chǔ)備。
4月20日,科大訊飛宣布訊飛星火大模型在5月6日發(fā)布;緊接著,在4月24日,科大訊飛毫無征兆地對(duì)外開啟了公測(cè),用戶填寫問卷調(diào)查后就能獲取測(cè)試資格。
不少網(wǎng)友稱“科大訊飛實(shí)現(xiàn)反向跳票”,在正式發(fā)布之前開啟公測(cè),也看得出科大訊飛對(duì)訊飛星火認(rèn)知大模型的自信。
在訊飛星火認(rèn)知大模型的發(fā)布會(huì)現(xiàn)場(chǎng),科大訊飛董事長(zhǎng)劉慶峰直言,“認(rèn)知大模型剛剛起步,還在快速成長(zhǎng)和迭代過程中,如果只是找一些單點(diǎn)例子來證明哪個(gè)系統(tǒng)強(qiáng)和弱,是沒有意義的。”
但這款大模型的表現(xiàn)到底如何?速途網(wǎng)根據(jù)科大訊飛的科學(xué)評(píng)測(cè)體系來體驗(yàn)一把。
拿小問題細(xì)數(shù)“星火”的各項(xiàng)功能
發(fā)布會(huì)上,科大訊飛董事長(zhǎng)劉慶峰介紹了當(dāng)前通用人工智能的七大維度能力,包括了文本生成、邏輯推理、語言理解、數(shù)學(xué)能力、代碼能力、知識(shí)問答、多模態(tài)能力。同時(shí),展示了星火認(rèn)知大模型在寫發(fā)言稿、郵件、營銷方案、英文寫作等不同方式的效果呈現(xiàn),甚至還能以小紅書文本方式生成等。
值得注意的是,在手機(jī)或PC瀏覽器中打開訊飛星火,都能夠?qū)崿F(xiàn)語音輸入問題,就目前市面上的類ChatGPT產(chǎn)品而言,僅科大訊飛實(shí)現(xiàn)了語音輸入和輸出,這點(diǎn)值得稱贊。當(dāng)然,這主要得益于科大訊飛多年在智能語音方面的研究,與訊飛聽見、訊飛有聲等產(chǎn)品內(nèi)容的基礎(chǔ)相關(guān)。
據(jù)速途網(wǎng)深度體驗(yàn)顯示,目前版本的訊飛星火大模型為單模態(tài)人工智能大模型,支持文字信息。但速途網(wǎng)在5月5日選擇官方推薦的對(duì)話“用emoji表情為我介紹電影《泰坦尼克號(hào)》”,星火的回答中出現(xiàn)錯(cuò)碼/亂碼的情況。


不過,在今日訊飛星火認(rèn)知大模型發(fā)布會(huì)期間,速途網(wǎng)再次測(cè)試該問題后發(fā)現(xiàn),訊飛星火出現(xiàn)了emoji表情,與此前回復(fù)有所差別,不再出現(xiàn)亂碼,這說明訊飛星火已經(jīng)迭代。

緊接著,速途網(wǎng)又以“今年母親節(jié)是哪天?”“今年母親節(jié)是幾月幾日?”進(jìn)行提問。

對(duì)于問題中的“今年、哪天”,星火只能反饋到今年是2023年,當(dāng)提示詞更加精準(zhǔn)到“幾月幾日”時(shí),回答也定位到了2023年5月14日。
對(duì)于漢語口語化的詞“哪天”,訊飛星火的理解能力表現(xiàn)中規(guī)中矩。
此外,速途網(wǎng)通過語音識(shí)別輸入提問問題“請(qǐng)幫我籌劃一下,今年母親節(jié)我該送給媽媽什么禮物?”訊飛星火的回答與文心一言、ChatGPT等目前已發(fā)布的大模型并未有什么差距。



當(dāng)速途網(wǎng)提問“我在北京,她在山西,我該如何在母親節(jié)體驗(yàn)孝心?”
訊飛星火則回復(fù)“即使身在不同的城市,也可以通過以下方式在母親節(jié)體驗(yàn)孝心”,這其中值得注意的是第3個(gè)方案中,“為她做飯”,顯然不在同一個(gè)城市無法為媽媽親手做一頓豐盛的飯菜,AI的邏輯性還有待提升。

在訊飛星火發(fā)布會(huì)期間,科大訊飛董事長(zhǎng)劉慶峰的測(cè)試中,訊飛星火能夠理解“高興、自豪”等情感詞,其理解能力在發(fā)布會(huì)表現(xiàn)比較良好,由此看來,星火大模型在發(fā)布會(huì)期間迭代為最新的版本,但在發(fā)布會(huì)的現(xiàn)場(chǎng)演示中,多語種、邏輯推理和數(shù)學(xué)能力的演示過程中表現(xiàn)出了不足。
在科大訊飛現(xiàn)場(chǎng)的演示中,訊飛星火能夠合成虛擬人視頻進(jìn)行文本朗讀也引發(fā)了網(wǎng)友的關(guān)注,在現(xiàn)場(chǎng)演示中,不到30秒的時(shí)間就可以直接生成一段女生形象的虛擬人朗讀上述生成的文本。

但速途網(wǎng)在目前的測(cè)試版本中對(duì)訊飛星火進(jìn)行提問,將星火大模型生成的五一旅游計(jì)劃進(jìn)行虛擬人朗讀操作后發(fā)現(xiàn)目前的版本中還未支持合成虛擬人視頻,對(duì)此,也有不少網(wǎng)友猜測(cè),生成虛擬人視頻功能或許將在未來成為收費(fèi)項(xiàng)目。


對(duì)此,速途網(wǎng)也聯(lián)系到科大訊飛工作人員,她表示,目前的版本中不支持生成虛擬人視頻,還未開放全功能版本,將在后續(xù)開放全功能版本。
在速途網(wǎng)的測(cè)試中也注意到,訊飛星火大模型目前在理解能力、邏輯能力以及數(shù)學(xué)能力中展示的并不完美,甚至在發(fā)布會(huì)現(xiàn)場(chǎng)演示也出現(xiàn)了外語回答中夾雜中文字樣的回復(fù),但整體來看,科大訊飛能在5個(gè)月的時(shí)間內(nèi)交付出訊飛星火也證明了其多年的技術(shù)積累,也希望在今后快速的迭代中,訊飛星火能夠達(dá)到客戶滿意的程度。
“AI+”的時(shí)代來臨 科大訊飛等中國企業(yè)勇敢對(duì)標(biāo)ChatGPT

此外,科大訊飛董事長(zhǎng)劉慶峰也在發(fā)布會(huì)現(xiàn)場(chǎng)提出了“純大模型技術(shù)的攻克缺陷”,針對(duì)“新知識(shí)難以及時(shí)更新”、“事實(shí)類問答容易張冠李戴”、“史實(shí)、傳統(tǒng)典籍等容易編造情節(jié)”,科大訊飛針對(duì)目前存在的問題也提出了解決方案,更是宣布在今年的三個(gè)階段的升級(jí)計(jì)劃:
第一階段,在6月9日,突破開放性問答,如實(shí)時(shí)問答;多輪對(duì)話能力再次升級(jí);數(shù)學(xué)能力再上臺(tái)階;
第二階段,在8月15日,突破代碼能力;多模態(tài)交互能力正式開放給客戶;
第三階段:10月24日,在通用大模型領(lǐng)域?qū)?biāo)ChatGPT,中文超越,英文相當(dāng)。
當(dāng)然這一計(jì)劃公布,不禁也讓網(wǎng)友為科大訊飛捏了一把汗,到底是劉慶峰的口嗨還是中國高新技術(shù)企業(yè)的自信?
如果說訊飛星火認(rèn)知大模型的發(fā)布是科大訊飛在“秀肌肉”,那將其大模型運(yùn)用并實(shí)踐在了產(chǎn)品中,也是大模型的具體落地形式,讓大模型有了“用武之地”,也在真正意義上實(shí)現(xiàn)了“AI+”的趨勢(shì)來臨。
對(duì)于星火認(rèn)知大模型未來的行業(yè)應(yīng)用,劉慶峰表示,將主要應(yīng)用在教育、辦公、汽車、數(shù)字員工四大方面。
速途網(wǎng)注意到,在科大訊飛發(fā)布會(huì)進(jìn)行到第二部分,劉慶峰演示科大訊飛學(xué)習(xí)機(jī)、翻譯筆、辦公本等硬件產(chǎn)品和訊飛輸入法、訊飛聽見 APP、虛擬人等軟件產(chǎn)品的AI能力,展示了全線接入訊飛星火后,能夠進(jìn)行作文的評(píng)閱修改、英文語法、單詞修改、文章潤色等功能,以及科大訊飛語音識(shí)別翻譯等技術(shù),給不少用戶帶來了新功能的驚喜。
以訊飛星火為代表的認(rèn)知大模型技術(shù),注定會(huì)在人工智能領(lǐng)域、各行各業(yè)掀起新的變革。事實(shí)上,AI大模型此刻的光鮮亮麗,是眾多科技企業(yè)多年的技術(shù)沉淀與積累。
短短幾個(gè)月,國內(nèi)就超過10來家企業(yè)推出了大模型產(chǎn)品,讓人感覺到中國企業(yè)科技研發(fā)能力的強(qiáng)大。在充滿不確定性的內(nèi)外環(huán)境下,中國企業(yè)能夠深耕認(rèn)知AI,可以預(yù)見的是,在新一輪行業(yè)變革中,以百度、科大訊飛、昆侖萬維、出門問問等為代表的中國企業(yè)已經(jīng)站在了前沿。速途網(wǎng)期待更多中國企業(yè)的研究成果出現(xiàn),還將持續(xù)關(guān)注國內(nèi)最新的人工智能成果。