前不久,OpenAI發(fā)布又一款“王炸”產品Sora,展示了從文生視頻、圖生視頻,再到多機位視頻生成的強大能力,再次引爆全球。

事實上,文生視頻賽道并非OpenAI最先開始探索。去年末,Runway及Pika引爆AI視頻生成賽道,并將熱度延續(xù)至今。今年以來,除爆火的Sora之外,海外頭部廠商谷歌、國內AI應用賽道佼佼者AIGC軟件A股上市公司萬興科技(300624.SZ)等也都紛紛發(fā)布最新成果。
其中,谷歌與OpenAI同日推出了最新一代多模態(tài)大模型 Gemini 1.5 Pro,把穩(wěn)定處理上下文的上限擴大至100萬tokens,創(chuàng)下了最長上下文窗口的紀錄。

萬興科技則于1月30日,在長沙馬欄山主辦多媒體大模型創(chuàng)新應用高峰論壇暨發(fā)布簽約儀式,面向全球市場重磅發(fā)布湖南首個通過算法備案、中國首個音視頻多媒體創(chuàng)作垂類大模型——萬興“天幕”。
據(jù)介紹,萬興“天幕”依托基礎大模型及高性能全球網(wǎng)絡平臺、計算集群算力平臺和海量數(shù)據(jù)平臺,由視頻大模型、音頻大模型、圖片大模型和語言大模型組成,具有“專精特快”優(yōu)勢,可專業(yè)提升視頻創(chuàng)作效率、精細化提升垂類質量、特色化補齊創(chuàng)作閉環(huán)、快速賦能應用智能化升級。
當前,萬興“天幕”多媒體大模型已迭代近百項音視頻原子能力,包括文生主題視頻、文生3D視頻、AI歌手、視頻AI配樂、數(shù)字人播報等。經測算,萬興“天幕”原子能力多指標數(shù)據(jù)表現(xiàn)遠超行業(yè)平均水平。其中,“文生主題視頻”支持高質量視頻一鍵生成、“文生3D視頻”支持極高自由度的3D場景生成、“AI歌手”提供超逼真的AI歌手翻唱定制服務、“視頻AI配樂”支持根據(jù)視頻內容AI生成匹配的音樂、“數(shù)字人播報”僅需普通手機即可操作,人像真實度、口型準確度等均優(yōu)勢明顯,且支持全球主流語種。
目前,萬興“天幕”眾多能力已在萬興科技旗下創(chuàng)意軟件產品,尤其是海外產品中規(guī)?;逃?。其中,萬興科技旗下視頻創(chuàng)意產品Wondershare Filmora 13已全新集成大模型能力,全新版本的AI Copilot智能剪輯助手、AI文字快剪、AIGC音樂生成等功能備受海外用戶好評;一站式出海視頻營銷神器萬興播爆已實現(xiàn)大模型中數(shù)字人能力的應用,使AIGC更好地服務于出海視頻創(chuàng)作者,并提供領先的AI視頻翻譯能力。數(shù)據(jù)顯示,在萬興“天幕”的加持下,Wondershare Filmora、萬興播爆等使用AI功能的用戶數(shù)等多倍速增長,賦能效果顯著。

視頻生成技術的不斷創(chuàng)新和進步,為用戶提供了更多創(chuàng)作的可能性,同時也為企業(yè)提供了更多的商業(yè)機會。隨著視頻內容的需求不斷增加,視頻生成賽道也將持續(xù)火熱。
當然,挑戰(zhàn)一直存在,其中視頻生成的質量和真實感是關鍵問題。盡管人工智能技術能夠生成逼真的視頻,但仍然存在一些細節(jié)和效果上的不足。其次,視頻生成技術的算法和模型需要不斷優(yōu)化和改進,以提高生成效率和質量。此外,隨著視頻生成技術的普及,版權和隱私保護等問題也需要得到更好的解決。
隨著人工智能技術的不斷進步和應用,視頻生成技術將在未來繼續(xù)發(fā)展,為用戶帶來更加豐富多樣的視覺體驗。我們可以期待在未來會有更多的廠商推出全新的視頻生成產品,為用戶帶來更加豐富多樣的視覺體驗。