速途網(wǎng)4月9日訊(報道:喬志斌)今日,亞馬遜宣布推出全新語音到語音模型——Amazon Nova Sonic。這款基礎(chǔ)模型將語音理解和生成功能統(tǒng)一于單一的模型中,使AI應(yīng)用程序中的語音對話更貼近人類的真實(shí)交流。通過簡化語音應(yīng)用開發(fā)流程,并提供深入理解人類對話微妙性的能力,Nova Sonic在客戶服務(wù)通話自動化、旅游、教育、醫(yī)療和娛樂等領(lǐng)域展現(xiàn)出卓越的應(yīng)用潛力。
在過去十余年間,亞馬遜始終引領(lǐng)著語音技術(shù)的發(fā)展,從打造全球領(lǐng)先的個人AI助手Alexa到開發(fā)各類云服務(wù)如Lex、Polly和Connect等。然而,要讓語音AI為客戶創(chuàng)造更多實(shí)際價值,它必須能夠理解人類對話的微妙與復(fù)雜性。傳統(tǒng)語音應(yīng)用開發(fā)需協(xié)調(diào)多個模型,包括語音轉(zhuǎn)文字識別、語言理解和生成回復(fù)以及文本轉(zhuǎn)語音,這種分散的方法難以保留自然對話中的聲學(xué)情境和細(xì)微差別。
Amazon Nova Sonic采用全新方法應(yīng)對這些挑戰(zhàn)。該模型摒棄了使用多個不同模型的方式,而是將理解與生成功能統(tǒng)一于單一模型中。這使得Nova Sonic能夠根據(jù)語氣、風(fēng)格等聲學(xué)情境調(diào)整生成的語音響應(yīng),并理解人類對話中的自然停頓與猶豫。此外,它還能實(shí)時調(diào)取相關(guān)信息,提供更自然且實(shí)用的交互體驗(yàn)。
基于Amazon Nova Sonic構(gòu)建的應(yīng)用示例展示了其強(qiáng)大的功能,如在旅游AI代理中通過客戶語氣的變化來調(diào)整語調(diào)并實(shí)時查詢價格信息,以及企業(yè)客戶從基于公司數(shù)據(jù)生成響應(yīng)的能力中受益。這些功能加上其超快的推理能力,使Nova Sonic支持的語音應(yīng)用更加自然和實(shí)用。
亞馬遜表示,推出Amazon Nova Sonic彰顯了公司在先進(jìn)基礎(chǔ)模型領(lǐng)域的持續(xù)創(chuàng)新,并致力于為每一位客戶提供實(shí)際價值。