速途網8月30日消息(報道/路途)在第七屆國際自然語言處理與中文計算會議(以下簡稱NLPCC)中,第一次新增了“中文語法錯誤修正”共享任務比賽。最終網易有道AI團隊貢獻出最佳糾錯成果,于眾多參賽高手中脫穎而出,力壓包括阿里巴巴團隊、北京大學團隊在內的5組全球學術界和業界知名研究團隊,斬獲冠軍。

業界參賽團隊

網易有道的召回率和綜合評價指標均為第一
隨著中國影響力的日益擴大,漢語學習熱潮席卷全球,越來越多機構對于中文作為第二語言的(Chinese as Second Language,簡稱CSL)研究開始推進。NLPCC首次在比賽中加入中文語法錯誤識別及糾正的項目,也是希望行業與時俱進,與社會熱點結合,提高CSL領域的研究熱情。
本次比賽中,主辦方提供的測試集是北京外國語大學的外籍學生撰寫的中文作文;訓練集則采集自外國人學習中文的網站,包括非母語人士撰寫的中文文本和母語者的注釋和修正。
比賽伊始,需要由參賽者開發能自動檢測、糾正CSL編寫者錯誤的人工智能算法模型,利用訓練集提高算法模型對相關問題的熟悉程度和修正能力后,輸入測試集進行正式研發成果檢驗。主辦方就修正后結果的準確度、召回率和綜合評價指標這三重評判標準進行打分。
最終,網易有道AI團隊以召回率第一、綜合評價指標第一的絕對優勢,首戰告捷。
對于外國人而言,漢語的主要難點在于它的孤立語特征。英語通過時態和詞綴表達語法和詞性,漢語則是依靠獨立的虛詞和固定詞序表達語法意義,通過一個個字詞的排列組合構造句義語境,對解讀的要求很高。
以大賽考題為例,原句是“她已經畢業了大學,專業是視覺設計”,經過有道AI團隊人工智能修正后的結果是“她已經大學畢業,專業是視覺設計”。
看似簡單的一步,實際是有道AI團隊的人工智能先對訓練集的人類專家給出的注釋和修正進行學習,再對比賽原句進行錯誤識別、衡量及修正,從分詞斷句、句子通順程度、邏輯連貫性等多個維度綜合考量。
有道AI團隊表示,算法的高精準度主要源自“多步推斷”的設計。第一層面的多步推斷是指,將表層錯誤和深層次語法錯誤分離、分層次解決。例如:
原句:晚上還要做作業或者跟朋友們一起完兒睡晚覺。
修正句:晚上還要做作業或者跟朋友們一起玩兒很晚。
模型會先將“完”和“玩”這類錯別字、標點符號等表層錯誤識別糾正,再在理解句義的基礎上,調整深層語法錯誤。
第二層面的多步推斷是指,在修正過程中更為本真地還原人類的認知行為——推敲。為了更精準周到的表達,人類習慣先在腦海中反復推敲一句話的措辭、情緒等,幾番嘗試后才會將最滿意的搭配說出口。在推敲的過程中,有些字被修改了,有些詞匯搭配也被修改了,對于AI而言,這是兩種不同粒度的修正。因此,有道人工智能團隊設計了字級別和子詞級別兩種神經網絡模型,并將兩種模型進行不同搭配組合,對例句做逐層推敲,得到5種修訂結果,再使用一個表征句子流利度的語言模型來對修訂結果進行篩選,從而獲得最終結果。

AI“推敲”的模型流程圖
目前,網易有道已將成熟的英文糾錯研發成果應用于有道精品課等教育類產品中,協助進行英文作文批改。對于尚未完全成熟的中文語法錯誤修正技術,網易有道首席科學家段亦濤表示,當人工智能可以理解復雜度高的語法錯誤,積累足量中文語料庫后,才會作為產品功能落地。網易有道的產品矩陣中不乏針對CSL學習者的課程及產品,未來應用場景廣闊,除了設計成面向中文學習者的自動在線糾錯學習工具,也可以與中小學校合作,為教師提供輔助批改。