自然語言處理(NLP)領(lǐng)域頂級會議ACL 2020近日公布論文評審結(jié)果,阿里巴巴22篇論文入選,并有多篇論文成為高分優(yōu)質(zhì)論文,無論數(shù)量還是質(zhì)量均遙遙領(lǐng)先,顯示阿里在前沿AI研究領(lǐng)域的強大實力。
ACL是全球自然語言處理領(lǐng)域最具影響力的學術(shù)機構(gòu),其組織的年度會議被公認為NLP領(lǐng)域創(chuàng)新的風向標,包括Google、微軟等在內(nèi)的科技企業(yè)每年都會在ACL大會上公布多項研究成果,入選論文已經(jīng)成為業(yè)界衡量企業(yè)自然語言處理技術(shù)實力的重要指標。
阿里22篇論文來自達摩院語言技術(shù)實驗室,螞蟻金服技術(shù)部門,阿里云小蜜算法等團隊,其中僅達摩院語言技術(shù)實驗室就有18篇入選。論文覆蓋跨領(lǐng)域分詞、細顆粒度情感分析、多領(lǐng)域?qū)υ捪到y(tǒng)、文本生成、知識蒸餾等諸多NLP領(lǐng)域的熱點和前沿研究方向,提出了包括基于對抗學習的降噪技術(shù)、多領(lǐng)域?qū)υ捫袨榕c文本同步生成、關(guān)系型圖注意力網(wǎng)絡(luò)、利用結(jié)構(gòu)化信息進行知識蒸餾的方法等創(chuàng)新技術(shù)和理念,在觀點識別、多語言NLP和機器翻譯等場景中具有很大的應(yīng)用價值。

阿里不僅入選論文數(shù)量國內(nèi)遙遙領(lǐng)先,論文質(zhì)量也得到評委一致認可。在入選論文之中,有論文提出了創(chuàng)新的框架,結(jié)合新詞發(fā)現(xiàn)和共有詞學習技術(shù),利用機器去自動化地標注新領(lǐng)域的詞,從而實現(xiàn)跨領(lǐng)域的分詞學習;另有論文提出多種創(chuàng)新性的方法,大幅提升單個算法模型對30多種語言進行智能序列標注的效果。這些優(yōu)秀論文得到評委一致高分認同。
在自然語言處理領(lǐng)域,阿里積淀深厚。早在2018年初,阿里AI在機器閱讀理解頂級賽事SQuAD中打破世界紀錄,首次超越人類成績。今年3月,在全球自然語言處理領(lǐng)域頂級評測GLUE Benchmark中,阿里巴巴達摩院以平均分90.3分的成績再次創(chuàng)下自然語言理解技術(shù)新的世界紀錄。

以達摩院語言技術(shù)實驗室為代表的阿里自然語言處理技術(shù)已在電商、云計算、金融科技、協(xié)同辦公、智能客服等商業(yè)生活場景得到廣泛使用。達摩院語言技術(shù)實驗室負責人司羅表示,近年來自然語言智能處理技術(shù)在多模態(tài)融合、融合大規(guī)模預訓練模型的語言理解等方向取得了突飛猛進的發(fā)展,未來阿里會繼續(xù)加強在這個領(lǐng)域的研發(fā)。