深圳商報2018年12月25日訊 記者昨日從阿里云獲悉,在此前結束的MS MARCO文本閱讀理解挑戰賽中,阿里AI創(chuàng )造了閱讀理解能力測試的新紀錄。目前,阿里AI可以在毫秒內,讀完4300萬(wàn)字的《大英百科全書(shū)》,并且可以完成初中語(yǔ)文閱讀理解試題。
MS MARCO挑戰賽是AI閱讀理解領(lǐng)域的權威比賽,它包含100多萬(wàn)個(gè)問(wèn)題和300多萬(wàn)篇文檔,相當于參賽機構提供的AI模型,需要閱讀完維基百科中的所有文章。測試結果顯示,阿里AI模型在英文閱讀理解比賽中,得分超過(guò)了微軟等研究機構,排名第一,接近人類(lèi)理解水平。
傳統AI閱讀需要某一領(lǐng)域的專(zhuān)業(yè)人士準備好問(wèn)答數據,AI回答也僅限于該領(lǐng)域,例如金融領(lǐng)域的人工智能無(wú)法回答物流領(lǐng)域的問(wèn)題,但阿里AI正在往人類(lèi)思維模式接近。阿里巴巴的突破在于提出“深度級聯(lián)機器閱讀模型”,它可以模仿人類(lèi)閱讀理解的過(guò)程,先對文檔進(jìn)行快速瀏覽,并定位到可能回答問(wèn)題的段落,然后針對相應段落進(jìn)行精讀,并根據“自己的理解”回答問(wèn)題。
阿里AI可以像人類(lèi)一樣在閱讀并理解后,快速應對天馬行空的問(wèn)題。比如,4300萬(wàn)字的《大英百科全書(shū)》,阿里AI可以在毫秒內閱讀完,并根據自己的理解快速回答涉及書(shū)中不同領(lǐng)域的不同問(wèn)題。例如亞洲有多少個(gè)國家?美國第五任總統是誰(shuí)?恐龍是什么時(shí)候消失的?機器人可以分別迅速給出答案。
據了解,目前阿里巴巴的人工智能,已經(jīng)可以閱讀并較好理解小說(shuō)、詩(shī)歌、法律條文以及學(xué)術(shù)文獻這類(lèi)相對復雜的內容,并且可以完成初中語(yǔ)文閱讀理解試題。此外,阿里AI閱讀理解技術(shù)也已經(jīng)率先大規模應用于淘寶、天貓以及東南亞第一電商Lazada,提供了包含中文、英語(yǔ)以及印尼語(yǔ)等多種語(yǔ)言的智能客服服務(wù)。阿里客服機器人“阿里小蜜”,在今年雙11全天承擔全平臺98%客服咨詢(xún)量,相當于10萬(wàn)人工客服一天的工作量。
“阿里AI在閱讀理解上擁有天然的場(chǎng)景優(yōu)勢,海量商業(yè)在線(xiàn)咨詢(xún)?yōu)闄C器提供了豐富學(xué)習文檔,這是機器變得更加智能的前提?!卑⒗锇桶瓦_摩院自然語(yǔ)言首席科學(xué)家司羅表示,“隨著(zhù)閱讀理解能力進(jìn)一步提高,人工智能未來(lái)將成為人們的私人老師和私人助理,幫人們閱盡天下知識并提供決策參考?!保愭?/p>