早在2016年12月,微軟官方釋出了一個包含10萬個問題和答案的資料集MS MARCO,研究者可以使用這個資料集來創造像人類一樣閱讀和回答問題的系統。目前已有眾多來自DFKI(德國人工智慧研究中心)、卡耐基梅隆大學、華盛頓大學、新加坡管理大學等世界各國頂尖AI機構和高校的研究人員及學者參與,不斷掃清排名榜單。
微軟 Bing 搜尋引擎部門專案經理合夥人 Rangan Majumder 說:“為了實現人工通用智慧的標的,我們首先需要機器能夠像人類一樣閱讀和理解檔案。這個資料集是向這個方向邁出的一步。然而在許多案例中,搜尋引擎和虛擬助手只會將使用者引導至一些搜尋結果,回答覆雜問題的系統仍然處在嬰兒階段,就目前而言,機器理解人類所說的、看見的或寫出的內容——即“人工通用智慧”還遠遠沒有實現”。
NLP-人工智慧桂冠上的明珠
“以機器閱讀理解任務來說,機器應該很快會從指標上超過人類的現有水平,但真正的閱讀理解過程需要深層的推理和歸納,這恰恰是目前機器所欠缺的,還需要透過底層演演算法的突破才有可能實現機器在 NLP 領域的真正突破。”
不久前,百度自然語言處理團隊提交的 V-Net 模型以 46.15 的 Rouge-L 拿下了微軟 MS MARCO(Microsoft MAchine Reading Comprehension)機器閱讀理解測試首名。
百度在自然語言處理領域已經過十餘年積累與沉澱,具備了最前沿、全面、領先的技術佈局,不僅專註於前瞻技術探索,更致力透過技術應用解決實際問題。目前,百度的閱讀理解、深度問答等技術已在搜尋等產品中實際應用,它可透過深入分析理解使用者問題,定位答案併進行總結、提煉、歸納後,將其直接提供給使用者,大大地提升了搜尋效率。這樣的技術和服務,每天響應著數億次的使用者請求。百度之所以選擇 MARCO 資料平臺研究模型,是希望透過更好的技術來解決前沿真實問題,並與來自全世界的頂級團隊進行競賽和對比。
經過近年深度學習的發展,NLP 開始落地不同行業,逐漸滲入進家居、車載、金融、醫療、教育等眾多領域,未來發展前景不可限量。面對當下 NLP 發展現狀,業內人士也從資料、底層演演算法、知識圖譜、應用等維度給出進一步發展的路徑。作為人工智慧桂冠上的明珠,NLP 技術的重要性和挑戰性不言而喻。機器閱讀理解能否向影象識別一樣,引領人工智慧的下一場革命?
PaddlePaddle系列之智慧問答挑戰賽
在去年 11 月百度世界大會 AI 技術與平臺論壇上,百度 3D 視覺首席科學家楊睿剛宣佈推出了百度 AI 公開資料集計劃——BROAD(Baidu Research Open-Access Dataset),並確認首批室外場景理解、影片精彩片段、閱讀理解 3 個資料集即日起對公眾公開。
在大量而真實的資料基礎上,百度的深度學習框架 PaddlePaddle 部門聯合科賽上線了一系列基於前沿真實問題的賽題,最先釋出和完成的是聚焦於綜藝領域的智慧影片剪輯 AI 大賽。
上月,該賽事已順利收官。比賽採用了科賽自有的線上資料分析工具K-Lab,在K-Lab中可直接呼叫PaddlePaddle深度學習框架,併線上掛載BROAD資料集。賽事將K-Lab搭載在百度雲CPU/GPU上,選手可直接提交模型結果到評測系統,即得模型分數。至賽事結束之時,共281支隊伍合計496人報名,總提交數高達909次。
這次上線的 NLP 智慧問答賽事則是要挑戰人工智慧領域裡最具挑戰的議題——閱讀理解。目前世界上已有不少關於 NLP 的經典賽題,如斯坦福大學發起的 SQuAD 挑戰賽、上文提到的 MS Marco 挑戰賽、Google DeepMind 閱讀理解公開資料測試集、Facebook 閱讀理解公開資料測試集。這些多為英文資料集,且部分基於詞義識別(span of words)或文字標簽分類。而透過機器學習實現真正閱讀理解,難度遠高於詞義精準識別和搜尋結果呼叫,一方面需要透過演演算法對語意進行全方面的分析理解,另一方面也需要引入優質的資料集配合訓練。
BROAD中包含著迄今為止規模最大的中文公開領域閱讀理解資料集,DuReader。該資料集基於真實應用需求,所有問題均來源於百度搜索使用者的真實問題,檔案來自全網真實取樣的網頁檔案和百度知道UGC檔案,答案基於問題與檔案由人工撰寫生成。資料集標註了問題型別、物體和觀點等豐富資訊,彌補了現有主流資料集對於觀點類問題改寫不足的問題。首批釋出的閱讀理解資料集包含20萬個問題、100萬份檔案及42萬個人工撰寫的優質答案,並提供開源基線系統。DuReader將為閱讀理解技術研究提供有力支撐,希望加速相關技術和應用的發展。
本次 PaddlePaddle AI 系列賽事-智慧問答賽事依然會為參賽選手提供百度雲 CPU 與 GPU 計算資源,選手需要根據資料建立基於文字與問題,輸出正確答案的模型,考驗模型的歸納總結與改述能力。透過提供對人工智慧回答實際問題的模型訓練,將來可能無需手動篩選答案,即可以為使用者提供相應解決方案的應用,能夠節省大量時間。
賽事基於百度深度學習平臺 PaddlePaddle 進行。PaddlePaddle 是大規模並行分散式深度學習框架,是目前全球開發熱度(用 Github pull request 數量衡量)增速最高的開源深度學習平臺。現已集成了 CNN、RNN 等多種神經網路及深度學習演演算法,同時支援 CPU、GPU、FPGA 等多款硬體,並與 Kubernetes 合作了 PaddlePaddle EDL 彈性深度學習,成為全球首個支援彈性作業排程的開源 AI 雲解決方案。
線上資料工作平臺 K-Lab 為本次賽事提供全程支援,並封裝了包含 PaddlePaddle 等近百個 AI 開發常用工具,可直接呼叫來自百度雲的算力。選手可在 K-lab 中直接載入 BROAD 資料集、模型訓練、呼叫 PaddlePaddle,享受統一便捷的計算環境。複賽階段選手還可在 K-Lab 中呼叫來自百度雲的免費 GPU 算力,無需任何安裝或申請,開啟 K-Lab 即可開始深度學習,極大地提高學習與工作效率。
本次賽事按照初賽-複賽-決賽三輪進行,初賽分數排行榜上前 30 名入圍複賽,複賽排行榜上前 10 名入圍決賽,最終決賽評委審核 notebook 決出前 6 名獲勝隊伍。
目前賽事正在火熱進行之中,技能高超的你,不要錯過 battle機會,點選閱讀原文報名,一起來探索 NLP-人工通用智慧吧!
關於PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點選「交流群」,小助手將把你帶入 PaperWeekly 的交流群裡。
▽ 點選 | 閱讀原文 | 報名參賽