機器翻譯是自然語言處理的經典任務之一,涉及到自然語言處理的兩個基本問題:語言理解和語言生成。這兩個問題的建模直接對應譯文的兩個評價指標:忠實度(是否表達原文的完整意思)和流利度(譯文是否流暢)。
近幾年來,神經網路機器翻譯取得了巨大進展,成為了主流模型。神經網路由於能緩解資料稀疏性及捕獲詞語之間的關聯,生成的譯文流利度高,這是過去二十餘年上一代統計機器翻譯一直以來的難點。但由於神經網路目前來說仍然是個黑盒子,無法保證原文的語意完整傳遞到標的端,導致經常出現漏翻、錯翻等忠實度問題。
本次報告主要講述過去一年我們在提高神經網路翻譯忠實度方向上的系列研究工作,從利用句法結構、擴大翻譯粒度、引入篇章資訊、忠實度學習方面加強模型對原文的理解。
嘉賓介紹
塗兆鵬
騰訊 AI Lab 高階研究員
塗兆鵬是騰訊 AI Lab 的高階研究員,研究主要集中在機器翻譯和深度學習方面,目前已經在自然語言處理和人工智慧領域發表二十餘篇頂級會議和期刊論文,包括 ACL, EMNLP, TACL, NAACL, AAAI 等。
在加入騰訊之前,他分別在 2008 年和 2013 年於北航和中科院計算所獲得電腦科學學士和博士學位,於 2014 年於美國加州大學戴維斯分校完成博士後研究。2014 年到 2017 年他在華為香港諾亞方舟實驗室任研究員。
PhD Talk
如何提升神經網路翻譯的忠實度
騰訊 AI Lab 高階研究員塗兆鵬
內容分享√線上Q&A;√
活動形式:PPT直播
活動時間
1 月 4 日(週四)20:00-21:00
45 min 分享 + 15 min Q&A;
長按識別二維碼,進入直播間
*或使用鬥魚App搜尋「1743775」
往期回顧
關於PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點選「交流群」,小助手將把你帶入 PaperWeekly 的交流群裡。