歡迎光臨
每天分享高質量文章

騰訊AI Lab塗兆鵬:如何提升神經網路翻譯的忠實度 | PhD Talk #22

「PhD Talk」是 PaperWeekly 的學術直播間,旨在幫助更多的青年學者宣傳其最新科研成果。我們一直認為,單向地輸出知識並不是一個最好的方式,而有效地反饋和交流可能會讓知識的傳播更加有意義,從而產生更大的價值。
這是第 22 期「PhD Talk」

機器翻譯是自然語言處理的經典任務之一,涉及到自然語言處理的兩個基本問題:語言理解和語言生成。這兩個問題的建模直接對應譯文的兩個評價指標:忠實度(是否表達原文的完整意思)和流利度(譯文是否流暢)。


近幾年來,神經網路機器翻譯取得了巨大進展,成為了主流模型。神經網路由於能緩解資料稀疏性及捕獲詞語之間的關聯,生成的譯文流利度高,這是過去二十餘年上一代統計機器翻譯一直以來的難點。但由於神經網路目前來說仍然是個黑盒子,無法保證原文的語意完整傳遞到標的端,導致經常出現漏翻、錯翻等忠實度問題。


本次報告主要講述過去一年我們在提高神經網路翻譯忠實度方向上的系列研究工作,從利用句法結構、擴大翻譯粒度、引入篇章資訊、忠實度學習方面加強模型對原文的理解。

嘉賓介紹


塗兆鵬

騰訊 AI Lab 高階研究員

塗兆鵬是騰訊 AI Lab 的高階研究員,研究主要集中在機器翻譯和深度學習方面,目前已經在自然語言處理和人工智慧領域發表二十餘篇頂級會議和期刊論文,包括 ACL, EMNLP, TACL, NAACL, AAAI 等。


在加入騰訊之前,他分別在 2008 年和 2013 年於北航和中科院計算所獲得電腦科學學士和博士學位,於 2014 年於美國加州大學戴維斯分校完成博士後研究。2014 年到 2017 年他在華為香港諾亞方舟實驗室任研究員。

          

PhD Talk

 

如何提升神經網路翻譯的忠實度

騰訊 AI Lab 高階研究員塗兆鵬

內容分享√線上Q&A;√

活動形式:PPT直播

 

 活動時間 

1 月 4 日(週四)20:00-21:00

45 min 分享 + 15 min Q&A;

長按識別二維碼,進入直播間

*或使用鬥魚App搜尋「1743775」

往期回顧

 

基於生成模型的事件流研究 + NIPS 2017 論文解讀

亞馬遜高階應用科學家熊元駿:人類行為理解研究進展

清華大學馮珺:基於強化學習的關係抽取和文字分類

基於雙語主題模型的跨語言層次分類體系匹配

東南大學高桓:知識圖譜表示學習

帶多分類判別器的GAN模型

關於PaperWeekly


PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點選「交流群」,小助手將把你帶入 PaperWeekly 的交流群裡。


贊(0)

分享創造快樂