歡迎光臨
每天分享高質量文章

每週論文清單:對話系統綜述,全新中文分詞框架,影片生成,文字識別


在碎片化閱讀充斥眼球的時代,越來越少的人會去關註每篇論文背後的探索和思考。

在這個欄目裡,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。


點選本文底部的「閱讀原文」即刻加入社群,檢視更多最新論文推薦。

這是 PaperDaily 的第 33 篇文章

[ 自然語言處理 ]

A Gap-Based Framework for Chinese Word Segmentation via Very Deep Convolutional Networks

@jueliangguke 推薦

#Convolutional Neural Network

本文提出了一個全新的中文分詞框架,使用深度摺積網路在多個資料集上達到了 state-of-the-art。

論文連結

https://www.paperweekly.site/papers/1473

A Survey on Dialogue Systems: Recent Advances and New Frontiers

@paperweekly 推薦

#Dialog Systems

本文來自京東資料科學團隊,這是一篇非常全面的對話系統綜述,取用了 100+ 篇相關論文,並對論文進行了分類。

論文連結

https://www.paperweekly.site/papers/1446

How to Make Context More Useful?

@zhangjianhai 推薦

#ContextQA

在自然語言對話領域,論文首先對比了目前幾種流行的 Context-aware 模型,包括 Non-hierarchical 模型(將 context 與 query 作為一個序列建模)以及 Hierarchical 模型(將 context 與 query 分別建模生成向量表示,在此基礎上採用不同的方式進行整合,包括 sum,concat,sequential integration 等)。

最後,論文提出了一種 Weighted Sequential Integration 的背景關係整合方式,對不同的背景關係賦予不同的權重。對 ContextQA 相關工作具有一定借鑒意義。

論文連結

https://www.paperweekly.site/papers/1476


SAM: Semantic Attribute Modulation for Language Modeling and Style Variation

@cfjmonkey 推薦

#Text Style Transfer

該文實現了基於給定屬性的文字風格的轉換。屬性包括標題、作者和類別。不同類別的文章用詞分佈不同,同一作者的寫作風格是一致的,標題個人理解可以看做關鍵詞定基調,相比關鍵詞語料更豐富。

實驗在新聞、影評和歌詞三大類文字中進行。 該工作作者來自今日頭條,eBay 和清華。

論文連結

https://www.paperweekly.site/papers/1461

Globally Normalized Reader

@zhangjun 推薦

#Question Answering

來自百度的 QA 系統,本文已被 EMNLP 2017 接收。

論文連結

https://www.paperweekly.site/papers/1463


[ 計算機視覺 ]


Panoptic Segmentation

@YiqiYan 推薦

#Semantic Segmentation

本文提出了一種新的概念 — Panoptic Segmentation,它是對 instance sengmentation 和 semantic segmentation 的統一。

例如一副街景:instance sengmentation 只分割出一些實體,但是要區分同一類別的個體(分割出車 a,車 b,車 c);semantic segmentation 是把每一個畫素分入一個類別,但是不區分個體;Panoptic Segmentation 既要完成 semantic segmentation 的任務,又要區分同一個類別的不同個體。

論文連結

https://www.paperweekly.site/papers/1479

Adversarial Patch

@Synced 推薦

#Adversarial Training

該論文提出了一種在現實世界中建立通用、魯棒、針對性的對抗影象 patch 的方法。該 patch 是通用的,因為它們可用於攻擊任何場景;是魯棒的,因為它們在多種影象變換中都是有效的;是有針對性的,因為它們可以令分類器輸出任意標的類。

這些對抗樣本可以被打印出來,新增到任意的場景、照片,並展示給影象分類器;即使 patch 很小,也能導致分類器忽略場景中的其它物體,輸出選定的標的類。

論文連結

https://www.paperweekly.site/papers/1475

Consensus-based Sequence Training for Video Captioning

@Aidon 推薦

#Video Captioning

文章指出現有的 captioning 模型都是用交叉熵損失(XE: cross-entropy loss)訓練的,而實際評估的時候用的是其他指標比如 BLEU,METEOR 等。

這裡對應的是第一個問題:objective mismatch,很自然地會想到可以直接對評價指標進行最佳化。第二個問題是 exposure bias,即訓練集和測試集上 captions 的分佈很有可能是不一樣的。雖然強化學習有被用於解決第一個問題,但它的計算開銷大,並且在每一步都有指定 baseline reward 才能保證模型的收斂。

針對以上問題,文章提出基於一致性的序列訓練來做 video captioning。首先從理論上解釋了 XE training 和 RL training 之間的聯絡,即後者是前者的一個加權形式;然後引入一個簡單的 WXE pre-training 來近似 RL training,這樣就解決了前面提到的第一個問題。

更進一步地,文章提出用 full REINFORCE 來進行 fine-tune,利用 gt captions 的 consensus score 作為 baseline reward,這樣就可以避免 XE training 帶來的第二個問題。

論文連結

https://www.paperweekly.site/papers/1450

ObamaNet: Photo-realistic Lip-sync from Text

@zhangjun 推薦

#Video Generation

本文是 MILA 最近的一篇工作,實現了一個根據 text 合成唇同步影片的架構,並以奧巴馬做了一個 demo,命名為 ObamaNet。

Demo 地址:http://ritheshkumar.com/obamanet/

論文連結

https://www.paperweekly.site/papers/1505


Arbitrarily-Oriented Text Recognition

@chenhong 推薦

#Text Detection

論文中 2D 影象的任意方向的字元編碼為 4 個方向的 4 個特徵序串列示:左→右,右→左,上→下,下→上(每個方向的特徵序列長度相同)。

論文提出一個魯棒性演演算法,基於 AON 識別規則和不規則自然場景字元。基於 top-down,無需檢測字元,直接預測原始影象整個字元,end-to-end 實現。

論文連結

https://www.paperweekly.site/papers/1488


本文由 AI 學術社群 PaperWeekly 精選推薦,社群目前已改寫自然語言處理、計算機視覺、人工智慧、機器學習、資料挖掘和資訊檢索等研究方向,點選「閱讀原文」即刻加入社群!

我是彩蛋 


 解鎖新功能:熱門職位推薦!

PaperWeekly小程式升級啦

今日arXiv√猜你喜歡√熱門職位

找全職找實習都不是問題

 

 解鎖方式 

1. 識別下方二維碼開啟小程式

2. 用PaperWeekly社群賬號進行登陸

3. 登陸後即可解鎖所有功能

 職位釋出 

請新增小助手微信(pwbot01)進行諮詢

 

長按識別二維碼,使用小程式

*點選閱讀原文即可註冊

關於PaperWeekly


PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點選「交流群」,小助手將把你帶入 PaperWeekly 的交流群裡。


贊(0)

分享創造快樂