素有檔案影象識別領域“世界盃”之稱的 ICDAR 2019國際權威競賽將於3月1日正式開賽。
獎金總計17400美元!
作為 ICDAR 2019 Robust Reading Competition 競賽主要組織者之一,百度聯合馬來亞大學、華南理工大學、西班牙計算機視覺中心、中國圖象圖形學學會共同釋出了兩項極具挑戰的競賽任務:
ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling,弱標註大規模街景文字識別競賽)、ICDAR 2019-ArT(Arbitrary-Shaped Text,任意形狀場景文字識別競賽)。
本次競賽獎金總計17400美元,歡迎國內外學術界、工業界各大機構華山論劍一較高下。
賽事介紹
ICDAR(International conference on Document Analysis and Recognition)是全球檔案影象分析識別領域公認的權威學術會議,從1991年起每兩年召開一次。
自 2003 年 ICDAR 設立“Robust Reading Competitions”以來,該競賽就成了評測和檢驗自然場景/網路圖片文字自動提取與智慧識別最新技術研究進展的重要國際賽事及標準,競賽中的諸多方法對 OCR 技術發展具有強大推動力。高技術難度、高實際應用性,也使該盛會受到科研院校、科技公司等關註,至今已有 89 個國家的 3500 多支隊伍參與。
2015-2018期間百度多次在 ICDAR 2013、 ICDAR 2015權威競賽集合獲得檢測、識別、端到端各項任務榜單第一,位居業內領先水平。
百度將 OCR 深度學習技術應用於多個業務場景,打造檔案、翻譯、網圖、街景等多場景通用文字識別能力,支援中、英、日、韓、葡、德、法、意、西、俄十國語言。
針對金融、保險、交通等重點場景構建 OCR 產品矩陣和 AI 開放平臺,百度 OCR 打造了領先的證照、票據識別解決方案。針對終端計算場景,百度 OCR 模型壓縮用於多種嵌入式智慧裝置,OCR 終端 SDK 與多家手機廠商合作,打造領先的視覺終端計算能力。
ICDAR 2019-LSVT
大規模弱標註街景文字識別競賽
聚焦探索大規模資料場景下深度學習模型演演算法能力極限,推動大規模弱標註資料下文字識別新方法創新。
ICDAR2019-LSVT 資料集源於百度真實應用場景,作為首個提出弱標註資料的場景文字資料集,包括5萬張精標註街景影象、40萬張弱標註街景影象,總計45萬張,資料量是現有公開資料集(ICDAR 2017、ICPR 2018等)的14倍以上。
室外場景文字識別具有廣泛應用場景,例如:拍照翻譯、影象檢索、街景地標識別、室外場景理解等。
▲精標註資料示例
▲弱標註資料示例
深度學習演演算法通常需要大量訓練資料才能在真實應用中取得良好效果,滿足實際場景的應用需求。由於合成資料與真實資料仍存在明顯差異,同時大規模精確資料標註成本高,探索利用大規模弱標註資料提升深度學習演演算法效能具有重要研究意義和實用價值,同時對探索場景文字識別技術能力邊界具有顯著推動作用。
· 資料集
5萬精標註+40萬張弱標註街景隨拍影象,大規模資料源於實際應用,包含多種複雜場景
· 兩項競賽任務
文字檢測、端到端文字識別,獎金 $8,700
ICDAR 2019-ArT
任意形狀文字識別競賽
資料集由 Total-Text、SCUT-CTW 1500和百度非規則文字資料集組成,累計新增7千張任意形狀資料,總計10176張,是目前業界最大的任意形狀場景文字集合。
現有 ICDAR 文字資料集(ICDAR 2013、ICDAR 2015、ICDAR 2017-MLT,COCO-Text等)只包含水平、四邊形文字框等規則文字標註,如下圖所示,ICDAR2019-ArT 資料集中每張影象至少含有一個非規則形狀文字(irregular text instances),並採用多邊形多點對任意形狀文字包圍框進行精確標註。
▲任意形狀文字示例
真實場景文字識別應用中,相比規則文字識別,現有演演算法非規則形狀文字識別檢測、識別更具挑戰,因此 ICDAR 2019-ArT 競賽旨在進一步推動自然場景下任意形狀文字識別演演算法與技術突破。
· 資料集
1萬張任意形狀文字影象標註,中英混合,最大非規則場景文字集合
· 三項競賽任務
文字檢測、文字識別、端到端識別,獎金 $8,700
百度願與 AI 各界同行一起,推動基礎演演算法、關鍵技術、應用效果新突破。競賽頒獎將在 ICDAR 2019國際會議期間(2019年9月)舉行。還在等什麼?快來參與這場盛會,贏取大獎吧!
賽事組織單位
百度
馬來亞大學
華南理工大學
西班牙計算機視覺中心
中國圖象圖形學學會
賽事時間
2019年2月21日 – 3月31日:註冊通道開放
2019年3月1日:訓練集開放下載
2019年4月9日:提交開始時間
2019年4月30日:提交截止時間
聯絡資訊
ICDAR-2019@baidu.com
競賽註冊通道
ICDAR 2019-LSVT 大規模弱標註街景文字識別競賽:
ICDAR 2019-ArT 任意形狀文字識別競賽:
?
現在,在「知乎」也能找到我們了
進入知乎首頁搜尋「PaperWeekly」
點選「關註」訂閱我們的專欄吧
關於PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點選「交流群」,小助手將把你帶入 PaperWeekly 的交流群裡。