歡迎光臨
每天分享高質量文章

本週 Github 精選:13 款煉丹利器,有開源工具包也有超大資料集



在碎片化閱讀充斥眼球的時代,越來越少的人會去關註每篇論文背後的探索和思考。


在這個欄目裡,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。


點選本文底部的「閱讀原文」即刻加入社群,檢視更多最新論文推薦。

這是 PaperDaily 的第 65 篇文章


#Swift for TensorFlow

Swift for TensorFlow 為 TensorFlow 提供了一種新的程式設計模型,將 TensorFlow 計算圖與 Eager Execution 的靈活性和表達能力結合在了一起,同時還註重提高整個軟體架構每一層的可用性。

本專案的設計基礎是 Graph Program Extraction 演演算法,它可以讓你用 Eager Execution 式的程式設計模型來輕鬆地實現程式碼,同時還保留 TensorFlow 計算圖的高效能優勢。此外,本項目還將高階的自動微分功能直接整合在了 Swift 語言和編譯器裡面。

專案連結

https://github.com/tensorflow/swift


#視覺化降維Python工具包

HyperTools 是一個具有視覺化功能的降維工具包,其基本流程是輸入高維資料,呼叫降維函式,同時進行繪圖。

▲ 效果展示

專案連結

https://github.com/ContextLab/hypertools


GluonNLP

#NLP深度學習工具包

GluonNLP 提供了 NLP 方向的頂尖深度學習模型實現,並且構建了文字資料管道和模型的模組。它專門面向工程師、研究人員和學者設計,大家可以基於這些模型快速實現研究思路,做出產品原型。

該專案具有如下特徵: 

1. 訓練指令碼來重現論文中的 state-of-the-art 結果; 

2. 針對常見 NLP 任務的預訓練模型; 

3. 精心設計的 API,可以極大減少實現的複雜性; 

4. 中文社群支援。

▲ 案例展示

專案連結

https://github.com/dmlc/gluon-nlp



GluonCV

#CV深度學習工具包

GluonCV 提供了 CV 方向的頂尖深度學習模型實現。該專案能幫助工程師、研究人員和學者快速打造產品原型、驗證新思路以及學習計算機視覺。

該工具包提供如下功能:

1. 近年重要論文的復現;

2. 詳細檔案提供使用說明和程式碼講解;

3. 提供預訓練的模型可以直接使用;

4. 效能評測,方便大家在不同模型之間做取捨;

5. 每個模型實現和介面儘量保證一致性,降低使用新模型的學習門檻;

6. 定時做重新訓練保證程式碼正確性;

7. 中文社群支援。

▲ 案例展示

專案連結

https://github.com/dmlc/gluon-cv


PyTorch Summary

#PyTorch版Keras API: model.summary() 

Keras 框架有一個用於模型視覺化的簡潔 API —— model.summary(),本專案實現了用於 PyTorch 框架中的 model.summary() 功能,用於輸出模型各層的詳細引數。

▲ 效果展示



專案連結

https://github.com/sksq96/pytorch-summary

NCRF++

#基於PyTorch的Neural版本CRF++

本專案是基於 PyTorch 的神經網路序列標註開源庫,包含了幾種最先進的神經網路序列標註模型(LSTMCRF, CNNCRF 等),算是神經網路版的 CRF++。它可以讓使用者快速重現論文中的模型(如 Ma et. al ACL 2016; Lample et. al NAACL2016)。

該專案具有以下幾個特點: 

1. 無需寫程式碼:只要透過修改配置檔案就可以對模型的結構進行配置,無需任何程式碼工作;

2. 自由新增特徵:該專案不僅集成了幾種經典的特徵結構(如 char-lstm, char-gru, char-cnn)還可以新增自定義的特徵並初始化特徵向量;

3. 高效準確:利用該開源庫可以輕鬆重現之前的多篇論文的結果,大部分情況下會得到比論文更高的精度。同時該專案時完全基於 batch 計算實現的,因此計算速度很快(2000 句/秒);

4. Nbest 輸出:其 CRF 結構支援輸出 top-n 個最優 label 序列,並給出對應的序列機率。

▲ 結構設計

專案連結

https://github.com/jiesutd/NCRFpp



Adversarial Robustness Toolbox

#IBM開源對抗機器學習庫

Adversarial Robustness Toolbox 是由 IBM 團隊開源的對抗機器學習庫,其主要用於檢測模型及對抗攻擊,為開發人員加強 AI 模型被誤導的防禦性,讓 AI 系統變得更加安全。

本專案實現了以下分類器攻防方法:

攻擊:

  • Deep Fool (Moosavi-Dezfooli et al., 2015) 

  • Fast Gradient Method (Goodfellow et al., 2014) 

  • Jacobian Saliency Map (Papernot et al., 2016) 

  • Universal Perturbation (Moosavi-Dezfooli et al., 2016) 

  • Virtual Adversarial Method (Moosavi-Dezfooli et al., 2015) 

  • C&W; Attack (Carlini and Wagner, 2016) 

  • NewtonFool (Jang et al., 2017)

防禦:

  • Feature squeezing (Xu et al., 2017)

  • Spatial smoothing (Xu et al., 2017)

  • Label smoothing (Warde-Farley and Goodfellow, 2016)

  • Adversarial training (Szegedy et al., 2013)

  • Virtual adversarial training (Miyato et al., 2017)

專案連結

https://github.com/IBM/adversarial-robustness-toolbox



Chatbot

#可以進行訓練的聊天機器人

本專案是一個可以自己進行訓練的聊天機器人,可以根據自己的語料訓練出想要的對話機器人。本次訓練的語料是從網際網路上找到的 shooter 訓練語料,語料質量很差勁,僅作為演示程式碼來用,大家可以使用自己的語料。

專案連結

https://github.com/zhaoyingjun/chatbot


SparkFlow

#基於Spark平臺的TensorFlow實現

SparkFlow 是一個基於 Spark 平臺的 TensorFlow 實現,讓使用者更方便在 Spark 上部署 TensorFlow 程式,更好地利用分散式平臺進行深度學習模型的訓練。

▲ MNIST深度學習示例


專案連結

https://github.com/lifeomic/sparkflow

Tweet Generator

#模擬任何Twitter使用者發推文

Tweet Generator 是一個模擬 Twitter 使用者風格生成推文的工具。本專案基於 textgenrnn,並使用背景關係標簽對網路進行訓練以獲得更好的推文合成。

textgenrnn 是一個基於 Keras 和 TensorFlow 的 Python 3 模組,只需幾行程式碼即可訓練文字生成網路。

▲ 效果展示


專案連結

https://github.com/minimaxir/tweet-generator


DL Project Template

#深度學習工程模板

本專案是由美圖雲事業部開源的深度學習工程模板,簡化載入資料、構建網路、訓練模型和預測樣本的流程。

▲ 框架圖

▲ 檔案夾結構


專案連結

https://github.com/SpikeKing/DL-Project-Template



STAIR Actions

#用於動作識別的大規模影片資料集

STAIR Actions 是一個用於動作識別的大規模影片資料集,包含 100 類諸如吃飯、喝水、洗手、扔垃圾等人類日常行為,每一類動作有 1000 個左右的影片。作者保留了 10% 的資料用於後續比賽。

▲ 資料集規模

▲ 100種行為串列


專案連結

https://github.com/STAIR-Lab-CIT/STAIR-actions

Moonlight Optical Music Recognition

#基於TensorFlow的光學樂譜識別工具

本專案是一個基於 TensorFlow 的光學樂譜識別工具,它透過讀取包含樂譜的 PNG 影象來輸出 MusicXML 格式樂譜或 NoteSequence 訊息。

專案連結

https://github.com/tensorflow/moonlight

點選以下標題檢視往期推薦: 

#答 題 時 間#

 那!就!是!

好書送給社會人~

以下是簡單粗暴送福利環節

PaperWeekly × 圖靈教育 

入理解TensorFlow 

架構設計與實現原理

<5本>

圖靈原創√大牛推薦√火熱預售

作者:彭靖田,林健 ,白小龍 


自 TensorFlow 開源以來,不斷有人撰寫圖書或部落格解釋其各元件的實現與原理。但遺憾的是,能夠深入剖析 TensorFlow 內部實現細節與設計思想的資料少之又少,而本書則嘗試彌補這一缺憾。 


  • TensorFlow 進階不二之選 

  • 才雲科技技術總監 

  • 華為深度學習團隊系統工程師 

  • 華為公司深度學習雲服務技術負責人 

        聯合編寫 


  • 中國科學院計算技術研究所副研究員查禮 

  • 浙江大學計算機學院院長陳剛 

  • 才雲科技創始人兼 CEO 張鑫 

  • Google Brain 資深工程師周玥楓 

  • 雲賬戶聯合創始人兼 CTO 鄒永強 

  • 博拉科技創始人兼 CEO 周公爽 

  • 微軟亞洲研究院助理研究員王錦鵬 

  • 才雲科技首席大資料科學家鄭澤宇 

        聯合推薦 


  • 深入解析 TensorFlow 系統本身的設計與實現原理 


本書以 TensorFlow 1.2 為基礎,從基本概念、內部實現和最佳實踐等方面深入剖析 TensorFlow。不僅由淺入深地全面介紹 TensorFlow 的使用方法,還結合原始碼進行深入剖析,使讀者可以快速、系統地學習 TensorFlow 的架構設計與實現原理。

 

 參與方式 


請在文末留言分享

本期你最喜歡的Github專案


小編將隨機抽取5位同學

送出圖靈教育新書


截止時間:5月1日(週二)20:00

關於PaperWeekly


PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點選「交流群」,小助手將把你帶入 PaperWeekly 的交流群裡。


▽ 點選 | 閱讀原文 | 預購《深入理解TensorFlow》

贊(0)

分享創造快樂