本文轉自:AI科技大本營(ID:rgznai100);
本文由AI科技大本營 翻譯,參與 | SuiSui; 獲授權;
繼推出2017年機器學習開源專案Top 30榜單後,Mybridge AI又推出了一個Python開源專案Top 30榜單,包括開源Python庫、工具等。該榜單基於專案質量、使用者參與度以及其他幾個方面進行了評估,從大約15000個開源專案中挑選了Top 30,差不多都是在2017年1-12月釋出。這些專案在Github上的平均star為3707。
No 1:Home-assistant (v0.6+)
基於Python 3的開源家庭自動化平臺[Github 11357 stars,由Paulus Schoutsen提供]
https://github.com/home-assistant/home-assistant
No 2:Pytorch
PyTorch是使用GPU和CPU最佳化的深度學習張量庫,基於Python語言編寫。[Github 11019 stars,由PyTorch團隊的Adam Paszke和其他人提供]
https://github.com/pytorch/pytorch
No 3:Grumpy
Grumpy是一個Python to Go的原始碼翻譯編譯器和執行時,旨在取代CPython 2.7。關鍵區別在於,Grumpy是將Python原始碼編譯為Go原始碼,然後將其編譯為native code,而不是bytecode。這也就意味著Grumpy沒有虛擬機器(VM)。編譯好的Go原始碼是對Grumpy執行時的一系列呼叫,一個Go庫服務於具有相似目的的Python C API。 [Github 8367 stars,由Google的Dylan Trotter及其他工作人員提供]。
https://github.com/google/grumpy
No 4:Sanic
該專案是一個類 Flask 的 Python 3.5+ 網頁伺服器,專為加速而設計。Sanic支援非同步請求處理,意味著你可以使用Python 3.5中一些async/await語法。。[Github 8028 stars,由Channel Cat和Eli Uriegas提供]
https://github.com/channelcat/sanic
No 5:Python-fire
一個可以從任何Python物件自動生成命令列介面(CLI)的庫。 [Github 7775 stars,來自Google Brain 的 David Bieber]
https://github.com/channelcat/sanic
No 6:spaCy(v2.0)
該專案是一個使用Python和Cython的進行高階自然語言處理(NLP)的開源庫 [Github 7633 stars,由Matthew Honnibal提供]
https://github.com/explosion/spaCy
No 7:Pipenv
Python.org官方推薦的Python打包工具。它會自動為專案建立和管理virtualenv,併在安裝/解除安裝軟體包時從Pipfile中新增/刪除軟體包。 [Github 7273 stars,由Kenneth Reitz提供]
https://github.com/pypa/pipenv
No 8:MicroPython
一個脫胎於Python且非常高效的Python實現,主要是為了能在嵌入式硬體上(這裡特指微控制器級別)更簡單地實現對底層的操作。[Github 5728 stars]
https://github.com/micropython/micropython
No 9:Prophet
該工具是Facebook開源的一款用於為多週期性的線性或非線性時間序列資料生成高質量預測的工具。[Github 4369 stars,由Facebook提供]
https://github.com/facebook/prophet
No 10:Serpent AI
該專案是一個Python寫的遊戲代理框架,簡單而強大,可幫助開發者建立遊戲代理。可將任何影片遊戲變成一個Python寫成的成熟沙箱環境。該框架的目的是為機器學習和AI研究提供一個有價值的工具,不過對於愛好者來說也是非常有趣的。[Github 3411 stars,由Nicholas Brochu提供]
https://github.com/SerpentAI/SerpentAI
No 11:Dash
Dash是一個純Python寫成的框架,無需JavaScript即可構建互動式的分析類web應用程式。[Github 3281 stars,由Chris P提供]
https://github.com/plotly/dash
No 12:InstaPy
Instagram機器人,喜歡/評論/Follow 自動化指令碼。[Github 3179 stars,由TimG提供]。
https://github.com/timgrossmann/InstaPy
No 13:Apistar
專為Python 3定製的Web API框架[Github 3024 stars,Tom Christie提供]。
https://github.com/encode/apistar
No 14:Faiss
用於密集向量的高效相似性搜尋庫和聚類的庫 [GitHub 2717 stars,貢獻者Facebook Research]
https://github.com/facebookresearch/faiss
No 15:MechanicalSoup
一個與網站自動互動的Python庫,自動儲存和傳送cookies,支援重定向,並可以跟蹤連結和提交表格。[Github 2244 stars]
https://github.com/MechanicalSoup/MechanicalSoup
No 16:Better-exceptions
該專案以更友好的形式展示Python中的異常資訊。[Github 2121 stars,貢獻者Qix]
https://github.com/Qix-/better-exceptions
No 17:Flashtext
該專案基於FlashText演演算法,用以高效搜尋句子中的關鍵詞併進行替代。[Github 2019 stars,由Vikash Singh提供]。
https://github.com/vi3k6i5/flashtext
No 18:Maya
在不同系統上的不同語言環境中,Python對日期時間的處理非常不暢,Maya主要就是為瞭解決解析網站時間資料問題。[Github 1828 stars,Kenneth Reitz提供]
https://github.com/kennethreitz/maya
No 19:Mimesis
是一個快速易用的Python庫,可以用不同語言為基於不同的目的生成合成資料。這些資料在軟體開發和測試階段非常有用。[Github 1732 stars,由LíkieGeimfari提供]
https://github.com/lk-geimfari/mimesis
No 20:Open-paperless
該專案是一個一個檔案管理系統,可掃描、索引和歸檔所有紙張檔案。[Github 1717 stars,由Tina Zhou提供]
https://github.com/zhoubear/open-paperless
No 21:Fsociety
駭客工具包,滲透測試框架。[Github 1585 stars,Manis Manisso提供]
No 22:LivePython
Python程式碼實時視覺化跟蹤。[Github 1577 stars,由Anastasis Germanidis提供]
https://github.com/agermanidis/livepython
No 23:Hatch
一個Python專案、包以及虛擬環境的管理工具。[Github 1537 stars,由Ofek Lev提供]
https://github.com/ofek/hatch
No 24:Tangent
該專案是谷歌開源的一個用於自動微分的源到源純Python庫。[Github 1433 stars,來自Google Brain的Alex Wiltschko以及其他人]。
https://github.com/google/tangent
No 25:Clairvoyant
一個Python程式,用於識別和監控短期庫存移動的歷史線索[Github 1159 stars,由Anthony Federico提供]。
https://github.com/anfederico/Clairvoyant
No 26:MonkeyType
該專案是Instagram開源的一款適用於Python的工具,透過收集執行時型別來生成靜態型別註釋。[Github 1137 stars,由Instagram工程師Carl Meyer提供]。
https://github.com/Instagram/MonkeyType
No 27:Eel
該專案是一個小型Python庫,用於製作簡單的類似 Electron的離線HTML/JS GUI應用程式,當前僅支援Python3。 [Github 1137 stars]
https://github.com/ChrisKnott/Eel
No 28:Surprise v1.0
用於構建和分析推薦系統的Python scikit [Github 1103 stars]
https://github.com/NicolasHug/Surprise
No 29:Gain
Web爬蟲框架。[Github 1009 stars,由高久力提供]
https://github.com/gaojiuli/gain
No 30:PDFTabExtract
一組用於從PDF檔案中提取表格的工具,有助於在掃描的檔案上進行資料挖掘。 [Github 722 stars]
https://github.com/WZBSocialScienceCenter/pdftabextract
原文地址:https://medium.mybridge.co/30-amazing-python-projects-for-the-past-year-v-2018-9c310b04cdb3
關聯閱讀
原創系列文章:
資料運營 關聯文章閱讀:
資料分析、資料產品 關聯文章閱讀:
80%的運營註定了打雜?因為你沒有搭建出一套有效的使用者運營體系