歡迎光臨
每天分享高質量文章

GitHub最著名的20個Python機器學習專案!

我們分析了GitHub上的前20名Python機器學習專案,發現scikit-Learn,PyLearn2和NuPic是貢獻最積極的專案。讓我們一起在Github上探索這些流行的專案!

  • Scikit-learn:Scikit-learn 是基於Scipy為機器學習建造的的一個Python模組,他的特色就是多樣化的分類,回歸和聚類的演演算法包括支援向量機,邏輯回歸,樸素貝葉斯分類器,隨機森林,Gradient Boosting,聚類演演算法和DBSCAN。而且也設計出了Python numerical和scientific libraries Numpy and Scipy

  • Pylearn2:Pylearn是一個讓機器學習研究簡單化的基於Theano的庫程式。

  • NuPIC:NuPIC是一個以HTM學習演演算法為工具的機器智慧平臺。HTM是皮層的精確計算方法。HTM的核心是基於時間的持續學習演演算法和儲存和撤銷的時空樣式。NuPIC適合於各種各樣的問題,尤其是檢測異常和預測的流資料來源。

  • Nilearn:Nilearn 是一個能夠快速統計學習神經影像資料的Python模組。它利用Python語言中的scikit-learn 工具箱和一些進行預測建模,分類,解碼,連通性分析的應用程式來進行多元的統計。

  • PyBrain:Pybrain是基於Python語言強化學習,人工智慧,神經網路庫的簡稱。 它的標的是提供靈活、容易使用並且強大的機器學習演演算法和進行各種各樣的預定義的環境中測試來比較你的演演算法。

  • Pattern:Pattern 是Python語言下的一個網路挖掘模組。它為資料挖掘,自然語言處理,網路分析和機器學習提供工具。它支援向量空間模型、聚類、支援向量機和感知機並且用KNN分類法進行分類。

  • Fuel:Fuel為你的機器學習模型提供資料。他有一個共享如MNIST, CIFAR-10 (圖片資料集), Google’s One Billion Words (文字)這類資料集的介面。你使用他來透過很多種的方式來替代自己的資料。

  • Bob:Bob是一個免費的訊號處理和機器學習的工具。它的工具箱是用Python和C++語言共同編寫的,它的設計目的是變得更加高效並且減少開發時間,它是由處理影象工具,音訊和影片處理、機器學習和樣式識別的大量軟體包構成的。

  • Skdata:Skdata是機器學習和統計的資料集的庫程式。這個模組對於玩具問題,流行的計算機視覺和自然語言的資料集提供標準的Python語言的使用。

  • MILK:MILK是Python語言下的機器學習工具包。它主要是在很多可得到的分類比如SVMS,K-NN,隨機森林,決策樹中使用監督分類法。 它還執行特徵選擇。 這些分類器在許多方面相結合,可以形成不同的例如無監督學習、密切關係金傳播和由MILK支援的K-means聚類等分類系統。

  • IEPY:IEPY是一個專註於關係抽取的開源性資訊抽取工具。它主要針對的是需要對大型資料集進行資訊提取的使用者和想要嘗試新的演演算法的科學家。

  • Quepy:Quepy是透過改變自然語言問題從而在資料庫查詢語言中進行查詢的一個Python框架。他可以簡單的被定義為在自然語言和資料庫查詢中不同型別的問題。所以,你不用編碼就可以建立你自己的一個用自然語言進入你的資料庫的系統。現在Quepy提供對於Sparql和MQL查詢語言的支援。並且計劃將它延伸到其他的資料庫查詢語言。

  • Hebel:Hebel是在Python語言中對於神經網路的深度學習的一個庫程式,它使用的是透過PyCUDA來進行GPU和CUDA的加速。它是最重要的神經網路模型的型別的工具而且能提供一些不同的活動函式的啟用功能,例如動力,涅斯捷羅夫動力,訊號丟失和停止法。

  • mlxtend:它是一個由有用的工具和日常資料科學任務的擴充套件組成的一個庫程式。

  • nolearn:這個程式包容納了大量能對你完成機器學習任務有幫助的實用程式模組。其中大量的模組和scikit-learn一起工作,其它的通常更有用。

  • Ramp:Ramp是一個在Python語言下制定機器學習中加快原型設計的解決方案的庫程式。他是一個輕型的pandas-based機器學習中可插入的框架,它現存的Python語言下的機器學習和統計工具(比如scikit-learn,rpy2等)Ramp提供了一個簡單的宣告性語法探索功能從而能夠快速有效地實施演演算法和轉換。

  • Feature Forge:這一系列工具透過與scikit-learn相容的API,來建立和測試機器學習功能。這個庫程式提供了一組工具,它會讓你在許多機器學習程式使用中很受用。當你使用scikit-learn這個工具時,你會感覺到受到了很大的幫助。(雖然這隻能在你使用不同的演演算法時起作用。)

  • REP:REP是以一種和諧、可再生的方式為指揮資料移動驅動所提供的一種環境。它有一個統一的分類器包裝來提供各種各樣的操作,例如TMVA, Sklearn, XGBoost, uBoost等等。並且它可以在一個群體以平行的方式訓練分類器。同時它也提供了一個互動式的情節。

  • Python 學習機器樣本:用亞馬遜的機器學習建造的簡單軟體收集。

  • Python-ELM:這是一個在Python語言下基於scikit-learn的極端學習機器的實現。

精彩活動

福利 · 閱讀 | 免費申請讀大資料新書 第23期

推薦閱讀

2017年資料視覺化的七大趨勢! 

全球100款大資料工具彙總(前50款) 

論大資料的十大侷限

大資料時代的10個重大變革

大資料七大趨勢 第一個趨勢是物聯網

Q: 你對哪個機器學習專案最感興趣?

歡迎留言與大家分享

請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:hzzy@hzbook.com

更多精彩文章,請在公眾號後臺點選“歷史文章”檢視

贊(0)

分享創造快樂