歡迎光臨
每天分享高質量文章

用於Java的5大機器學習庫盤點

開源最前線(ID:OpenSourceTop) 猿妹 整編

整理自:https://jaxenter.com/top-5-machine-learning-libraries-java-132091.html

機器學習是目前最熱門的技能之一,許多公司都在爭先恐後的尋找能夠編寫ML和深度學習程式碼的程式員,本文將為大家盤點5個針對Java的首選ML庫

1、WEKA

Weka是我們最好的Java機器學習庫的首選。Weka 3是一個完全基於Java開發,最適合用於機器學習演演算法。Weka主要用於資料挖掘,資料分析和預測建模。它完全免費,便攜,易於使用,以及在新的互動式介面上的視覺化。

“Weka的優勢在於分類,但它也支援聚類,關聯規則挖掘,時間序列預測,特徵選擇和異常檢測,”紐西蘭懷卡託大學電腦科學教授Eibe Frank說。

Weka的機器學習演演算法集合可以直接應用於資料集或從你自己的Java程式碼呼叫。它還支援多種標準資料挖掘任務,包括資料預處理,分類,聚類,視覺化,回歸和特徵選擇。(專案地址:http://www.cs.waikato.ac.nz/ml/weka/index.html

2、MOA

MOA是一種開源軟體,專門用於實時資料流的機器學習和資料挖掘。它採用Java開發,可以輕鬆地與Weka一起使用,同時支援擴充套件。MOA的機器學習演演算法和評估工具集合可用於回歸,分類,異常值檢測,聚類,推薦系統和概念漂移檢測。MOA可用於大型演進資料集和資料流以及物聯網(IoT)裝置生成的資料。

MOA專門用於實時資料流的機器學習。它旨在實現時間和記憶體效率的處理。MOA透過提供若干有用的功能(包括用於新演演算法,流和評估方法的易於擴充套件的框架),可重覆實驗的資料流的可儲存設定;以及對現有演演算法和措施進行比較,為在資料挖掘領域中執行實驗提供了基準框架。(專案地址:http://moa.cms.waikato.ac.nz/

3、Deeplearning4j

去年,Deeplearning4j是JAXenter社群Java生態系統中最具創新性的貢獻者之一,Deeplearning4j是一個商業級的開源分散式深度學習庫,用Java和Scala編寫,旨在將深度神經網路和深度學習結合在一起,用於商業環境。

Deeplearning4j旨在作為Java,Scala和Clojure程式員的DIY工具,Hadoop是一個龐大的分散式資料儲存系統,具有巨大的處理能力,能夠處理強大的併發任務或作業。深度神經網路和深度強化學習能夠進行樣式識別和麵向標的的機器學習。所有這一切都意味著Deeplearning4j對於語音識別,聲音和文字中的樣式和情感非常有用。此外,它還可用於檢測金融交易等時間序列資料中的異常。(專案地址:https://deeplearning4j.org/

4、MALLET

MALLET主要由Andrew McCallum和來自UMASS和UPenn的學生開發,是專門用於機器學習方面的軟體包,。這個基於Java的包支援統計自然語言處理,文字聚類,文字分類,資訊提取等。

MALLET的專長包括用於檔案分類,例如用於轉換文字的高效例程。它支援各種演演算法(包括NaïveBayes,Decision Trees和Maximum Entropy)和用於評估classfier效能的程式碼。此外,MALLET還包括用於序列標記和主題建模的工具。(專案地址:http://mallet.cs.umass.edu/

5、ELKI

ELKI是一個用於Java的開源資料挖掘平臺。ELKI的重點是演演算法研究,強調聚類分析,資料庫索引和異常值檢測中的無監督方法。ELKI允許透過分離兩者來獨立評估資料挖掘演演算法和資料管理任務。此功能在Weta或Rapidminer等其他資料挖掘框架中是獨一無二的。ELKI還允許任意資料型別,檔案格式或距離或相似性度量。

ELKI專為研究人員和學生設計,提供大量高度可配置的演演算法引數。這樣可以對演演算法進行公平,簡便的評估和基準測試。這意味著ELKI對資料科學特別有用。(專案地址:https://elki-project.github.io/


●編號770,輸入編號直達本文

●輸入m獲取文章目錄

贊(0)

分享創造快樂