https://haifengl.github.io/
https://github.com/haifengl/smile
Smile(統計機器智慧和學習引擎)是一個基於Java和Scala的快速、全面的機器學習、NLP、線性代數、圖形、插值和視覺化系統。
憑藉先進的資料結構和演演算法,Smile提供了最先進的效能。Smile有很好的檔案記錄,請檢視專案網站以獲取程式設計指南和更多資訊。
Smile涵蓋了機器學習的各個方面,包括分類、迴歸、聚類、關聯規則挖掘、特徵選擇、流形學習、多維縮放、遺傳演演算法、缺失值插補、高效最近鄰搜尋等。
Smile實現了以下主要的機器學習演演算法:
maven引入
<dependency>
<groupId>com.github.haifengl</groupId>
<artifactId>smile-core</artifactId>
<version>2.6.0</version>
</dependency>
大多數模型支援Java可序列化介面(所有分類器都支援可序列化介面),因此您可以在Spark中使用它們。
對於在非Java程式碼中讀/寫模型,我們建議使用XStream以序列化訓練的模型。XStream是一個簡單的庫,用於將物件序列化為XML並再次序列化。XStream易於使用,不需要對映(實際上不需要修改物件)。Protostuff是一個很好的替代方案,它支援向前向後相容性(模式演化)和驗證。除了XML之外,Protostuff還支援許多其他格式,如JSON、YAML、protobuf等。
Smile提供了一個基於Swing的資料視覺化庫SmilePlot,它提供散點圖、線圖、階梯圖、條形圖、方框圖、直方圖、3D直方圖、樹狀圖、熱圖、hexmap、QQ圖、等高線圖、曲面和線框。
需要引入庫
<dependency>
<groupId>com.github.haifengl</groupId>
<artifactId>smile-plot</artifactId>
<version>2.6.0</version>
</dependency>
Smile還支援宣告方式的資料視覺化。使用mile.plot.vega軟體包,我們可以建立一個規範,將視覺化描述為從資料到圖形標記(如點或條)屬性的對映。
該規範基於Vega-Lite。Vega-Lite編譯器自動生成視覺化元件,包括軸、圖例和比例。然後,它根據一組精心設計的規則確定這些元件的屬性。
作者:馬洪彪
出處:http://www.cnblogs.com/mahongbiao/
本文版權歸作者和部落格園共有,歡迎轉載,但未經作者同意必須保留此段宣告,且在文章頁面明顯位置給出原文連線,否則保留追究法律責任的權利。