45款免費的優質數據挖掘軟件(一)

數據挖掘是指在大型數據集中發現隱藏的具有特殊關係性的的信息的過程,其中包括利用人工智能、機器學習、統計分析和數據庫檢測等方法,來實現從數據集中提取有用的信息,并將其轉換成可理解的結構模型以備將來使用的目標。

1. Orange
Orange是一個使用Python語言編寫的,基於組件數據挖掘和機器學習軟件。這款軟件為新手和專家提供免費的數據可視化分析。用戶可以通過可視化編程或Python腳本進行數據挖掘。它也擁有機器學習的組件。而且,它還擁有針對生物學信息和文本挖掘的附加組件、豐富的數據分析功能和許多不同的可視化效果,從散點圖、條形圖、樹到樹狀圖、網絡圖和熱點圖,功能十分豐富。另外,Orange會記住你的操作選擇,顯示最常用的組合,並會智能選擇要你使用的小部件間的通信信道。

free-data-mining-software_1

2. Rattle GUI
Rattle GUI是一個免費的數據挖掘軟件,使用R統計編程語言來提供一個圖形用戶界面(GUI)供用戶進行數據挖掘。這個軟件通過一個圖形用戶界面來揭示R統計軟件的強大能力,為用戶提供相當豐富多樣的數據挖掘功能。

free-data-mining-software_2

3. Apache Mahout
Apache Mahout是Apache Software Foundation主要集中在協同過濾、聚類和分類領域的分佈式或者可擴展的機器學習算法的一個免費項目。而其中許多的實現是使用Apache Hadoop平台的。它也提供Scala + Apache Spark、H2O和Apache Flink算法。另外,這個軟件還支持Samsara,這是使用了在一定規模下運行的類似R語法的一個矢量數學實驗環境。

free-data-mining-software_3

4. ML-Flex
ML-Flex是一個使用戶能夠整合以任何一種編程語言編寫的第三方機器學習套裝,橫跨多個計算節點並行執行類聚分析和生成有關分類結果的HTML報告的套裝軟件。

free-data-mining-software_4

5. Databionic ESOM Tools
Databionic ESOM Tools是一套利用基於自組織特征映射網絡算法(ESOM)執行如類聚、可視化和分類等的數據挖掘程序。

free-data-mining-software_5

6. NLTK (Natural Language Toolkit)
NLTK,全稱Natural Language Toolkit,是一套用於Python語言的符號和統計的自然語言處理程序庫。

free-data-mining-software_6

7. SenticNet API
SenticNet API是一個用於觀點挖掘和情緒分析的情感資源庫。

free-data-mining-software_7

8. UIMA
UIMA全稱為Unstructured Information Management Architecture,即非結構化信息管理架構。UIMA是一個構建框架,用於分析諸如文本、視頻和音頻等的非結構化內容,它最初是由IBM.UIMA開發的,目的是使應用程式能被分解為組件。而每個組件實現接口框架對接,并通過XML描述符文件提供自描述的元數據。另外,UIMA框架會管理組件和在它們之間流動的數據。

free-data-mining-software_8

9. KNIME
KNIME,即Konstanz Information Miner,是一個綜合的用戶數據分析框架,它提供整個分析處理的功能:數據存取、數據轉換、初步調查、強大的預測分析、數據可視化和生成報告。

free-data-mining-software_9

10. Chemicalize.org
Chemicalize.org是一個化學結構挖掘工具,同時也是一個網頁搜尋引擎。

free-data-mining-software_10

11. Vowpal Wabbit
Vowpal Wabbit是最初在Yahoo開發的一款快速的免費學習系統數據庫和程式。目前,該產品在Microsoft Research進行研發。Vowpal Wabbit因為包含一個高效可擴展的線上機器學習的實現而声名鹊起,而且,它還支持許多的機器學習簡化、按重要性大小加权、選擇不同的損失函數和優化算法。

free-data-mining-software_11

12. GraphLab
GraphLab是一個以C++語言編寫的基於圖形的高性能的分佈式計算框架。它被廣泛使用于其他的數據挖掘任務,并能通過數量來實現其他的數據抽象處理。

free-data-mining-software_12

13. GNU Octave
GUN Octave是一個高級的編程語言,主要用於數值計算。它提供一個解決數值的線性和非線性問題的命令行接口,而且,為了執行其他的數值實驗,它使用了一個主要與MATLAB兼容的語言。

free-data-mining-software_13

14. CMSR Data Miner
CMSR Data Miner套件為預測建模、數據分割、數據可視化、統計數據分析和基於規則的模型評估工作提供一個集成化環境。另外,它也為先進的高級用戶提供集成的分析和規則引擎環境。

free-data-mining-software_14

15. MLpy
MLpy是一個基於Python語言的免費機器學習資源庫,建立在GNU Scientific Library 的NumPy/SciPy之上。MLpy為有監督和無監督的問題提供各種各樣最先進的機器學習方法,旨在在模塊性、可維護性、再現性、可用性和效率之間尋找到一個合理的折衷方案。

free-data-mining-software_15

Leave a Reply