機器學習的思想並不複雜,它僅僅是對人類生活、學習過程的一個模擬。而在這整個過程中,最關鍵的是資料。任何通過資料訓練的學習演算法的相關研究都屬於機器學習,包括很多已經發展多年的技術,比如:
-
線性回歸(Linear Regression)
-
K均值(K-Means,基於原型的目標函數聚類方法)
-
決策樹(Decision Trees,運用概率分析的一種圖解法)
-
隨機森林(Random Forest,運用概率分析的一種圖解法)
-
PCA(Principal Component Analysis,主成分分析)
-
SVM(Support Vector Machine,支援向量機)
-
ANN(Artificial Neural Networks,人工神經網路)
可見,機器學習的演算法非常多,本文將介紹一些最常用的機器學習分類方法。
監督學習
監督學習(Supervised Learning)表示機器學習的資料是帶標記的,這些標記可以包括資料類別、資料屬性及特徵點位置等。這些標記作為預期效果,不斷修正機器的預測結果。
具體實現過程是:通過大量帶有標記的資料來訓練機器,機器將預測結果與期望結果進行比對;之後根據比對結果來修改模型中的引數,再一次輸出預測結果;然後將預測結果與期望結果進行比對,重複多次直至收斂,最終生成具有一定魯棒性的模型來達到智慧決策的能力。
常見的監督學習有分類和回歸:
-
分類(Classification)是將一些範例資料分到合適的類別中,它的預測結果是離散的。
-
回歸(Regression)是將資料歸到一條“線”上,即為離散資料生產擬合曲線,因此其預測結果是連續的。
無監督學習
無監督學習(Unsupervised Learning)表示機器學習的資料是沒有標記的。機器從無標記的資料中探索並推斷出潛在的聯絡。
常見的無監督學習有聚類和降維。
-
在聚類(Clustering)工作中,由於事先不知道資料類別,因此只能通過分析資料樣本在特徵空間中的分布,例如基於密度或基於統計學概率模型等,從而將不同資料分開,把相似資料聚為一類。
-
降維(Dimensionality Reduction)是將資料的維度降低。例如描述一個西瓜,若只考慮外皮顏色、根蒂、敲聲、紋理、大小及含糖率這6個屬性,則這6個屬性代表了西瓜資料的維度為6。進一步考慮降維的工作,由於資料本身具有龐大的數量和各種屬性特徵,若對全部資料資訊進行分析,將會增加訓練的負擔和儲存空間。因此可以通過主成分分析等其他方法,考慮主要影響因素,捨棄次要因素,從而平衡準確度與效率。
強化學習
強化學習(Reinforcement Learning)是帶有激勵機制的,具體來說,如果機器行動正確,將施予一定的“正激勵”;如果行動錯誤,同樣會給出一個懲罰(也可稱為“負激勵”)。因此在這種情況下,機器將會考慮如何在一個環境中行動才能達到激勵的最大化,具有一定的動態規劃思想。
例如在貪吃蛇遊戲中,貪吃蛇需要通過不斷吃到“食物”來加分。為了不斷提高分數,貪吃蛇需要考慮在自身位置上如何轉向才能吃到“食物”,這種學習過程便可理解為一種強化學習。
強化學習最為火熱的一個應用就是谷歌 AlphaGo 的升級品——AlphaGo Zero。相較於 AlphaGo,AlphaGo Zero 捨棄了先驗知識,不再需要人為設計特徵,直接將棋盤上黑、白棋子的擺放情況作為原始資料輸入到模型中,機器使用強化學習來自我博弈,不斷提升自己從而最終出色完成下棋任務。AlphaGo Zero 的成功,證明了在沒有人類的經驗和指導下,深度強化學習依然能夠出色地完成指定任務。
深度學習
我們要想具有更強的智慧,除了擁有大量的資料以外還要有好的經驗總結方法。深度學習就是一種實現這種機器學習的優秀技術。深度學習本身是神經網路演算法的衍生。
作為深度學習父類別的機器學習,是人工智慧的核心,它屬於人工智慧的一個分支。
深度學習是新興的機器學習研究領域,旨在研究如何從資料中自動地提取多層特徵表示,其核心思想是通過資料驅動的方式,採用一系列的非線性變換,從原始資料中提取由低層到高層、由具體到抽象、由一般到特定語意的特徵。
深度學習不僅改變著傳統的機器學習方法,也影響著人類感知的理解,迄今已在語音識別、影象理解、自然語言處理和視訊推薦等應用領域引發了突破性的變革。