機器學習基礎


人工智慧(AI)是使計算機模擬人類認知行為或智力的任何程式碼,演算法或技術。 機器學習(ML)是AI的一個子集,它使用統計方法使機器學習和改進經驗。 深度學習是機器學習的一個子集,它使得多層神經網路的計算變得可行。 機器學習被視為淺層學習,而深度學習被視為具有抽象的層次學習。

機器學習涉及廣泛的概念。 這些概念如下 -

  • 監督
  • 無監督
  • 強化學習
  • 線性回歸
  • 成本功能
  • 過度擬合
  • 根據擬合
  • 超引數等

在監督學習中,我們學習從標記資料預測值。 一種叫作ML的技術可以幫助分類,其中目標值是離散值; 例如,貓和狗。 機器學習中的另一個可能有用的技術是回歸。 回歸對目標值起作用。 目標值是連續值; 例如,可以使用迴歸分析股票市場資料。

在無監督學習中,我們根據未標註或結構化的輸入資料進行推理。 如果我們有一百萬條醫療記錄,並且我們必須理解它,找到潛在的結構,異常值或檢測異常,我們使用聚類技術將資料劃分為大叢集。

資料集分為訓練集,測試集,驗證集等。

2012年的突破帶來了深度學習的概念突出。 演算法使用2個GPU和巨量資料等最新技術成功將100萬個影象分為1000個類別。

關於深度學習和傳統機器學習

傳統機器學習模型遇到的一個主要挑戰是一個稱為特徵提取的過程。 程式員需要具體,並告訴計算機要查詢的功能。 這些功能將有助於做出決定。

將原始資料輸入演算法很少有效,因此特徵提取是傳統機器學習工作流程的關鍵部分。

這給程式員帶來了很大的責任,演算法的效率在很大程度上依賴於程式員的創造性。 對於複雜的問題,如物件識別或手寫識別,這是一個很大的問題。

深度學習能夠學習多層表示,是幫助我們進行自動特徵提取的少數幾種方法之一。 較低層可以被假定為執行自動特徵提取,而幾乎不需要程式員的指導。