機器到底是如何學習的？

機器學習這個名字有點妨礙人們理解，改成“統計模型訓練”其實更加貼切。因為機器學習的過程不是讓機器蹲在小板凳上讀書識字，而是更接近於馬戲團裡的動物訓練。

我們都看過馬戲表演，各種動物根據訓練員的指示，或者踢球或者跳舞，十分有趣。但不妨深入考慮一下：畢竟“動物語”只有哈利·波特這樣的巫師才能掌握，我們一般無法與動物直接溝通，那麼訓練員是怎樣做到與動物配合無間的呢？

具體過程很複雜，但說起來很簡單，就是利用反饋激勵機制。

譬如訓練海豹，訓練員給海豹一個信號要它拍手，最開始海豹當然不知道要做什麼，它可能做出各種動作，如點頭、扭動身體，但只要它無意中做出了拍手的動作，訓練員就會獎勵它一條小魚。海豹希望吃到小魚，但它沒有那麼聰明，無法立即明白聽到信號只要拍手就能吃小魚，需要訓練員花費大量的時間，不斷給它反饋。久而久之，海豹形成了條件反射，聽到信號就拍手，訓練就成功了。