機器學習這個名字有點妨礙人們理解,改成“統計模型訓練”其實更加貼切。因為機器學習的過程不是讓機器蹲在小板凳上讀書識字,而是更接近於馬戲團裡的動物訓練。
我們都看過馬戲表演,各種動物根據訓練員的指示,或者踢球或者跳舞,十分有趣。但不妨深入考慮一下:畢竟“動物語”只有哈利·波特這樣的巫師才能掌握,我們一般無法與動物直接溝通,那麼訓練員是怎樣做到與動物配合無間的呢?
具體過程很複雜,但說起來很簡單,就是利用反饋激勵機制。
譬如訓練海豹,訓練員給海豹一個信號要它拍手,最開始海豹當然不知道要做什麼,它可能做出各種動作,如點頭、扭動身體,但只要它無意中做出了拍手的動作,訓練員就會獎勵它一條小魚。海豹希望吃到小魚,但它沒有那麼聰明,無法立即明白聽到信號只要拍手就能吃小魚,需要訓練員花費大量的時間,不斷給它反饋。久而久之,海豹形成了條件反射,聽到信號就拍手,訓練就成功了。