深度學習 計算機視覺成長競賽路線

2020-10-05 12:00:09

摘要

簡單的分享一下我自己的學習路線。可以參考未必適合所有人。我個人更傾向於用知識去參加競賽博取獎金。那麼該如何入門在到成長為競賽達人。

掌握基礎語言python

我從python到全部學習能夠輕鬆參加各類競賽差不多需要一年的時間磨練。在此之前有較好的掌握c。c++。能用程式碼輕鬆表達自己想要的目的。用自己的邏輯方式去寫程式碼還是一件比較有意思的事情。學習python也是比較簡單,一週的時間差不多就能掌握基礎語法。學習python語言是很容易,最重要的是邏輯思維能力。是初學程式碼需要長時間的程式碼磨礪去鍛鍊的。基礎學習可以去bilibili參考莫煩python。
掌握python基礎語言就可以去學習《利用python進行資料分析》這本書、最重要的是三大庫的學習。numpy,pandas,matplotlib庫的使用。記住numpy中的各種資料轉化,這個很有用。可以做到將numpy中任何的資料提取出來轉化成任何的輸出格式(比賽提交格式)。將我推薦的這本書仔細從頭到尾敲一遍就差不多了。等需要的時候在專門記憶各種函數功能。

機器學習基礎

入門cv的話其實不需要全部學完。本科階段想以最快的方式去參加競賽可以跳過很多學習內容。重點是掌握線性迴歸,邏輯迴歸。神經網路這三章。學會公式推導。python寫出來也是需要幾周的時間,參考書籍周志華的西瓜書和《機器學習實戰》。同時要參考bilibili上機器學習-白板推導系列。用python程式碼敲打練習的時候一定要每一行輸出看看,感受資料經過每一行程式碼中的變化。尤其是神經網路。這個雖是入門深度學習的基礎。但很重要。我自己對深度學習的認知和感觸就是通過不斷的python練習去感受。通過這部分所得知識就能後在後期的比賽中能夠隱約的去感受猜測大概什麼樣的網路時候這場比賽,什麼樣的資料增強應該能漲分或者降分。可以減少去嘗試的次數。

深度學習

到這一步你就可以學習對影象的處理了,基礎知識當然是opencv的學習。使用python對影象各種操作。這一步一定要理解python讀取影象的各種形式。學習這個目的就是為了在使用深度學習進行資料訓練前的準備和自己寫資料增強部分。bilibili上同樣有很豐富的資源去學習。學習完成之後就可以去學習一門框架來進行深度學習了。pytorch是國內外競賽主流框架。國內目標檢測類比賽基本全是。目前我所參加看到的比賽都是pytorch框架。其次才是tensorflow。二者我都學習過。還是pytorch去書寫程式碼十分方便。學習pytorch框架(百度網路硬碟學習資料)
https://pan.baidu.com/s/1G-szdYfBCKYd0SbmCJwN0w
(密碼1234),這是我個人學習的視訊資料。用來入門還是十分可以的。或者如果你精力比較足的話直接看pytorch官網公佈的各種函數功能。花一個月的時間去學習。

基礎實踐

學會用pytorch去訓練官方設定好的資料集比如minst資料集。這是第一步。很多的csdn上也有很多程式碼可供參考。視訊課中也有講解。這一步是體會使用深度學習進行訓練的過程。大部分電腦還始都可以帶動的。不過最好建議有一臺屬於自己的linux電腦。gpu差不多1080ti(低一點也沒關係,主要是用來跑通偵錯程式碼,不作為主要訓練的機器。但是太低的話電腦壓根無法執行 程式)主要是學習linux環境下設定各種環境。自己一定要獨立完成(比賽都會以各種方式進行提交成績linux必會。不然提交成績你都不行)。

cv方向

國內競賽基本還是目標檢測比較多。其次語意分割也慢慢的開始逐漸多了起來。學習順序應該是目標分類,目標檢測,語意分割(語意分割我是直接跳過的,這裡其實應該先學習語意分割的,難度小於目標檢測)。根據個人情況吧。想最快的接觸比賽就是學習分類,檢測。語意先不學。那麼分類應該學到什麼程度那。第一,你要能夠訓練任何資料集。使用官方下載的minst訓練十分方便,但現實比賽給你的資料都是各種方式,需要你自己去處理的。可以參考我部落格中
資料處理分類

分類

學會載入任何資料集。方便訓練。第二點就是學習各種分類網路。分類網路算是十分好敲的程式碼部分。程式碼難度書寫也比較容易。可以學習各種主流網路去學習。推薦模式看論文,讀原始碼,去github上去找。論文的話最好開著vpn去google直接搜名字就行。敲上10個分類網路模型就差不多。能夠體會到各種網路的差異性。這一步是為自己創新做準備,大部分分類比賽也都是直接用開源的模型直接訓練。只有極少數比賽使用自己創造的模型在kaggle上奪冠。掌握基礎的訓練就可以去研習社去下載和參加分類的比賽。程式碼別人也都會有分享。

檢測

目標檢測學習就相對困難很多。分為單階段檢測器和雙階段檢測器。其中雙階段檢測器自己去學習原始碼的話還是十分困難的。中間有一部分程式碼大都會用的c++寫roipool操作,需要掌握c++和cuda的一些書寫程式碼。所以直接入手單階段檢測器最方面。可以完全有能力復現出來。只有讀懂一個才能會更好的運用。目標檢測的程式碼量也比較龐大。新手剛學習可能需要幾周的時間去讀懂原始碼。學習如何龐大的原始碼就從資料載入,模型構建,訓練,測試,評測map,分開學習。程式碼也是可以單獨構建出來,學習的具體過程我個人更傾向於輸出程式碼執行的每一行,去了解資料在程式碼中的運轉和變化。掌握程式碼之後便要開始訓練比賽資料集了。這裡推薦使用vpn去google colab去訓練,gpu會員是v100,一個月76元,很划算。訓練模型的話可以參考我部落格中yolo系列訓練和最重要的mmdet使用(國內競賽必備)github搜尋mmdetection,專門為競賽而生的目標檢測框架,在colab使用也是十分方便。上傳資料集速度取決於你的vpn。去kaggle,天池,以往的各類目標檢測競賽去學習冠軍的程式碼和思路。這裡就需要自己摸索,比賽新人的話最好在比賽中找人去組隊。大佬一般招新人的要求只有二種,第一,你有很好的裝置,用你的裝置去訓練,第二,同樣精通linux各種環境設定掌握,這裡主要是mmdet使用。可能需要你(docker中設定mmdet,或者其他),知道推理安裝mmdet和自己訓練安裝mmdet是二種過程。有這些知識和裝置基礎你才配當勞動力。

檢測學習技巧

我個人的部落格有詳細的講解retinanet這個單階段目標檢測器,也是最容易復現的,可以直接去github多找幾個版本去學習練習,一定要從頭到尾的搞懂。這是理解目標檢測的關鍵,對網路只會盲目的使用沒有任何意義。一個學習cv的本科生博主可以去了解別人對程式碼的掌握程度,基本所有程式碼自己都敲過一遍,為以後創新模型發頂會打下基礎。總之,學習目標檢測就是硬著頭皮閱讀原始碼,一步一步的學習。熟練之後就可以很容易的去訓練github開源的任何目標檢測框架用於比賽之中。整體學習流程也可以參考我部落格的學習順序。

總結

目標檢測競賽說難也不是很難,多學kaggle關注你所要參加比賽的型別。在kaggle你能學到更多的操作和世界會議舉辦的各種競賽。學習冠軍的原始碼能受益匪淺,運用到國內的競賽也是很容易拿到top的名額。多去關注比賽釋出的資訊,比如微信群cver交流群,會經常推播一些比賽和最新的論文和好的文章供大家學習。最主要剛入手比賽一定要把第一的隊伍加好友,可以問一些問題能夠學到很多東西。大部分也願意教。國內原始碼共用的話可能比較難。大部分不願意共用自己的程式碼,只能自己去厚著臉去要和收集。以上也只是我個人的學習過程和感悟,本科生儘可能的參加競賽,這樣研究生就可以有三年的時間同時參加競賽。我認識的比較厲害選手參加競賽和實習能夠在研究生期間拿到幾十個w。所以往後競賽應該會越來越多,不斷的去積累知識。總會有比賽能夠獲獎的。