點贊再看,養成習慣,微信公眾號搜尋【JackCui-AI】關注這個愛發技術乾貨的程式設計師。本文 GitHub https://github.com/Jack-Cherish/PythonPark 已收錄,有一線大廠面試完整考點、資料以及我的系列文章。
各位十一過得如何?
假期,我回了趟老家,文章停更了幾天。
寫文章以來,被問到最多的問題就是「演演算法的學習路線」。
今天,它來了。
我會帶著大家看看,我們需要學些啥,利用這個假期,我甚至還收集整理了配套視訊和資料,暖男石錘啊,這期文章有用的話,別忘三連哦!
主要分為 4 個部分:數學基礎、程式設計能力、演演算法基礎、實戰。
在機器學習演演算法中,涉及到最為重要的數學基本知識有兩個:線性代數和概率論。
這兩也是大學的必修課了,如果知識早已還給老師,也沒關係,哪裡不會學補哪裡。
線性代數研究的是線性空間的性質,資料通常會被表示為歐式空間中的點,而這些點經過一系列變換後會對映到另一個空間,在新的空間中隱藏在資料中的規律才得以顯現。
所以線性代數作為研究空間的一門科學,是入門機器學習的最要基礎之一。
視訊:推薦 MIT 的老教授 Gilbert Strang 的線性代數上課視訊。
沒學過線代的同學會發現這門課程,講得清晰而且直觀,深入線代的精髓,完全不是那種理論堆砌的講法,而且老教授幽默風趣,很有人格魅力。
英文不好,也不用擔心,字幕是中文的。
教材:推薦《線性代數及其應用》,作者是 David C. Lay 。
喜歡看書的朋友,這本書一定不能錯過。
這本書詳細地介紹了線性代數在幾何學、計算機圖學、經濟學、概率論、訊號與系統、微分方程等領域的應用,給人以直觀的認識。
概率論是研究不確定性的一門科學,生活處處是概率。機器學習演演算法需要對現實情況建模,自然是少不了將概率論作為工具。
這門課入門並不難,大家可以挑一本評分還可以的書開始學習。
這裡推薦陳希儒的《概率論與數理統計》,講得很詳細,如同聽一個老者回憶自己的概率與統計心得,相信讀者也會有所收穫。
如果時間充裕,推薦先學好數學基礎。如果時間不夠,那就跳過數學基礎部分,學演演算法的時候,哪裡不會補哪裡。
程式語言,需要至少掌握兩門, Python 和 C++。
工作中,Python 主要用於處理資料、演演算法調研、模型訓練的工作,而 C++ 則是負責工程落地。
演演算法工程師,需要針對落地場景,對演演算法的可靠性和實時性等方面進行優化,C++ 工程能力必不可少。
Python 是一門非常友好的程式語言,不但易於入門而且功能強大,在進行機器學習演演算法開發的過程中會大量使用 Python。
視訊:我上學看的第一個視訊,就是小甲魚 Python 課程,風趣幽默,涉及Python 語法基礎、網路爬蟲、Pygame 飛機大戰等內容,內容很豐富。
實戰是最好的老師,學習 Python 的時候,可以找一個自己喜歡的方向,去實戰。
邊實戰,邊學習。比如寫爬蟲、做小遊戲、玩各種有趣的演演算法等。
這裡面,爬蟲是最簡單的,很容易有成就感,讓你堅持學習下去,下載小說、下載漫畫、下載音樂、下載電影、搶票等等小程式。
這個推薦我的一個 Github star 量 11.4k+、fork 4.5k+的爬蟲專案。
每個實戰,都有對應的文章教學,程式碼開源。
專案地址:https://github.com/Jack-Cherish/python-spider
教材:推薦《流暢的Python》,書看完有些難度,但是哪來當個手冊用,很方便,哪些語法忘記了,翻閱一番,必能有所收穫。
C++ 是一種物件導向的程式設計語言,無論你是做演演算法,還是做開發,亦或者是做測開。C++ 都應該掌握,它是一個基礎的程式語言。學會了這門程式語言,再學其它,就會更得心應手。
視訊:這部分推薦慕課網的免費教學,很好的入門視訊,老師講得繪聲繪色、形象生動、通熟易懂。
一共分為 7 章,每章視訊的時間是 2-3 個小時,半個月可以輕鬆刷完,學習順序是:
教材:推薦被譽為「聖經」的《C++ Primer》,經典鉅著,非常棒的書。
程式語言基礎學完了,接下來就是資料結構與演演算法。
資料結構與演演算法是程式設計師的內功,每一個工程師的必修課。
資料結構的學法,我推薦是直接看書,一邊學習一邊刷題,同時進行,這樣學的速度快。
就如同書名一樣,這是一本像小說一樣有趣的演演算法入門書,非常易懂,強烈推薦。
可以與這本書一同學習的,就是《劍指Offer》,裡面講解了 66 道+ 常見資料結構題,解析思路,簡單易懂。
兩門書一起看,輕鬆入門資料結構與演演算法。
不過《劍指Offer》講解的程式碼都是 C/C++,沒有 Python 版本,想看 Python 版本的,可以看我整理的教學,C++ 和 Python 都有實現和講解,題目已按照型別劃分好。
專案地址:https://github.com/Jack-Cherish/LeetCode
兩本書都看完,題也刷完了,那就算是入門了。
想進階,進一步學習,直接上 LeetCode。
力扣可以從 HOT 100 或 精選演演算法 200 題刷起,題目相對於《劍指Offer》要增加一些難度,但每道題目都有對應的解題思路和答案。
堅持刷完 200 道,大多的面試輕鬆搞定,完全夠用。
當然要面試谷歌級別的大佬,Hard 題是不能放過的。
Tip:刷一遍題,回頭看還會忘,不要懷疑自己,要反覆刷,反覆練習。
恭喜大家,在做了前面這麼多基礎工作之後,終於可以開始入門機器學習演演算法了。
機器學習:
視訊:推薦吳恩達老師的機器學習視訊,吳恩達是整個領域的巨頭之一,學術地位很高。同時,他出的視訊也對新手非常友好,入門的不二之選。
教材:還是那句話,光看不練是不行的。《機器學習實戰》,理論結合實戰,適合新手。
《機器學習實戰》使用 Python2 實現,有些細節講的不夠細緻,對此我進行了完善,使用 Python3 復現了一遍,並結合 sklearn 以及更多的好玩例子,進行講解。
全網閱讀量 500w+:
對應的 Github 開原始碼 Star 3.3k+,fork 3.1k+。
線上閱讀地址:
https://cuijiahua.com/blog/ml/
我也將這個系列打包成了本地 pdf,喜歡離線看,也可以直接下載。
深度學習:
深度學習是現在的演演算法工程師繞不開的一個子領域,是機器學習的子集。
視訊:還是推薦吳恩達老師的深度學習視訊,也是對新手非常友好。
教材:說實話,深度學習,我並沒有看過書,都是視訊+ Github 開源專案學習的,不過被譽為深度學習領域聖經的「花書」,可以備一本。
深度學習框架:
深度學習框架有很多,Tensorflow、Pytorch、Paddle、MXNet、Caffe等。
我在工作過程中,用的最多的是 Pytorch,其次是 Tensorflow。
新手上手,推薦先學 Pytorch,可以直接看 Yunjey Choi 大佬的 Github 教學,簡單入門:
專案地址:
https://github.com/yunjey/pytorch-tutorial
Pytorch 深度學習框架學習,也可以看我寫的 Pytorch 深度學習實戰系列教學,有垃圾分類、影象分割等結合實戰的小專案。
Github 開原始碼 Star 400+,fork 250+。
專案地址:
https://github.com/Jack-Cherish/Deep-Learning
我也將這個系列打包成了本地 pdf,喜歡離線看,也可以直接下載。
實戰實戰,文章反覆提到了這麼多次,僅僅這些還是遠遠不夠的。
因為更多時候,你是跟著視訊 or 文章的思路去實戰,這缺少了獨立思考的過程。
學了這麼多,你並沒有獨立完成過一個專案,資料怎麼處理,怎麼分析問題,用什麼演演算法解決問題,也沒有獨立思考過。
演演算法工程師的崗位競爭也比較激烈的,為了在茫茫人海中脫穎而出,我們需要以團隊或個人的形式,獨立完成一些專案,只有這樣,你才能更具競爭力。
對於學生黨,做專案,最簡單直接的方法就是參加競賽。
推薦兩個參加競賽的地方,一個是國外的 Kaggle,另一個是國內的阿里雲天池。
兩個競賽的獎金也都很豐富,根據自己的喜好,參賽即可。
Kaggle:https://www.kaggle.com/
阿里天池:https://tianchi.aliyun.com/competition/gameList/activeList
既能打比賽,又能贏獎金,何樂而不為呢?
本文提到的資料,我都打包了,可以直接全部打包帶走。
這裡都是我精心準備點的資料,但是都是外連,CSDN官方提醒這種分享方式也不太合適。
所以大家,需要的話,可以在公眾號後臺回覆【演演算法學習路線】獲取下載地址。
PS:有能力支援正版的,資料覺得不錯,可以去購買支援一波正版。
這篇文章整理的也是我的學習路線。
要說需要學多久,那就看個人的學習動力了。
如果你想去一家不錯的公司,但是目前硬實力不過關,我覺得還是有必要去努力一下的,技術能力的高低決定你能走多遠,平臺的高低,決定你能飛多高。
如果可以通過自己的努力,進入自己心儀的公司,一定不要鬆懈怠慢,職場成長和學習新技術一樣,不進則退。
你往往會發現,身邊實力越強的人越努力,最高階的自律就是享受孤獨。
創作不易,本期硬核,各位的三連就是 Jack Cui 創作的最大動力,我們下次見!
文章持續更新,可以微信公眾號搜尋【JackCui-AI】第一時間閱讀,本文 GitHub https://github.com/Jack-Cherish/PythonPark 已經收錄,有大廠面試完整考點,歡迎Star。