前言:由於懶、沒時間、也沒啥技術也不太會表達,好久沒寫部落格了,但一直聽說Python有多厲害的,爬蟲有多厲害的,而我沒玩過,也不太清楚是個啥,搞得我很好奇,很早就想玩玩她了,所以最近學習了一下Python,還好由於我有一些JAVA的基礎,感覺也不是很難,還是比較容易理解的,也算是入門了吧,話不多說,盤她~~
首先,解析下Python和爬蟲(以我的理解,具體的請百度):
Python:一種開發語言,有點神奇,有點簡單粗暴,基本語法類似於JAVA,C,C++吧!!!
爬蟲:就是爬取網頁等請求得到的資料,具體是請求網頁URL得到網頁的HTML,分析HTML,得到想要的資料,然後想幹啥就幹啥啦!!!
一、爬蟲步驟:
(1)明確目的
(2)找到資料對應的網頁
(3)分析網頁的結構找到資料所在的標籤位置
(4)模擬HTTP請求,向伺服器傳送請求獲取到伺服器返回給我們的HTML
(5)用正規表示式提取我們要的資料
(6)分析、精煉、展示