夢想橡皮擦:接到一個新的小任務,爬取新浪微博熱搜之後,定時傳送到指定郵箱,還不錯,不會耗費太長時間,感恩的心~
微博熱搜對於很多練習爬蟲編寫的人來說,都是必爬資料之一,畢竟熱搜是我們每天談資的主要來源地,而且頁面也比較規矩,資料量也不大,沒那麼多的反爬手段。50條資料,每天早上爬取一遍,傳送到指定郵箱即可~
當看到原始碼是表格的時候,我差點把pandas又給拿過來,不過想想還是算了,我們換個稍微新鮮那麼一點的東西吧。
本文涉及到三個模組,第一個requests
模組,爬取模組;第二個BeautifulSoup
模組,網頁解析;第三個smtplib
郵件傳輸協定模組,除此之外還有一個和smtplib
配合的模組–email
模組,主要用於格式化郵件內容。