Scrapy是什麼?
Scrapy是使用
Python編寫的一個快速開源Web抓取框架,使用基於XPath選擇器來提取網頁中的資料。
歷史
Scrapy最初是在 2008年6月26日在BSD許可協定下發布,並在2015年6月發布的一個里程碑版本1.0。
為什麼要使用Scrapy?
Scrapy的特點
優點
-
Scrapy很容易擴充套件,快速和功能強大;
-
這是一個跨平台應用程式框架(在Windows,Linux,Mac OS和BSD)。
-
Scrapy請求排程和非同步處理;
-
Scrapy附帶了一個名為Scrapyd的內建服務,它允許使用JSON Web服務上傳專案和控制蜘蛛。
-
也能夠刮削任何網站,即使該網站不具有原始資料存取API;
缺點
-
Scrapy只面向Python2.7+以上版本;
-
不同的作業系統安裝不太相同;