專案是用於收集從網站刮取下資料的容器。 在啟動蜘蛛時必須要定義專案。 要定義專案,在目錄 first_scrapy自定義目錄下找到編輯items.py檔案。items.py 看起來如下所示:
import scrapy
class First_scrapyItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
MyItem 類包含一個數位,scrapy已為我們建成預先定義的物件繼承專案。舉例來說,如果想從網站中提取名稱,URL和說明, 需要定義欄位這三個屬性。
因此,讓我們再補充一點,來收集這些專案:
from scrapy.item import Item, Field
class First_scrapyItem(scrapy.Item):
name = scrapy.Field()
url = scrapy.Field()
desc = scrapy.Field()