Scrapy定義專案


專案是用於收集從網站刮取下資料的容器。 在啟動蜘蛛時必須要定義專案。 要定義專案,在目錄 first_scrapy自定義目錄下找到編輯items.py檔案。items.py 看起來如下所示:

import scrapy

class First_scrapyItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()

MyItem 類包含一個數位,scrapy已為我們建成預先定義的物件繼承專案。舉例來說,如果想從網站中提取名稱,URL和說明, 需要定義欄位這三個屬性。
因此,讓我們再補充一點,來收集這些專案:

from scrapy.item import Item, Field

class First_scrapyItem(scrapy.Item):
    name = scrapy.Field()
    url = scrapy.Field()
    desc = scrapy.Field()