在本章中,將更多地關注torchvision.datasets
及其各種型別。PyTorch包括以下資料集載入器 -
資料集包括以下兩種函式 -
transform
- 一種接收影象並返回標準內容的修改版本的函式。這些可以與變換一起組合。target_transform
- 獲取目標並對其進行轉換的函式。例如,接受標題字串並返回索引張量。以下是MNIST資料集的範例程式碼 -
dset.MNIST(root, train = TRUE, transform = NONE,
target_transform = None, download = FALSE)
引數如下 -
root
- 存在已處理資料的資料集的根目錄。train
- True
=訓練集,False
=測試集download
- True
=從網際網路下載資料集並將其放入根目錄。需要安裝COCO API。以下範例用於演示使用PyTorch的資料集的COCO實現 -
import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ' dir where images are', annFile = 'json annotation file', transform = transforms.ToTensor())
print('Number of samples: ', len(cap))
print(target)
上面程式程式碼輸出結果如下:
Number of samples: 82783
Image Size: (3L, 427L, 640L)