PyTorch載入資料


PyTorch包含一個名為torchvision的包,用於載入和準備資料集。它包括兩個基本功能,即DatasetDataLoader,它們有助於資料集的轉換和載入。

資料集

資料集用於從給定資料集讀取和轉換資料點。實現的基本語法如下所述 -

trainset = torchvision.datasets.CIFAR10(root = './data', train = True,
   download = True, transform = transform)

DataLoader用於隨機播放和批次處理資料。它可用於與多處理工作程式並行載入資料。

trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4,
   shuffle = True, num_workers = 2)

範例:載入CSV檔案

使用Python包Panda來載入csv檔案。原始檔案具有以下格式:(影象名稱,68個標記 - 每個標記具有xy坐標)。

landmarks_frame = pd.read_csv('faces/face_landmarks.csv')

n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].as_matrix()
landmarks = landmarks.astype('float').reshape(-1, 2)