PyTorch Convents簡介


Convents就是從 scratch 構建CNN模型。網路架構將包含以下步驟的組合 -

  • Conv2d
  • MaxPool2d
  • 整流線性單元
  • 檢視
  • 線性層

訓練模型

訓練模型與影象分類問題相同。以下程式碼段完成了對提供的資料集的訓練模型的過程 -

def fit(epoch,model,data_loader,phase 
= 'training',volatile = False):
   if phase == 'training':
      model.train()
   if phase == 'training':
      model.train()
   if phase == 'validation':
      model.eval()
   volatile=True
   running_loss = 0.0
   running_correct = 0
   for batch_idx , (data,target) in enumerate(data_loader):
      if is_cuda:
         data,target = data.cuda(),target.cuda()
         data , target = Variable(data,volatile),Variable(target)
      if phase == 'training':
         optimizer.zero_grad()
         output = model(data)
         loss = F.nll_loss(output,target)
         running_loss + = 
         F.nll_loss(output,target,size_average = 
         False).data[0]
         preds = output.data.max(dim = 1,keepdim = True)[1]
         running_correct + = 
         preds.eq(target.data.view_as(preds)).cpu().sum()
         if phase == 'training':
            loss.backward()
            optimizer.step()
   loss = running_loss/len(data_loader.dataset)
   accuracy = 100. * running_correct/len(data_loader.dataset)
   print(f'{phase} loss is {loss:{5}.{2}} and {phase} accuracy is {running_correct}/{len(data_loader.dataset)}{accuracy:{return loss,accuracy}}')

此方法包括用於訓練和驗證的不同邏輯。使用不同模式有兩個主要原因 -

  • 在訓練模式中,丟失會刪除一定百分比的值,這在驗證或測試階段不應發生。
  • 對於訓練模式,計算梯度並更改模型的引數值,但在測試或驗證階段不需要反向傳播。