神經網路數學構建模組


數學在任何機器學習演算法中都是至關重要的,並且包括各種核心數學概念,以便以特定方式設計正確的演算法。

下面提到了數學對機器學習和資料科學的重要性 -

數學相當

現在,讓我們來看看機器學習中的主要數學概念,從自然語言處理的角度來看這數學概念很重要 -

向量

向量(Vector)是連續或離散的數位陣列,由向量組成的空間稱為向量空間。向量的空間維度可以是有限的也可以是無限的,但機器學習和資料科學問題涉及固定長度向量。

向量表示顯示如下 -

temp = torch.FloatTensor([23,24,24.5,26,27.2,23.0])
temp.size()
#Output - torch.Size([6])

在機器學習中,經常要處理多維資料。因此,向量變得非常關鍵,並且被視為任何預測問題陳述的輸入特徵。

標量

標量(Scalar)是一個零維度,只包含一個值。在PyTorch中,它不包括零維度的特殊張量; 因此宣告將如下 -

x = torch.rand(10)
x.size()
# Output - torch.Size([10])

矩陣

大多數結構化資料通常以表格或特定矩陣的形式表示。下面將使用一個名為Boston House Prices的資料集,該資料集可以在Python scikit-learn機器學習庫中找到。

boston_tensor = torch.from_numpy(boston.data)
boston_tensor.size()

#Output: torch.Size([506, 13])

boston_tensor[:2]

# Output:
# Columns 0 to 7
# 0.0063 18.0000 2.3100 0.0000 0.5380 6.5750 65.2000 4.0900
# 0.0273 0.0000 7.0700 0.0000 0.4690 6.4210 78.9000 4.9671
# Columns 8 to 12
# 1.0000 296.0000 15.3000 396.9000 4.9800
# 2.0000 242.0000 17.8000 396.9000 9.1400