Python Numpy 切片和索引(高階索引、布林索引、花式索引)

2023-05-16 12:00:39

張量(Tensor)、標量(scalar)、向量(vector)、矩陣(matrix)
Python Numpy 切片和索引(高階索引、布林索引、花式索引)
Python NumPy 廣播(Broadcast)

NumPy(Numerical Python) 是 Python 語言的一個擴充套件程式庫,支援大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數學函數庫。
NumPy 是一個執行速度非常快的數學庫,主要用於陣列計算,包含:

  • 一個強大的N維陣列物件 ndarray
  • 廣播功能函數
  • 整合 C/C++/Fortran 程式碼的工具
  • 線性代數、傅立葉變換、亂數生成等功能

NumPy 應用

NumPy 通常與 SciPy(Scientific Python)和 Matplotlib(繪相簿)一起使用, 這種組合廣泛用於替代 MatLab,是一個強大的科學計算環境,有助於我們通過 Python 學習資料科學或者機器學習。
SciPy 是一個開源的 Python 演演算法庫和數學工具包。
SciPy 包含的模組有最佳化、線性代數、積分、插值、特殊函數、快速傅立葉變換、訊號處理和影象處理、常微分方程求解和其他科學與工程中常用的計算。
Matplotlib 是 Python 程式語言及其數值數學擴充套件包 NumPy 的視覺化操作介面。它為利用通用的圖形化使用者介面工具包,如 Tkinter, wxPython, Qt 或 GTK+ 嚮應用程式嵌入式繪圖提供了應用程式介面(API)。

切片和索引

arr[x][y] = arr[x,y] 兩種表達方式

import numpy as np

arr = np.arange(21)  # arange() 函數建立 ndarray 物件
# arr = arr.reshape(3, 7)
arr.shape = (3, 7)
'''
[[ 0  1  2  3  4  5  6]
 [ 7  8  9 10 11 12 13]
 [14 15 16 17 18 19 20]]
'''
print(arr)
print('\n')
'''
arr[x][y] = arr[x,y]  兩種表達方式
冒號 : 的解釋:如果只放置一個引數,
如 [2],將返回與該索引相對應的單個元素。
如 [2:],表示從該索引開始以後的所有項都將被提取。如果使用了兩個引數,
如 [2:7],那麼則提取兩個索引(不包括停止索引)之間的項。
'''
print('arr[1:2] =>', arr[1:2])  # 【1~2] 行,右側不包含,列全部顯示 => [[ 7  8  9 10 11 12 13]]
print('arr[1:] =>', arr[1:])  # 1 行開始,剩下的全部顯示,列全部顯示 => [[ 7  8  9 10 11 12 13] [14 15 16 17 18 19 20]]
print('arr[:2] =>', arr[:2])  # 取前面兩行資料 [[ 0  1  2  3  4  5  6] [ 7  8  9 10 11 12 13]]
print('arr[2][1:6:2] =>', arr[2][1:6:2])  # start:stop:step => 第2行,1~6列,步長2(預設為1)   [15 17 19]
print('arr[2, 1:6:2] =>', arr[2, 1:6:2])  # start:stop:step => 第2行,1~6列,步長2(預設為1)   [15 17 19]
print('arr[:2, 1:6:2] =>', arr[:2, 1:6:2])  # start:stop:step => 前2行,1~6列,步長2(預設為1) [[ 1  3  5] [ 8 10 12]]
print('\n')
'''
切片還可以包括省略號 … ,來使選擇元組的長度與陣列的維度相同。 如果在行位置使用省略號,它將返回包含行中元素的 ndarray。
'''
print('arr[1] => ', arr[1])  # 1行,所有列資料 [ 7  8  9 10 11 12 13]
print('arr[1, ...] => ', arr[1, ...])  # 1行,所有列資料 [ 7  8  9 10 11 12 13]
print('arr[..., 3] => ', arr[..., 3])  # 所有行,第3列資料 [ 3 10 17]
print('arr[1] => ', arr[..., 2:])  # 所有行 第3列及剩下的所有元素
print('\n')

高階索引

NumPy 中的高階索引指的是使用整數陣列、布林陣列或者其他序列來存取陣列的元素。相比於基本索引,高階索引可以存取到陣列中的任意元素,並且可以用來對陣列進行復雜的操作和修改。

import numpy as np

arr = np.arange(21)  # arange() 函數建立 ndarray 物件
# arr = arr.reshape(3, 7)
arr.shape = (3, 7)
'''
[[ 0  1  2  3  4  5  6]
 [ 7  8  9 10 11 12 13]
 [14 15 16 17 18 19 20]]
'''
print(arr)
print('\n')
'''
高階索引
'''
# 整數陣列索引是指使用一個陣列來存取另一個陣列的元素。這個陣列中的每個元素都是目標陣列中某個維度上的索引值。
print('arr[[0, 1, 2], [2, 1, 3]] => ', arr[[0, 1, 2], [2, 1, 3]])  # [0,2]、【1,1】、[2,3] => [ 2  8 17]
rows = np.array([[0, 1], [2, 1], [1, 0]])
cols = np.array([[2, 1], [3, 2], [0, 2]])
'''
0,2  1,1
2,3  1,2
1,0  0,2
'''
print('arr[rows, cols] => ', arr[rows, cols])  # [[ 2  8] [17  9] [7  2]]
print('\n')
'''
可以藉助切片 : 或 … 與索引陣列組合。
'''
print('arr[1:3, 1:4] => ', arr[1:3, 1:4])  # [[ 8  9 10] [15 16 17]]
print('arr[1:3, [1, 4]] => ', arr[1:3, [1, 4]])  # [[ 8 11] [15 18]]
'''
[[ 0  1  2  3  4  5  6]
 [ 7  8  9 10 11 12 13]
 [14 15 16 17 18 19 20]]
'''
print('arr[..., 1:] => ', arr[..., 1:])  # [[ 1  2  3  4  5  6] [ 8  9 10 11 12 13] [15 16 17 18 19 20]]

布林索引

我們可以通過一個布林陣列來索引目標陣列。
布林索引通過布林運算(如:比較運運算元)來獲取符合指定條件的元素的陣列。

import numpy as np

arr = np.arange(21)  # arange() 函數建立 ndarray 物件
# arr = arr.reshape(3, 7)
arr.shape = (3, 7)
'''
[[ 0  1  2  3  4  5  6]
 [ 7  8  9 10 11 12 13]
 [14 15 16 17 18 19 20]]
'''
print(arr)
print('\n')

'''
獲取大於 5 的元素
'''
print('arr[arr > 5]', arr[arr > 5])  # [ 6  7  8  9 10 11 12 13 14 15 16 17 18 19 20]

'''
~(取補運運算元)來過濾NaN。
'''
arr = np.array([np.nan, 1, 2, np.nan, 3, 4, 5])
print('arr[~np.isnan(a)]', arr[~np.isnan(arr)])  # [1. 2. 3. 4. 5.]
'''
從陣列中過濾掉非複數元素。
'''
arr = np.array([1, 2 + 6j, 5, 3.5 + 5j])
print('arr[np.iscomplex(arr)]', arr[np.iscomplex(arr)])  # [2. +6.j 3.5+5.j]


花式索引

花式索引指的是利用整數陣列進行索引。
花式索引根據索引陣列的值作為目標陣列的某個軸的下標來取值。
對於使用一維整型陣列作為索引,如果目標是一維陣列,那麼索引的結果就是對應位置的元素,如果目標是二維陣列,那麼就是對應下標的行。
花式索引跟切片不一樣,它總是將資料複製到新陣列中。

一維陣列

一維陣列只有一個軸 axis = 0,所以一維陣列就在 axis = 0 這個軸上取值:

import numpy as np

x = np.arange(9) # [0 1 2 3 4 5 6 7 8]
print(x)
# 一維陣列讀取指定下標對應的元素
print("-------讀取下標對應的元素-------")
x2 = x[[0, 6]] # 使用花式索引
print(x2) # [0 6]

print(x2[0]) # 0
print(x2[1]) # 6

二維陣列

import numpy as np

arr = np.arange(21)  # arange() 函數建立 ndarray 物件
# arr = arr.reshape(3, 7)
arr.shape = (3, 7)
'''
[[ 0  1  2  3  4  5  6]
 [ 7  8  9 10 11 12 13]
 [14 15 16 17 18 19 20]]
'''
print(arr)
print('\n')

print('arr[1, [0, 2]] => ', arr[1, [0, 2]])  # [7 9]
print('arr[[0, 2], 1] => ', arr[[0, 2], 1])  # [ 1 15]
print('arr[[0, 2]] => ', arr[[0, 2]])  # [[ 0  1  2  3  4  5  6] [14 15 16 17 18 19 20]]
# 傳入順序索引陣列
print('arr[[2,0,1]] => ', arr[[2, 0, 1]])  # [[14 15 16 17 18 19 20] [ 0  1  2  3  4  5  6] [ 7  8  9 10 11 12 13]]

# 傳入倒序索引陣列
print('arr[[-2,-0,-1]] => ', arr[[-2, -0, -1]])  # [[ 7  8  9 10 11 12 13] [ 0  1  2  3  4  5  6] [14 15 16 17 18 19 20]]
# 傳入多個索引陣列(要使用 np.ix_)
'''
np.ix_ 函數就是輸入兩個陣列,產生笛卡爾積的對映關係。
笛卡爾乘積是指在數學中,兩個集合 X 和 Y 的笛卡爾積(Cartesian product),又稱直積,表示為 X×Y,第一個物件是X的成員而第二個物件是 Y 的所有可能有序對的其中一個成員。
例如 A={a,b}, B={0,1,2},則:
A×B={(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)}
B×A={(0, a), (0, b), (1, a), (1, b), (2, a), (2, b)}

[1, 0, 2, 1], [0, 3, 1, 2] => (1,0),(1,3),(1,1),(1,2),(0,0),(0,3),(0,1),(0,2)....
'''
print('arr[np.ix_([1,5,7,2],[0,3,1,2])] => ', arr[np.ix_([1, 0, 2, 1], [0, 3, 1, 2])])  # [[ 7 10  8  9] [ 0  3  1  2] [14 17 15 16] [7 10  8  9]]

相關連結

NumPy 官網 http://www.numpy.org/
NumPy 原始碼:https://github.com/numpy/numpy
SciPy 官網:https://www.scipy.org/
SciPy 原始碼:https://github.com/scipy/scipy
Matplotlib 教學:Matplotlib 教學
Matplotlib 官網:https://matplotlib.org/
Matplotlib 原始碼:https://github.com/matplotlib/matplotlib