箱線圖是資料集中資料分布情況的一種度量。 它將資料集劃分為三個四分位數。 該圖表示資料集中的最小值,最大值,中位數,第一四分位數和第三四分位數。 通過為每個資料集繪製箱形圖來比較跨資料集的資料分布也很有用。
Boxplot可以繪製呼叫Series.box.plot()
和DataFrame.box.plot()
或DataFrame.boxplot()
以視覺化每列中值的分布。
例如,這裡是一個箱形圖,表示對[0,1)上的統一隨機變數的10
次觀察的五次試驗。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box(grid='True')
執行上面範例程式碼,得到以下結果 -