Python箱形圖


箱線圖是資料集中資料分布情況的一種度量。 它將資料集劃分為三個四分位數。 該圖表示資料集中的最小值,最大值,中位數,第一四分位數和第三四分位數。 通過為每個資料集繪製箱形圖來比較跨資料集的資料分布也很有用。

繪製箱線圖

Boxplot可以繪製呼叫Series.box.plot()DataFrame.box.plot()DataFrame.boxplot()以視覺化每列中值的分布。

例如,這裡是一個箱形圖,表示對[0,1)上的統一隨機變數的10次觀察的五次試驗。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box(grid='True')

執行上面範例程式碼,得到以下結果 -