Pandas視覺化


基本繪圖:繪圖

Series和DataFrame上的這個功能只是使用matplotlib庫的plot()方法的簡單包裝實現。參考以下範例程式碼 -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('2018/12/18',
   periods=10), columns=list('ABCD'))

df.plot()

執行上面範例程式碼,得到以下結果 -

如果索引由日期組成,則呼叫gct().autofmt_xdate()來格式化x軸,如上圖所示。

我們可以使用xy關鍵字繪製一列與另一列。

繪圖方法允許除預設線圖之外的少數繪圖樣式。 這些方法可以作為plot()kind關鍵字引數提供。這些包括 -

  • barbarh為條形
  • hist為直方圖
  • boxplot為盒型圖
  • area為「面積」
  • scatter為散點圖

條形圖

現在通過建立一個條形圖來看看條形圖是什麼。條形圖可以通過以下方式來建立 -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.bar()

執行上面範例程式碼,得到以下結果 -

要生成一個堆積條形圖,通過指定:pass stacked=True -

import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.bar(stacked=True)

執行上面範例程式碼,得到以下結果 -

要獲得水平條形圖,使用barh()方法 -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])

df.plot.barh(stacked=True)

執行上面範例程式碼,得到以下結果 -

直方圖

可以使用plot.hist()方法繪製直方圖。我們可以指定bins的數量值。

import pandas as pd
import numpy as np

df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])

df.plot.hist(bins=20)

執行上面範例程式碼,得到以下結果 -

要為每列繪製不同的直方圖,請使用以下程式碼 -

import pandas as pd
import numpy as np

df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])

df.hist(bins=20)

執行上面範例程式碼,得到以下結果 -

箱形圖

Boxplot可以繪製呼叫Series.box.plot()DataFrame.box.plot()DataFrame.boxplot()來視覺化每列中值的分布。

例如,這裡是一個箱形圖,表示對[0,1)上的統一隨機變數的10次觀察的五次試驗。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()

執行上面範例程式碼,得到以下結果 -

區域塊圖形

可以使用Series.plot.area()DataFrame.plot.area()方法建立區域圖形。

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()

執行上面範例程式碼,得到以下結果 -

散點圖形

可以使用DataFrame.plot.scatter()方法建立散點圖。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')

執行上面範例程式碼,得到以下結果 -

餅狀圖

餅狀圖可以使用DataFrame.plot.pie()方法建立。

import pandas as pd
import numpy as np

df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)

執行上面範例程式碼,得到以下結果 -