使用 Pandas 在 Python 中繪製資料

2020-06-19 23:19:00

Pandas 是一個非常流行的 Python 資料操作庫。學習怎樣使用它的 API 繪製資料。

在有關基於 Python 的繪相簿的系列文章中,我們將對使用 Pandas 這個非常流行的 Python 資料操作庫進行繪圖進行概念性的研究。Pandas 是 Python 中的標準工具,用於對進行資料可延伸的轉換,它也已成為從 CSV 和 Excel 格式匯入和匯出資料的流行方法。

除此之外,它還包含一個非常好的繪圖 API。這非常方便,你已將資料儲存在 Pandas DataFrame 中,那麼為什麼不使用相同的庫進行繪製呢?

在本系列中,我們將在每個庫中製作相同的多條形柱狀圖,以便我們可以比較它們的工作方式。我們使用的資料是 1966 年至 2020 年的英國大選結果: 

Matplotlib UK election results 

自行繪製的資料

在繼續之前,請注意你可能需要調整 Python 環境來執行此程式碼,包括:

  • 執行最新版本的 Python(用於 LinuxMac 和 Windows 的說明)
  • 確認你執行的是與這些庫相容的 Python 版本

資料可線上獲得,並可使用 Pandas 匯入: 

import pandas as pddf = pd.read_csv('https://anvil.works/blog/img/plotting-in-python/uk-election-results.csv')

現在我們已經準備好了。在本系列文章中,我們已經看到了一些令人印象深刻的簡單 API,但是 Pandas 一定能奪冠。

要在 x 軸上繪製按年份和每個黨派分組的柱狀圖,我只需要這樣做:

import matplotlib.pyplot as pltax = df.plot.bar(x='year')plt.show()

只有四行,這絕對是我們在本系列中建立的最棒的多條形柱狀圖。

我以寬格式使用資料,這意味著每個黨派都有一列:

        year  conservative  labour  liberal  others0       1966           253     364       12       11       1970           330     287        6       72   Feb 1974           297     301       14      18..       ...           ...     ...      ...     ...12      2015           330     232        8      8013      2017           317     262       12      5914      2019           365     202       11      72

這意味著 Pandas 會自動知道我希望如何分組,如果我希望進行不同的分組,Pandas 可以很容易地重組 DataFrame

與 Seaborn 一樣,Pandas 的繪圖功能是 Matplotlib 之上的抽象,這就是為什麼要呼叫 Matplotlib 的 plt.show() 函數來實際生成繪圖的原因。

看起來是這樣的:

pandas unstyled data plot

看起來很棒,特別是它又這麼簡單!讓我們對它進行樣式設定,使其看起來像 Matplotlib 的例子。

調整樣式

我們可以通過存取底層的 Matplotlib 方法輕鬆地調整樣式。

首先,我們可以通過將 Matplotlib 顏色表傳遞到繪圖函數來為柱狀圖著色:

from matplotlib.colors import ListedColormapcmap = ListedColormap(['#0343df', '#e50000', '#ffff14', '#929591'])ax = df.plot.bar(x='year', colormap=cmap)

我們可以使用繪圖函數的返回值設定坐標軸標籤和標題,它只是一個 Matplotlib 的 Axis 物件。 

ax.set_xlabel(None)ax.set_ylabel('Seats')ax.set_title('UK election results')

這是現在的樣子:

pandas styled plot

這與上面的 Matplotlib 版本幾乎相同,但是只用了 8 行程式碼而不是 16 行!我內心的程式碼高手非常高興。 

抽象必須是可跳脫的

與 Seaborn 一樣,向下存取 Matplotlib API 進行細節調整的能力確實很有幫助。這是給出抽象緊急出口使其既強大又簡單的一個很好的例子。