餅圖,或稱餅狀圖,是一個劃分為幾個扇形的圓形統計圖表。
在餅圖中,每個扇形的弧長(以及圓心角和麵積)大小,表示該種類佔總體的比例,且這些扇形合在一起剛好是一個完全的圓形。
餅圖最顯著的功能在於表現「佔比」。
習慣上,人們通過比較餅圖扇形的大小來獲得對資料的認知。
使用餅圖時,須確認各個扇形的資料加起來等於100%;
且避免磁區超過5個,扇形的排布順序,一般情況下,將最大的扇形放在12點鐘方向。
餅圖的主要元素包括:
餅圖適用的場景包括:
餅圖不適用的場景包括:
本次用餅圖統計展示 不同人口規模的城市數量 的統計情況。
資料來自國家統計局公開的城市概況資料,可從下面的網址下載:
https://databook.top/nation/A0B
使用其中的 A0B01.csv
檔案(分機構型別法人單位數)
fp = "d:/share/A0B01.csv"
df = pd.read_csv(fp)
df
最新的2022年資料缺失較多,所以選取2021年的資料進行分析。
data = df[df["sj"] == 2021]
data
第一條資料全部城市情況,統計需要去除,另外,指標的名稱太長,統計前也可以調整下。
接著上面過濾後的資料繼續資料淨化:
data = data.reset_index() # 重置索引
data = data.iloc[1:] # 忽略第一條合計的資料
#調整指標名稱,刪除多餘的文字
data["zbCN"] = data["zbCN"].str.replace("城市市轄區年末總", "")
data["zbCN"] = data["zbCN"].str.replace("地級及以上", "")
data
最後得到的資料有6條,餅圖一般來說資料不要超過5個,6個也還行,再多就影響顯示效果了。
with plt.style.context("seaborn-v0_8"):
fig = plt.figure()
ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])
ax.pie(data["value"], autopct="%1.1f%%")
ax.legend(
data["zbCN"].tolist(),
loc="center",
bbox_to_anchor=(1, 0, 0.5, 1),
)
從分析結果可看出,50萬~200萬人口的城市超過一半,是大多數的城市規模。
兩端的情況(人口20萬以下,或者400萬以上)的城市佔比最小。