【相關推薦:Python3視訊教學 】
Pandas是最流行的用於資料分析的 Python 庫。它提供高度優化的效能,後端原始碼完全用C或Python編寫。
我們可以通過以下方式分析 pandas 中的資料:
1.Series
2.資料框
Series 是 pandas 中定義的一維(1-D)陣列,可用於儲存任何資料型別。
建立 Series
# 建立 Series 的程式 # 匯入 Panda 庫 import pandas as pd # 使用資料和索引建立 Series a = pd.Series(Data, index = Index)
在這裡,資料可以是:
注意:預設情況下,索引從 0、1、2、...(n-1) 開始,其中 n 是資料長度。
當 Data 包含標量值時
# 使用標量值建立 Series 的程式 # 數值資料 Data =[1, 3, 4, 5, 6, 2, 9] # 使用預設索引值建立系列 s = pd.Series(Data) # 預定義的索引值 Index =['a', 'b', 'c', 'd', 'e', 'f', 'g'] # 建立具有預定義索引值的系列 si = pd.Series(Data, Index)
輸出:
具有預設索引的標量資料
帶索引的標量資料
當資料包含字典時
# 建立詞典 Series 程式 dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5} # 建立字典型別 Series sd = pd.Series(dictionary)
輸出:
字典型別資料
當 Data 包含 Ndarray
# 建立 ndarray series 的程式 # 定義二維陣列 Data =[[2, 3, 4], [5, 6, 7]] # 建立一系列二維陣列 snd = pd.Series(Data)
輸出:
資料作為 Ndarray
DataFrames是 pandas 中定義的二維(2-D)資料結構,由行和列組成。
建立 DataFrame
# 建立 DataFrame 的程式 # 匯入庫 import pandas as pd # 使用資料建立 DataFrame a = pd.DataFrame(Data)
在這裡,資料可以是:
當資料是字典時
# 使用兩個字典建立資料框的程式 # 定義字典 1 dict1 ={'a':1, 'b':2, 'c':3, 'd':4} # 定義字典 2 dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9} # 用 dict1 和 dict2 定義資料 Data = {'first':dict1, 'second':dict2} # 建立資料框 df = pd.DataFrame(Data)
輸出:
帶有兩個字典的 DataFrame
當資料是Series時
# 建立三個系列的Dataframe的程式 import pandas as pd # 定義 series 1 s1 = pd.Series([1, 3, 4, 5, 6, 2, 9]) # 定義 series 2 s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3]) # 定義 series 3 s3 = pd.Series(['a', 'b', 'c', 'd', 'e']) # 定義 Data Data ={'first':s1, 'second':s2, 'third':s3} # 建立 DataFrame dfseries = pd.DataFrame(Data)
輸出:
三個 Series 的 DataFrame
當 Data 為 2D-numpy ndarray注意:在建立 2D 陣列的 DataFrame 時必須保持一個約束 - 2D 陣列的維度必須相同。
# 從二維陣列建立 DataFrame 的程式 # 匯入庫 import pandas as pd # 定義 2d 陣列 1 d1 =[[2, 3, 4], [5, 6, 7]] # 定義 2d 陣列 2 d2 =[[2, 4, 8], [1, 3, 9]] # 定義 Data Data ={'first': d1, 'second': d2} # 建立 DataFrame df2d = pd.DataFrame(Data)
輸出:
帶有 2d ndarray 的 DataFrame
【相關推薦:Python3視訊教學 】
前端(vue)入門到精通課程:
以上就是Python利用Pandas進行資料分析的方法詳解的詳細內容,更多請關注TW511.COM其它相關文章!