面板(Panel)是3D容器的資料。面板資料一詞來源於計量經濟學,部分源於名稱:Pandas
- pan(el)-da(ta)-s
。
3
軸(axis
)這個名稱旨在給出描述涉及面板資料的操作的一些語意。它們是 -
axis 0
,每個專案對應於內部包含的資料影格(DataFrame)。axis 1
,它是每個資料影格(DataFrame)的索引(行)。axis 2
,它是每個資料影格(DataFrame)的列。可以使用以下建構函式建立面板 -
pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)
建構函式的引數如下 -
引數 | 描述 |
---|---|
data |
資料採取各種形式,如:ndarray ,series ,map ,lists ,dict ,constant 和另一個資料影格(DataFrame ) |
items |
axis=0 |
major_axis |
axis=1 |
minor_axis |
axis=2 |
dtype |
每列的資料型別 |
copy |
複製資料,預設 - false |
可以使用多種方式建立面板 -
# creating an empty panel
import pandas as pd
import numpy as np
data = np.random.rand(2,4,5)
p = pd.Panel(data)
print p
執行上面範例程式碼,得到以下結果 -
<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4
注意 - 觀察空面板和上面板的尺寸大小,所有物件都不同。
#creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p
執行上面範例程式碼,得到以下結果 -
<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4
可以使用Panel
的建構函式建立一個空面板,如下所示:
#creating an empty panel
import pandas as pd
p = pd.Panel()
print p
執行上面範例程式碼,得到以下結果 -
<class 'pandas.core.panel.Panel'>
Dimensions: 0 (items) x 0 (major_axis) x 0 (minor_axis)
Items axis: None
Major_axis axis: None
Minor_axis axis: None
要從面板中選擇資料,可以使用以下方式 -
使用Items
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p['Item1']
執行上面範例程式碼,得到以下結果 -
0 1 2
0 0.488224 -0.128637 0.930817
1 0.417497 0.896681 0.576657
2 -2.775266 0.571668 0.290082
3 -0.400538 -0.144234 1.110535
上面範例有兩個資料項,這裡只檢索item1
。結果是具有4
行和3
列的資料影格(DataFrame
),它們是Major_axis
和Minor_axis
維。
使用major_axis
可以使用panel.major_axis(index)
方法存取資料。參考以下範例程式碼 -
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.major_xs(1)
執行上面範例程式碼,得到以下結果 -
Item1 Item2
0 0.417497 0.748412
1 0.896681 -0.557322
2 0.576657 NaN
使用minor_axis
可以使用panel.minor_axis(index)
方法存取資料。參考以下範例程式碼 -
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.minor_xs(1)
執行上面範例程式碼,得到以下結果 -
Item1 Item2
0 -0.128637 -1.047032
1 0.896681 -0.557322
2 0.571668 0.431953
3 -0.144234 1.302466
注意 - 觀察尺寸大不的變化。