在pyton中,通過struct
模組來對二進位制進行轉換,主要包括兩大類函數,即用於打包的pack和用於解包的unpack。
其中,struct.pack
的輸入格式為struct.pack(format, v1, v2, ...)
,其中format
為格式字串,v1,v2..
為將要轉成bytes
的字元。
例如
>>> import struct
>>> struct.pack('i', 15)
b'\x0f\x00\x00\x00'
>>> struct.pack('iii', 15, 16, 17)
b'\x0f\x00\x00\x00\x10\x00\x00\x00\x11\x00\x00\x00'
>>> struct.pack('b', 255) #b格式的取值範圍是-128到127
struct.error: byte format requires -128 <= number <= 127
>>> struct.pack('B', 200)
b'\xc8'
>>> struct.pack('B', 71) #128以內可用ASCII表示
b'G'
i
代表int
,15對應的二進位制程式碼為F000
,故其輸出為b\x0f\x00\x00\x00
。當格式字串為iii
時,說明要將三個數位以整數型別轉化為二進位制。
其中,格式化字串中的每個字元都代表一種資料型別,其中整型相關的字元如下,左側為帶符號整型,右側為無符號整型
C語言型別 | C語言型別 | 標準大小 | ||
---|---|---|---|---|
b | signed char | B | unsigned char | 1 |
h | short | H | unsigned short | 2 |
i | int | I | unsigned int | 4 |
l | long | L | unsigned long | 4 |
q | long long | Q | unsigned long long | 8 |
n | ssize_t | N | size_t |
其他型別
格式 | C 型別 | Python 型別 | 標準大小 |
---|---|---|---|
x | 填充位元組 | 無 | |
c | char | 長度為1的位元組串 | |
? | _Bool | bool | 1 |
e | float | 2 | |
f | float | float | 4 |
d | double | float | 8 |
s | char[] | 位元組串 | |
p | char[] | 位元組串 | |
P | void* | 整數 |
struct
中提供了獲取標準大小的函數,calcsize
:
>>> struct.calcsize('B')
1
>>> struct.calcsize('i')
4
除了宣告被格式化時的資料型別,struct
還可以指定對齊方式,例如
>>> struct.pack("i",15)
b'\x0f\x00\x00\x00'
>>> struct.pack(">i",15) #小端序
b'\x00\x00\x00\x0f'
>>> struct.pack("<i",15) #大端序
b'\x0f\x00\x00\x00'
其對應字元的含義分別為
@ | = | < | > | ! |
---|---|---|---|---|
本機 | 本機 | 小端 | 大端 | 網路(大端) |
其中預設為@
,即本機位元組順序。
在熟悉了pack
之後,與之對偶的unpack
也就沒啥難度了
>>> test = struct.pack("III",125,1255,12555)
>>> struct.unpack("III",test)
(125, 1255, 12555)
除了pack
和unpack
,struct
模組還提供了C語言風格的一對函數pack_into
和unpack_from
,二者的宣告分別為
struct.pack_into(format, buffer, offset, v1, v2, ...)
struct.unpack_from(format, /, buffer, offset=0)
其中buffer
表示緩衝流,在pack_into
中,將v1,v2...
以offset
的偏置打包入buffer
中;在unpack_from
中,將buffer
中的資料從offset
處依次取出。
struct
中封裝了用於二進位制處理的類Struct
,按照以往經驗,其pack
函數的實現方法很有可能是下面這種
def pack(format,*args):
return Struct(format).pack(args)
其中Struct
的初始化方法就是輸入一個格式化字串,例如
>>> s = struct.Struct("III")
>>> s.pack(1,2,3)
b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'