PHP中的pack和unpack函數的用法詳解

2020-07-16 10:06:09

PHP中有兩個函數pack和unpack,很多PHPer在實際專案中從來沒有使用過,甚至也不知道這兩個方法是用來幹嘛的。這篇文章來為大家介紹一下它倆到底是用來幹啥的。

pack

string pack ( string $format [, mixed $args [, mixed $... ]] )

該函數用來將對應的引數($args)打包成二進位制字串。

其中第一個引數$format,有如下選項(可選引數很多,後面會選幾個常用的講解):

26c825e436599fe568437d325f7e246.png

b08f422b5474b240d1d87a7fb6af7cc.png

這麼多引數看下來,我第一次是真心懵逼了,大部分說明都很好理解,但是其中的主機、大端、小端等位元組序是什麼鬼呢?接下裡的內容比較枯燥,但必須理解才行,堅持吧。

位元組序是什麼?

就是位元組的順序,說白了就是多位元組資料的存放順序(一個位元組顯然不需要順序)。

比如A和B分別對應的二進位制表示為0100 0001、0100 0010。對於儲存字串AB,我們可以0100 0001 0100 0010也可以0100 0010 0100 0001,這個順序就是所謂的位元組序。

高/低位位元組

比如字串AB,左高右低(我們正常的閱讀順序),A為高位元組,B為低位元組

高/低地址

假設0x123456是按從高位到底位的順序儲存,記憶體中是這樣存放的:

高地址 -> 低地址

12 -> 34 -> 56

大端位元組序(網路位元組序)

大端就是將高位位元組放到記憶體的低地址端,低位位元組放到高地址端。網路傳輸中(比如TCP/IP)低地址端(高位位元組)放在流的開始,對於2個位元組的字串(AB),傳輸順序為:A(0-7bit)、B(8-15bit)。

那麼小端位元組序自然和大端相反。

主機位元組序

表示當年機器的位元組序(也就是網路位元組序是確定的,而主機位元組序是依機器確定的),一般為小端位元組序。

a和A(打包字串,用NUL或者空格填充)

$string = pack('a6', 'china’);
var_dump($string); //輸出結果: string(6) "china",最後一個位元組是不可見的NUL
echo ord($string[5]); //輸出結果: 0(ASCII碼中0對應的就是nul)

//A同理
$string = pack('A6', 'china’);
var_dump($string); //輸出結果: string(6) "china ",最後一個位元組是空格
echo ord($string[5]); //輸出結果: 32(ASCII碼中32對應的就是空格)

[圖片上傳失敗...(image-5d8a61-1577941896554)]

附贈ASCII表一張(linux/unix下可以使用man ascii檢視)

h和H

$string = pack('H3', 281);
var_dump($string); //輸出結果: string(2) 「(「
for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出結果: 40 16

h和H需要特殊說明一下,它們是將對應的引數看做十六進位制字元然後打包。什麼意思呢?比如上面的281,打包前會將281轉換為0x281,因為十六進位制的一位對應二進位制的四位,上面的0x281只有1.5個位元組,後面會預設補0變成0x2810,0x28對應的十進位制為40((),0x10對應的十進位制為16(dle不可見字元)。

c和C

$string = pack('c3', 67, 68, -1);
var_dump($string); //輸出:string(3) 「CD?」
for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 67 68 225

最後輸出本能應該覺得是67 68 -1

ord獲取的是字元的ASCII碼(範圍0-255),這時-1(0000 0001)對應的字元將以二補數的形式輸出也就是255(1111 1110 + 0000 0001 = 1111 1111)

整型相關

所有的整型型別使用方法完全一樣,主要注意它們的位和位元組序就可以了,下面以L作為例子展示:

$string = pack('L', 123456789);
var_dump($string); //輸出:string(4) 「?[「

for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 21 205 91 7

f和d

$string = pack('f', 12345.123);
var_dump($string);
//輸出:string(4) "~?@F」
var_dump(unpack('f', $string)); //這裡提前用到了unpack,後面會講解
//輸出:float(12345.123046875)

f和d是針對浮點數打包,至於為什麼打包前是12345.123解包後是12345.123046875,這個和浮點數的儲存有關係。

x、X、Z、@

$string = pack('x'); //打包一個nul字串
echo ord($string); //輸出: 0

關於X(大寫X),試了N次,沒搞明白怎麼用,有清楚的童鞋可以給我留言,多謝。

$string = pack('Z2', 'abc5'); //其實就是將從Z後面的數位位置開始,全部設定為nul
var_dump($string); //輸出:string(2) 「a」
for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 97 0
$string = pack('@4'); //我理解為填充N個nul
var_dump($string); //輸出: string(4) 「」
for($i=0;$i<strlen($string);$i++) {
echo ord($string[$i]) . PHP_EOL;
}
//輸出: 0 0 0 0

unpack

array unpack ( string $format , string $data )

unpack的使用相當簡單,就是講pack打包的資料解包,打包的時候用的什麼引數,就用什麼引數解包,具體使用懶得說了,列幾個小例子:

$string = pack('L4', 1, 2, 3, 4);
var_dump(unpack('L4', $string));
//輸出:
array(4) {
[1]=>
int(1)
[2]=>
int(2)
[3]=>
int(3)
[4]=>
int(4)
}

$string = pack('L4', 1, 2, 3, 4);
var_dump(unpack('Ll1/Ll2/Ll3/Ll4', $string)); //可以指定key,用/分割
//輸出:
array(4) {
["l1」]=>
int(1)
["l2」]=>
int(2)
["l3」]=>
int(3)
["l4」]=>
int(4)
}

這兩個函數到底有啥用途

·資料通訊(通過二進位制格式與其它語言通訊)

·資料加密(如果不告訴第三方你的打包方式,對方解包的難度就相對很大)

·節省空間(比如比較大的數位按字串儲存會浪費很多空間,打包成二進位制格式才需要4位元<32位元數位>)

PHP中文網有大量免費的PHP入門教學,歡迎大家學習!

本文轉自:https://www.jianshu.com/p/942907071a4c

以上就是PHP中的pack和unpack函數的用法詳解的詳細內容,更多請關注TW511.COM其它相關文章!