资讯专栏INFORMATION COLUMN

PHP中pack、unpack的详细用法

beita / 935人阅读

摘要:中有两个函数和,很多在实际项目中从来没有使用过,甚至也不知道这两个方法是用来干嘛的。比如和分别对应的二进制表示为。主机字节序表示当年机器的字节序也就是网络字节序是确定的,而主机字节序是依机器确定的,一般为小端字节序。

PHP中有两个函数pack和unpack,很多PHPer在实际项目中从来没有使用过,甚至也不知道这两个方法是用来干嘛的。这篇文章来为大家介绍一下它俩到底是用来干啥的。
pack
string pack ( string $format [, mixed $args [, mixed $... ]] )

该函数用来将对应的参数($args)打包成二进制字符串。

其中第一个参数$format,有如下选项(可选参数很多,后面会选几个常用的讲解):

Code Description
a 以NUL字节填充字符串空白
A 以SPACE(空格)填充字符串
h 十六进制字符串,低位在前
H 十六进制字符串,高位在前
c 有符号字符
C 无符号字符
s 有符号短整型(16位,主机字节序)
S 无符号短整型(16位,主机字节序)
n 无符号短整型(16位,大端字节序)
v 无符号短整型(16位,小端字节序)
i 有符号整型(机器相关大小字节序)
I 无符号整型(机器相关大小字节序)
l 有符号长整型(32位,主机字节序)
L 无符号长整型(32位,主机字节序)
N 无符号长整型(32位,大端字节序)
V 无符号长整型(32位,小端字节序)
q 有符号长长整型(64位,主机字节序)
Q 无符号长长整型(64位,主机字节序)
J 无符号长长整型(64位,大端字节序)
P 无符号长长整型(64位,小端字节序)
f 单精度浮点型(机器相关大小)
d 双精度浮点型(机器相关大小)
x NUL字节
X 回退一字节
Z 以NUL字节填充字符串空白(new in PHP 5.5)
@ NUL填充到绝对位置

这么多参数看下来,我第一次是真心懵逼了,大部分说明都很好理解,但是其中的主机、大端、小端等字节序是什么鬼呢?接下里的内容比较枯燥,但必须理解才行,坚持吧。

字节序是什么?

就是字节的顺序,说白了就是多字节数据的存放顺序(一个字节显然不需要顺序)。
比如AB分别对应的二进制表示为0100 00010100 0010。对于储存字符串AB,我们可以0100 0001 0100 0010也可以0100 0010 0100 0001,这个顺序就是所谓的字节序。

高/低位字节

比如字符串AB,左高右低(我们正常的阅读顺序),A为高字节,B为低字节

高/低地址

假设0x123456是按从高位到底位的顺序储存,内存中是这样存放的:

高地址 -> 低地址
12 -> 34 -> 56

大端字节序(网络字节序)

大端就是将高位字节放到内存的低地址端,低位字节放到高地址端。网络传输中(比如TCP/IP)低地址端(高位字节)放在流的开始,对于2个字节的字符串(AB),传输顺序为:A(0-7bit)、B(8-15bit)。
那么小端字节序自然和大端相反。

主机字节序

表示当年机器的字节序(也就是网络字节序是确定的,而主机字节序是依机器确定的),一般为小端字节序。

a和A(打包字符串,用NUL或者空格填充)
$string = pack("a6", "china");
var_dump($string); //输出结果: string(6) "china",最后一个字节是不可见的NUL
echo ord($string[5]); //输出结果: 0(ASCII码中0对应的就是nul)

//A同理
$string = pack("A6", "china");
var_dump($string); //输出结果: string(6) "china ",最后一个字节是空格
echo ord($string[5]); //输出结果: 32(ASCII码中32对应的就是空格)

附赠ASCII表一张(linux/unix下可以使用man ascii查看)

h和H
$string = pack("H3", 281);
var_dump($string); //输出结果: string(2) "("

for($i=0;$i

h和H需要特殊说明一下,它们是将对应的参数看做十六进制字符然后打包。什么意思呢?比如上面的281,打包前会将281转换为0x281,因为十六进制的一位对应二进制的四位,上面的0x281只有1.5个字节,后面会默认补0变成0x2810,0x28对应的十进制为40((),0x10对应的十进制为16(dle不可见字符),懂了吧?不懂可以给我留言。。

c和C
$string = pack("c3", 67, 68, -1);
var_dump($string); //输出:string(3) "CD�"

for($i=0;$i

最后输出本能应该觉得是67 68 -1
ord获取的是字符的ASCII码(范围0-255),这时-1(0000 0001)对应的字符将以补码的形式输出也就是255(1111 1110 + 0000 0001 = 1111 1111)

整型相关

所有的整型类型使用方法完全一样,主要注意它们的位和字节序就可以了,下面以L作为例子展示

$string = pack("L", 123456789);
var_dump($string); //输出:string(4) "�["

for($i=0;$i
f和d
$string = pack("f", 12345.123);
var_dump($string);
//输出:string(4) "~�@F"
var_dump(unpack("f", $string)); //这里提前用到了unpack,后面会讲解
//输出:float(12345.123046875)

f和d是针对浮点数打包,至于为什么打包前是12345.123解包后是12345.123046875,这个和浮点数的储存有关系,后面可以单开一个文章讲解一下IEEE标准

x、X、Z、@
$string = pack("x"); //打包一个nul字符串
echo ord($string); //输出: 0

关于X(大写X),试了N次,没搞明白怎么用,有清楚的童鞋可以给我留言,多谢。

$string = pack("Z2", "abc5"); //其实就是将从Z后面的数字位置开始,全部设置为nul
var_dump($string); //输出:string(2) "a"

for($i=0;$i
$string = pack("@4"); //我理解为填充N个nul
var_dump($string); //输出: string(4) ""

for($i=0;$i
unpack
array unpack ( string $format , string $data )

unpack的使用相当简单,就是讲pack打包的数据解包,打包的时候用的什么参数,就用什么参数解包,具体使用懒得说了,列几个小例子

$string = pack("L4", 1, 2, 3, 4);
var_dump(unpack("L4", $string));
//输出:
array(4) {
[1]=>
int(1)
[2]=>
int(2)
[3]=>
int(3)
[4]=>
int(4)
}

$string = pack("L4", 1, 2, 3, 4);
var_dump(unpack("Ll1/Ll2/Ll3/Ll4", $string)); //可以指定key,用/分割
//输出:
array(4) {
["l1"]=>
int(1)
["l2"]=>
int(2)
["l3"]=>
int(3)
["l4"]=>
int(4)
}
这两个函数到底有啥用途

数据通信(通过二进制格式与其它语言通信)

数据加密(如果不告诉第三方你的打包方式,对方解包的难度就相对很大)

节省空间(比如比较大的数字按字符串储存会浪费很多空间,打包成二进制格式才需要4位<32位数字>)

自己去想吧

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/22331.html

相关文章

  • PHPpack和unpack函数

    摘要:鉴于文件读写网络编程,或者说字节流处理的重要性,掌握这两个函数是迈向高级编程的基础。相比之下字节处理门庭冷落,相关函数寥寥无几。上述是函数简单的使用场景,接下来分别介绍和函数。如其名,函数的工作是将数据按照格式打包成字节数组。 转载请注明文章出处:https://tlanyan.me/php-pack-a... PHP有两个重要的冷门函数:pack和unpack。在网络编程,读写图像...

    Lin_R 评论0 收藏0
  • php - tcp 粘包/拆包实例

    摘要:长链接模式下,使用固定消息头长度的方式进行消息拆包,解决粘包问题。但如果是短连接多个消息或长链接模式下,就可能会发生粘包,客户端不关闭服务端无法通过确定消息读取完毕的问题。这就需要定义协议和拆包。 tcp 长链接模式下,使用固定消息头长度的方式进行消息拆包,解决粘包问题。 固定消息头协议 将消息头的前N个字节固定为消息长度位,结合业务场景,2bytes 或 4bytes,读取消息时先读...

    Blackjun 评论0 收藏0
  • 正确认识浮点数

    摘要:浮点数在计算机中是根据二进制浮点数算数标准储存的。尤其在我们日常工作中,不要比较浮点数的大小,如果需要精确的比较计算,请使用系列函数。还有一点,浮点数不准确和没有任何关系,不背这个锅。 大家在日常开发中,必然使用过浮点数,也会发现浮点数不是精确的,那究竟是什么原因造成的呢? 奇怪的结果 var_dump((1-0.9) == 0.1); //输出:bool(false) 很奇怪吧!1-...

    warkiz 评论0 收藏0
  • python高级特性

    摘要:常规的使用来统计一段代码运行时间的例子输出结果总结其实是一门特别人性化的语言,但凡在工程中经常遇到的问题,处理起来比较棘手的模式基本都有对应的比较优雅的解决方案。 python的高级特性 名词与翻译对照表 generator 生成器 iterator 迭代器 collection 集合 pack/unpack 打包/解包 decorator 装饰器 context manager ...

    yexiaobai 评论0 收藏0
  • PythonStruct模块,用法以及个人理解

    摘要:简介模块主要在中的值于语言结构之间的转换。可用于处理存储在文件或网络连接或其它来源中的二进制数据。顺序格式字符现在先不要看图表,稍后我们回来看。图片来自官网例子用例子说明效果是最好的,我们用特定格式往二进制文件里写入数据,然后再读出数据。 简介 python strtuct模块主要在Python中的值于C语言结构之间的转换。可用于处理存储在文件或网络连接(或其它来源)中的二进制数据。 ...

    Elle 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<