PHP 7中新的Hashtable实现和性能改进

2024-05-14 03:18

本文主要是介绍PHP 7中新的Hashtable实现和性能改进,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

PHP 7中新的Hashtable实现和性能改进

 
这篇文章是翻译自nikic的最新大作,我从他的blog中学到了很多东西。这篇文章貌似是他半年多来发的第一篇文章,文章主要是讲PHP 7中的新的Hashtable的实现,Hashtable是PHP中非常核心的部分,数组就是基于此实现的,而数组在PHP中的使用是如此之频繁,所以一个好的Hashtable的实现必然会带来性能的极大提升,从文章来看,事实也确实如此。

大概三年前,我写一篇名为“分析数组的内存使用量”(这篇文章也得相当不错,值得一读)的文章,那篇文章分析的是PHP 5中的数组使用内存的情况。作为我所参与的PHP 7的开发工作中的一部分,我专注于改进了一些小的数据结构的内存分配情况,为此重写了Zend Engine的大部分代码。在这篇文章中,我会大概说明一下新的hashtable的实现,以及为什么它会比之前的实现更高效。

我使用下面的代码来测试内存的使用情况:

$startMemory = memory_get_usage();
$array = range(1, 100000);
echo memory_get_usage() - $startMemory, " bytes\n";

这段代码测试了创建一个含有100000个不同整数的数组所消耗的内存空间大小。

下面这个表格是上面的代码分别在PHP 5.6和PHP 7中的执行结果,包括32位和64位系统两种情况:

                | 32 bit          | 64 bit
----------------------------------------
PHP 5.6 | 7.37 MiB    | 13.97 MiB
----------------------------------------
PHP 7.0 | 3.00 MiB   | 4.00 MiB

我们可以说32系统中PHP 7中的数组所占的内存比PHP 5.6节省了2.5倍,64位系统则是3.5倍。这是一个相当不错的改进。

Hashtable简介

PHP中数组的本质是顺序字典,它可以表示一个包含键值对的顺序列表,键值对的映射就是使用Hashtable实现的。

Hashtable是非常常见的数据结构,它被设计出来解决计算机只能直接表示以连续的整数作为索引的数组的问题。使用Hashtable,程序员才能使用字符串或者其他的复合类型作为数组的键。

Hashtable的概念实际上非常简单:字符串的键先会被传递给一个hash函数(hashing function,中文也翻译为散列函数,本文统一使用hash函数),然后这个函数会返回一个整数(我们把它叫做hash值),而这个整数就是“通常”的数组的索引。问题是对于两个不同的字符串,调用hash函数会得到同一个hash值,而现实情况是任意字符串都可以作为键,所以键会有无数个,而数组的大小必须是提前设定好的,因为hash值必须小于数组索引的最大值,所以可以生成的hash值必须是有限的。这样用有限的hash值表示无限的键,必然会导致冲突。我们把两个不同的键的hash值是一样的情况称为冲突,任何Hashtable算法都必须提供某种机制解决这种冲突。

有两种主要的处理冲突的方法。开放定址法,当冲突发生的时候,冲突的元素会被保存到一个不同的索引中;链接法,所有拥有相同的hash值的元素,它们都会被保存到一个链表中。PHP使用的就是第二种方法。

另外通常情况下,Hashtable并非是显式排序的:最终底层数组中保存的元素的顺序是跟hash函数相关的,并且这个顺序一般都是随机的。这个行为显然跟PHP数组的语义不符:PHP的数组的迭代顺序跟数组中元素的插入顺序完全一致。这也意味着,PHP中的Hashtable的实现必须有一种额外的机制记住数组中元素的插入顺序。

老的Hashtable的实现方式

在此我只会大概介绍一下老的hashtable的实现方式,如果你想要更进一步的了解,可以参加PHP内部机制这本书的hashtable这一章。下面这张图高度概括了PHP5中的hanshtable:

“冲突处理(collision resolution)”链表中的元素被称为”buckets”。每一个bucket都是单独分配的。这个图片没有展示的是每个元素实际的值也是保存在这些buckets中的(图片中只展示了键)。值会存放zval结构,这些结构是分开单独分配内存的,它们的大小是16字节(32位)或者24个字节(64位)。

另外一点上面的图片没有展示出来的是,冲突处理链表实际上是一个双向链表(方便元素的删除)。在冲突处理链表的旁边有另外一个双向链表,它用于保存数组中元素的顺序。对于一个包含的键为”a”,”b”,”c”(而且这是它们的插入顺序)的数组,这个链表会是下面这个样子:

所以为什么老的hashta

这篇关于PHP 7中新的Hashtable实现和性能改进的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/987604

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

黑神话,XSKY 星飞全闪单卷性能突破310万

当下,云计算仍然是企业主要的基础架构,随着关键业务的逐步虚拟化和云化,对于块存储的性能要求也日益提高。企业对于低延迟、高稳定性的存储解决方案的需求日益迫切。为了满足这些日益增长的 IO 密集型应用场景,众多云服务提供商正在不断推陈出新,推出具有更低时延和更高 IOPS 性能的云硬盘产品。 8 月 22 日 2024 DTCC 大会上(第十五届中国数据库技术大会),XSKY星辰天合正式公布了基于星