这是我的第 69 篇原创文案
作者 | 悟空聊架构
源自 | 悟空聊架构(ID:PassJava666) 转载请联系授权(微XID:PassJava)
艾小仙近期问我:PHP 是不是最好的语言?,我说论 垃圾回收,PHP 可能更简单粗暴一点。艾小仙满脸惊疑:PHP 还有垃圾回收?
Java 中的垃圾回收机制,大众肯定都有所认识,例如怎样确定垃圾,有两种算法,引用计数法和达到性分析算法。
Java 中运用的是达到性分析算法,而 PHP 运用的引用计数算法。 咱们都晓得引用计数算法较难处理循环引用的问题,PHP 这波奇怪的操作可太秀了,那 PHP 的垃圾回收原理是怎么样的?
1、PHP 中的引用计数
1.1 怎样确定垃圾
原理: 给对象添加一个引用计数器,每当有一个地区引用它,计数器的值就加一。每当有一个引用失效,计数器的值就减一。
倘若一个变量 value 的 refcount 减一之后等于 0,此 value 能够被释放掉,不属于垃圾。垃圾回收器不会处理 。
倘若一个变量 value 的 refcount 减一之后还是大于 0,此 value 被认为不可被释放掉,可能作为一个垃圾。
垃圾回收器将可能的垃圾收集起来,等达到必定数量后起始起步垃圾鉴定程序,把真正的垃圾释放掉。
缺点: 需要守护引用计数器,有必定的消耗。且较难处理循环引用的问题。后面亦会讲到怎样处理这个问题。
下面的例子说明引用计数的是怎样变化的: //这个 value 被变量$x 引用 1 次,refcount = 1$x = array
(); //这个 value 被变量$x,$y 分别引用 1 次,refcount = 2
$y = $x; //这个 value 被变量 $x, $y, $z 分别引用 1 次,refcount = 3
$z = $y; //这个 value 被变量$x,$z 分别引用 1 次,refcount = 2,//$y 被销毁了,无引用 array 这个 valueunset
($y);
1.2 PHP 中的变量知识
每一个 php 变量存在一个叫 zval 的变量容器中。一个 zval 变量容器,除了包括变量的类型和值,还包含两个字节的额外信息。
第1个是 is_ref,是个 bool 值,用来标识这个变量是不是是属于引用集合(reference set) 。经过这个字节,php 引擎才可把普通变量和引用变量区掰开来,因为 php 准许用户经过运用&来运用自定义引用,zval 变量容器中还有一个内部引用计数机制,来优化内存运用。
第二个额外字节是 refcount,用以暗示指向这个 zval 变量容器的变量(亦叫作符号即 symbol )个数。
1.3 运用引用计数的类型
有 5 种类型用的引用计数:
string、array、object、resource、reference
下面的表格说明了仅有 type_flag 为以下 8 种类型且 IS_TYPE_REFCOUNTED=true 的变量才运用引用计数,如下表所示 运用引用计数的类型2、回收原理
2.1. 回收机会
自动回收:在变量 zval 断开 value 的指向时,倘若发掘 refcount=0 则会直接释放 value。 断开 value 指向的情形:(1)修改变量时会断开原有 value 的指向。(2)函数返回时会释放所有的局部变量。主动回收
调用 unset() 函数。类似于 Java 中的 System.gc()
2.2 垃圾鉴定
垃圾收集器收集的可能垃圾到达必定数量后,起步垃圾鉴定、回收程序。
原理:垃圾是因为成员引用自己引起的,那样就对 value 的 refcount 减一操作,倘若 value 的 refount 变为了 0,则显示其引用所有来自自己成员,value 属于垃圾。 过程一: 遍历垃圾回收器的 buffer 缓冲区,把 value 标为灰色,把 value 的成员的 refount-1,标为白色。过程二:遍历垃圾回收器的 buffer 缓冲区,倘若 value 的 refcount 等于 0,则认为是垃圾;倘若不等于 0,则暗示还有外边的引用,不是垃圾,将 refcount+1 还原回去,标为黑色。过程三: 遍历垃圾回收器的 buffer 缓冲区,将 value 为非白色的节点从 buffer 中删除,最后 buffer 缓冲区中都是真正的垃圾。过程四: 遍历垃圾回收器的 buffer 缓冲区,释放此 value。3、带你看源码
1. 垃圾管家
我叫作 _zend_gc_globals 结构体为垃圾管家,它会对垃圾进行管理,收集到的可能作为垃圾的 value 就保留在这个结构的 buf 中,叫作为垃圾缓存区。
2. 垃圾管家初始化
(1)php.ini 解析后调用 gc_init() 初始垃圾管家_zend_gc_globals。
重点功效便是分配缓冲区 buffer 空间和初始化配置。 (2)gc_init() 函数里面调用 gc_reset() 函数初始化。
重点功效便是初始化后续要用到的变量配置。
3. 判断是不是需要收集
(1)在销毁一个变量时就会判断是不是需要收集。调用 i_zval_ptr_dtor() 函数 倘若 refcount 减一后,refcount 等于 0,则认为不是垃圾,调用 _zval_dtor_func 办法释放此 value。倘若 refcount 减一后,refcount 大于 0,则认为 value 可能是垃圾,垃圾管家进行收集。4. 收集垃圾gc_possible_root办法拿出 unused 指向的节点。倘若拿出的节点是可用的,则将 unused 指向下一个节点。倘若 unused 无可用的,且 first_unused 还无推进到 last_unused,则暗示 buf 缓存区中还有可用的节点。拿出 first_unused 指向的节点。first_unused 指向下一个节点。buf 缓存区已满,起步垃圾鉴定、垃圾回收。倘若未启用垃圾回收,则直接返回。将插进的变量标为紫色,防止重复插进。将该节点在 buf 数组中的位置保留到了 gc_info 中,当后续 value 的 refcount 变为了 0。需要将其从 buf 中删除时能够晓得该 value 保留在哪个 gc_root_buffer 中。5. 释放垃圾
因为回收办法 zend_gc_collect_cycles() 实在是太长,我把几个关键过程理出来了: 扫描根节点收集根节点调用回收器清理变量收集完成4、总结PHP 的垃圾回收和 Java 的垃圾回收还是特别有很大区别的,咱们都以为无高级语言会用到引用计数法来回收垃圾,但偏偏 PHP 用的是引用计数。PHP 用了一套自己的算法来处理因循环引用而产生垃圾的问题,这套算法能够简单理解为先把可疑垃圾的引用计数减一来进行测试,倘若引用计数确实等于 0 ,则标记颜色为黑色,后续一块清理。PHP 垃圾收集中总共用到了三种关键颜色:白色- 垃圾,黑色- 非垃圾,紫色- 防止重复插进。那PHP 到底是不是最好的语言?欢迎留言区讨论!
- END -
建了学习交流群,能够扫码加我,备注[加群] 一块进阶!
个人二维码
“
我是悟空,7 年一线互联网研发经验,全栈一枚,现任研发组长。手写了一套 Spring Cloud 实战教程和 PMP 刷题小程序,在机构被誉为「工具小王子」。关注就可免费订阅教程和刷题。 ”我是悟空,奋斗变强,变身超级赛亚人!
|