这 Go 的边界检查,简直让人抓狂~

2023-10-24 19:50
文章标签 go 检查 边界 简直 抓狂

本文主要是介绍这 Go 的边界检查,简直让人抓狂~,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 什么是边界检查?

边界检查,英文名 Bounds Check Elimination,简称为 BCE。它是 Go 语言中防止数组、切片越界而导致内存不安全的检查手段。如果检查下标已经越界了,就会产生 Panic。

边界检查使得我们的代码能够安全地运行,但是另一方面,也使得我们的代码运行效率略微降低。

比如下面这段代码,会进行三次的边界检查

package mainfunc f(s []int) {_ = s[0]  // 检查第一次_ = s[1]  // 检查第二次_ = s[2]  // 检查第三次
}func main() {}

你可能会好奇了,三次?我是怎么知道它要检查三次的。

实际上,你只要在编译的时候,加上参数即可,命令如下

$ go build -gcflags="-d=ssa/check_bce/debug=1" main.go
# command-line-arguments
./main.go:4:7: Found IsInBounds
./main.go:5:7: Found IsInBounds
./main.go:6:7: Found IsInBounds

2. 边界检查的条件?

并不是所有的对数组、切片进行索引操作都需要边界检查。

比如下面这个示例,就不需要进行边界检查,因为编译器根据上下文已经得知,s 这个切片的长度是多少,你的终止索引是多少,立马就能判断到底有没有越界,因此是不需要再进行边界检查,因为在编译的时候就已经知道这个地方会不会 panic。

package mainfunc f() {s := []int{1,2,3,4}_ = s[:9]  // 不需要边界检查
}
func main()  {}

因此可以得出结论,对于在编译阶段无法判断是否会越界的索引操作才会需要边界检查,比如这样子

package mainfunc f(s []int) {_ = s[:9]  // 需要边界检查
}
func main()  {}

3. 边界检查的特殊案例

3.1 案例一

在如下示例代码中,由于索引 2 在最前面已经检查过会不会越界,因此聪明的编译器可以推断出后面的索引 0 和 1 不用再检查啦

package mainfunc f(s []int) {_ = s[2] // 检查一次_ = s[1]  // 不会检查_ = s[0]  // 不会检查
}func main() {}

3.2 案例二

在下面这个示例中,可以在逻辑上保证不会越界的代码,同样是不会进行越界检查的。

package mainfunc f(s []int) {for index, _ := range s {_ = s[index]_ = s[:index+1]_ = s[index:len(s)]}
}func main()  {}

3.3 案例三

在如下示例代码中,虽然数组的长度和容量可以确定,但是索引是通过 rand.Intn() 函数取得的随机数,在编译器看来这个索引值是不确定的,它有可能大于数组的长度,也有可能小于数组的长度。

因此第一次是需要进行检查的,有了第一次检查后,第二次索引从逻辑上就能推断,所以不会再进行边界检查。

package mainimport ("math/rand"
)func f()  {s := make([]int, 3, 3)index := rand.Intn(3)_ = s[:index]  // 第一次检查_ = s[index:]  // 不会检查
}func main()  {}

但如果把上面的代码稍微改一下,让切片的长度和容量变得不一样,结果又会变得不一样了。

package mainimport ("math/rand"
)func f()  {s := make([]int, 3, 5)index := rand.Intn(3)_ = s[:index]  // 第一次检查_ = s[index:]  // 第二次检查
}func main()  {}

我们只有当数组的长度和容量相等时, :index 成立,才能一定能推出 index: 也成立,这样的话,只要做一次检查即可

一旦数组的长度和容量不相等,那么 index 在编译器看来是有可能大于数组长度的,甚至大于数组的容量。

我们假设 index 取得的随机数为 4,那么它大于数组长度,此时 s[:index] 虽然可以成功,但是 s[index:] 是要失败的,因此第二次边界的检查是有必要的。

你可能会说, index 不是最大值为 3 吗?怎么可能是 4呢?

要知道编译器在编译的时候,并不知道 index 的最大值是 3 呢。

小结一下

  1. 当数组的长度和容量相等时,s[:index] 成立能够保证 s[index:] 也成立,因为只要检查一次即可

  2. 当数组的长度和容量不等时,s[:index] 成立不能保证 s[index:] 也成立,因为要检查两次才可以

3.4 案例四

有了上面的铺垫,再来看下面这个示例,由于数组是调用者传入的参数,所以编译器的编译的时候无法得知数组的长度和容量是否相等,因此只能保险一点,两个都检查。

package mainimport ("math/rand"
)func f(s []int, index int) {_ = s[:index] // 第一次检查_ = s[index:] // 第二次检查
}func main()  {}

但是如果把两个表达式的顺序反过来,就只要做一次检查就行了,原因我就不赘述了。

package mainimport ("math/rand"
)func f(s []int, index int) {_ = s[index:] // 第一次检查_ = s[:index] // 不用检查
}func main()  {}

5. 主动消除边界检查

虽然编译器已经非常努力去消除一些应该消除的边界检查,但难免会有一些遗漏。

这就需要"警民合作",对于那些编译器还未考虑到的场景,但开发者又极力追求程序的运行效率的,可以使用一些小技巧给出一些暗示,告诉编译器哪些地方可以不用做边界检查。

比如下面这个示例,从代码的逻辑上来说,是完全没有必要做边界检查的,但是编译器并没有那么智能,实际上每个for循环,它都要做一次边界的检查,非常的浪费性能。

package mainfunc f(is []int, bs []byte) {if len(is) >= 256 {for _, n := range bs {_ = is[n] // 每个循环都要边界检查}}
}
func main()  {}

可以试着在 for 循环前加上这么一句 is = is[:256] 来告诉编译器新 is 的长度为 256,最大索引值为 255,不会超过 byte 的最大值,因为 is[n] 从逻辑上来说是一定不会越界的。

package mainfunc f(is []int, bs []byte) {if len(is) >= 256 {is = is[:256]for _, n := range bs {_ = is[n] // 不需要做边界检查}}
}
func main()  {}

6. 写在最后

本文上面列出的例子并没有涵盖标准编译器支持的所有边界检查消除的情形。本文列出的仅仅是一些常见的情形。

尽管标准编译器中的边界检查消除特性依然不是100%完美,但是对很多常见的情形,它确实很有效。自从标准编译器支持此特性以来,在每个版本更新中,此特性都在不断地改进增强。无需质疑,在以后的版本中,标准编译器会更加得智能,以至于上面第5个例子中提供给编译器的暗示有可能将变得不再必要。谢谢Go语言开发团队出色的工作!

7. 参考文档

  • https://gfw.go101.org/article/bounds-check-elimination.html

往期推荐

  • 一个活跃在众多 Go 项目中的编程模式

  • 几个秒杀 Go 官方库的第三方开源库

  • Go 如何利用 Linux 内核的负载均衡能力

  • Go 中的那些语法糖

b4850535fc20fc878c7f7fedc706132e.png

机器铃砍菜刀

欢迎添加小菜刀微信

加入Golang分享群学习交流!

感谢你的点赞在看哦~

3b14d96a03623966e8ffd88d489b7950.gif

这篇关于这 Go 的边界检查,简直让人抓狂~的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/277387

相关文章

go中的时间处理过程

《go中的时间处理过程》:本文主要介绍go中的时间处理过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1 获取当前时间2 获取当前时间戳3 获取当前时间的字符串格式4 相互转化4.1 时间戳转时间字符串 (int64 > string)4.2 时间字符串转时间

Go语言中make和new的区别及说明

《Go语言中make和new的区别及说明》:本文主要介绍Go语言中make和new的区别及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1 概述2 new 函数2.1 功能2.2 语法2.3 初始化案例3 make 函数3.1 功能3.2 语法3.3 初始化

Go语言中nil判断的注意事项(最新推荐)

《Go语言中nil判断的注意事项(最新推荐)》本文给大家介绍Go语言中nil判断的注意事项,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录1.接口变量的特殊行为2.nil的合法类型3.nil值的实用行为4.自定义类型与nil5.反射判断nil6.函数返回的

Go语言数据库编程GORM 的基本使用详解

《Go语言数据库编程GORM的基本使用详解》GORM是Go语言流行的ORM框架,封装database/sql,支持自动迁移、关联、事务等,提供CRUD、条件查询、钩子函数、日志等功能,简化数据库操作... 目录一、安装与初始化1. 安装 GORM 及数据库驱动2. 建立数据库连接二、定义模型结构体三、自动迁

Linux如何快速检查服务器的硬件配置和性能指标

《Linux如何快速检查服务器的硬件配置和性能指标》在运维和开发工作中,我们经常需要快速检查Linux服务器的硬件配置和性能指标,本文将以CentOS为例,介绍如何通过命令行快速获取这些关键信息,... 目录引言一、查询CPU核心数编程(几C?)1. 使用 nproc(最简单)2. 使用 lscpu(详细信

Go语言代码格式化的技巧分享

《Go语言代码格式化的技巧分享》在Go语言的开发过程中,代码格式化是一个看似细微却至关重要的环节,良好的代码格式化不仅能提升代码的可读性,还能促进团队协作,减少因代码风格差异引发的问题,Go在代码格式... 目录一、Go 语言代码格式化的重要性二、Go 语言代码格式化工具:gofmt 与 go fmt(一)

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

Go语言中泄漏缓冲区的问题解决

《Go语言中泄漏缓冲区的问题解决》缓冲区是一种常见的数据结构,常被用于在不同的并发单元之间传递数据,然而,若缓冲区使用不当,就可能引发泄漏缓冲区问题,本文就来介绍一下问题的解决,感兴趣的可以了解一下... 目录引言泄漏缓冲区的基本概念代码示例:泄漏缓冲区的产生项目场景:Web 服务器中的请求缓冲场景描述代码

Go语言如何判断两张图片的相似度

《Go语言如何判断两张图片的相似度》这篇文章主要为大家详细介绍了Go语言如何中实现判断两张图片的相似度的两种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 在介绍技术细节前,我们先来看看图片对比在哪些场景下可以用得到:图片去重:自动删除重复图片,为存储空间"瘦身"。想象你是一个

Go语言中Recover机制的使用

《Go语言中Recover机制的使用》Go语言的recover机制通过defer函数捕获panic,实现异常恢复与程序稳定性,具有一定的参考价值,感兴趣的可以了解一下... 目录引言Recover 的基本概念基本代码示例简单的 Recover 示例嵌套函数中的 Recover项目场景中的应用Web 服务器中