[Go] 结构体不初始化仍然能够调用其方法

2024-05-14 18:12

本文主要是介绍[Go] 结构体不初始化仍然能够调用其方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

      • 背景
      • 复现
      • 原理
      • 验证
      • 验证2
      • 结论
      • 参考文档

背景

在写代码的时候,偶然没有将结构体初始化,又调用了该结构体的方法,编译器竟然没有报错,而且运行也是正常的。

复现

写了一个小 demo 用于复现,可以看到,声明的 Default 结构体为一个指针,而且并没有将其初始化,接着调用的该结构体的 Hello() 方法

func main() {var d *Defaultd.Hello()
}type Default struct {HAHA string
}func (d *Default) Hello() {fmt.Println("Hello")
}

期望结果是 panic,因为 d 明显是一个空指针,但是实际执行结果却是能够将 Hello 打印出来。

在这里插入图片描述

这不符合预期。

原理

在网络上搜了搜相关的文档,发现流传最广的说法如下:

在 Go 中表达式 Expression.Name 的语法,所调用的函数完全由 Expression 的类型决定。

其调用函数的指向不是由该表达式的特定运行时值来决定,包括我们前面所提到的 nil。

那么我们调用方法时原本以为是

func (d *Default) Hello()

但是实际上是

func Hello(d * Default)

这样一来,能够成功调用也就能理解了。

验证

接下来来验证一下这种说法是否正确。我们使用汇编看一下汇编出来的代码,为了减少汇编代码量,我们将 Hello() 方法里面的 fmt 打印去掉。

func (d *Default) Hello() {// Do nothing
}

汇编命令如下

GOOS=linux GOARCH=amd64 go tool compile -S -N -l main.go

命令解释:

  • -S 将code的汇编输出到标准输出。
  • -N 禁用优化。
  • 禁用内联。

结果如下,我们分段来进行分析

main.(*Default).Hello STEXT nosplit size=6 args=0x8 locals=0x0 funcid=0x0 align=0x00x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  TEXT    main.(*Default).Hello(SB), NOSPLIT|NOFRAME|ABIInternal, $0-80x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  FUNCDATA        $0, gclocals·wgcWObbY2HYnK2SU/U22lA==(SB)0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  FUNCDATA        $1, gclocals·J5F+7Qw7O7ve2QcWC7DpeQ==(SB)0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  FUNCDATA        $5, main.(*Default).Hello.arginfo1(SB)0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  MOVQ    AX, main.d+8(SP)0x0005 00005 (/Users/xxx/work/codepractice/tmp/main.go:14)  RET0x0000 48 89 44 24 08 c3                                H.D$..

我们详细解释一下第一行

0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  TEXT    main.(*Default).Hello(SB), NOSPLIT|NOFRAME|ABIInternal, $0-8
  • 0x0000: 当前指令相对于当前函数的偏移量。

  • main.(*Default).Hello(SB): TEXT 指令声明了 main.(*Default).Hello.text 段(程序代码在运行期会放在内存的 .text 段中)的一部分,并表明跟在这个声明后的是函数的函数体。

  • (SB): SB 是一个虚拟寄存器,保存了静态基地址(static-base) 指针,即我们程序地址空间的开始地址。 "".add(SB) 表明我们的符号位于某个固定的相对地址空间起始处的偏移位置 (最终是由链接器计算得到的)。换句话来讲,它有一个直接的绝对地址: 是一个全局的函数符号。

    所有用户定义的符号都被写为相对于伪寄存器FP(参数以及局部值)和SB(全局值)的偏移量。 SB伪寄存器可以被认为是内存的起始位置,所以对于符号foo(SB)就是名称foo在内存的地址。

    All user-defined symbols are written as offsets to the pseudo-registers FP (arguments and locals) and SB (globals). The SB pseudo-register can be thought of as the origin of memory, so the symbol foo(SB) is the name foo as an address in memory.

  • NOSPLIT: 向编译器表明不应该插入 stack-split 的用来检查栈需要扩张的前导指令。 在我们 add 函数的这种情况下,编译器自己帮我们插入了这个标记: 它足够聪明地意识到,由于 add 没有任何局部变量且没有它自己的栈帧,所以一定不会超出当前的栈;因此每次调用函数时在这里执行栈检查就是完全浪费 CPU 循环了。

    “NOSPLIT”: 不会插入前导码来检查栈是否必须被分裂。协程上的栈帧,以及他所有的调 用,都必须存放在栈顶的空闲空间。用来保护协程诸如栈分裂代码本身。

    “NOSPLIT”: Don’t insert the preamble to check if the stack must be split. The frame for the routine, plus anything it calls, must fit in the spare space at the top of the stack segment. Used to protect routines such as the stack splitting code itself.

  • NOFRAME: (对于TEXT项。)不插入指令以分配栈帧并保存/恢复返回地址,即使这不是叶子函数也是如此。仅适用于声明帧大小为0的函数。

    (For TEXT items.) Do not insert instructions to allocate a stack frame and save/restore the return address, even if this is not a leaf function. Only valid on functions that declare a frame size of 0.

  • ABIInternal:表示ABI类型为ABIInternal,不过汇编 ABIInternal 只能在 runtime 中使用。ABI0 不用写。ABIInternal 定义了一些规则,如参数传递方式、返回值处理方式等,以确保 Go 函数和汇编函数之间能够正确地进行交互。ABI0 遵循平台通用的函数调用约定,实现简单,不用担心底层cpu架构寄存器的差异;ABIInternal 可以指定特定的函数调用规范,可以针对特定性能瓶颈进行优化,在多个Go版本之间可以迭代,灵活性强,支持寄存器传参提升性能。

  • $0-8: $0 代表即将分配的栈帧大小;而 $8 指定了调用方传入的参数大小,为 8 个字节。

    通常来讲,帧大小后一般都跟随着一个参数大小,用减号分隔。(这不是一个减法操作,只是 一种特殊的语法)帧大小 $24-8 意味着这个函数有24个字节的帧以及8个字节的参数,位 于调用者的帧上。如果NOSPLIT没有在TEXT中指定,则必须提供参数大小。对于Go原型的 汇编函数,go vet会检查参数大小是否正确。

    In the general case, the frame size is followed by an argument size, separated by a minus sign. (It’s not a subtraction, just idiosyncratic syntax.) The frame size $24-8 states that the function has a 24-byte frame and is called with 8 bytes of argument, which live on the caller’s frame. If NOSPLIT is not specified for the TEXT, the argument size must be provided. For assembly functions with Go prototypes, go vet will check that the argument size is correct.

可以看到,Hello() 函数是有一个 8 个字节的入参的,而我们知道,在 64 位机器中,指针的大小正好为 8 个字节。说明我们的理论是正确的。

接下来我们可以看一下 main 对 Hello() 方法的调用。

main.main STEXT size=43 args=0x0 locals=0x18 funcid=0x0 align=0x00x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:3)   TEXT    main.main(SB), ABIInternal, $24-00x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:3)   CMPQ    SP, 16(R14)0x0004 00004 (/Users/xxx/work/codepractice/tmp/main.go:3)   PCDATA  $0, $-20x0004 00004 (/Users/xxx/work/codepractice/tmp/main.go:3)   JLS     360x0006 00006 (/Users/xxx/work/codepractice/tmp/main.go:3)   PCDATA  $0, $-10x0006 00006 (/Users/xxx/work/codepractice/tmp/main.go:3)   PUSHQ   BP0x0007 00007 (/Users/xxx/work/codepractice/tmp/main.go:3)   MOVQ    SP, BP0x000a 00010 (/Users/xxx/work/codepractice/tmp/main.go:3)   SUBQ    $16, SP0x000e 00014 (/Users/xxx/work/codepractice/tmp/main.go:3)   FUNCDATA        $0, gclocals·g2BeySu+wFnoycgXfElmcg==(SB)0x000e 00014 (/Users/xxx/work/codepractice/tmp/main.go:3)   FUNCDATA        $1, gclocals·Plqv2ff52JtlYaDd2Rwxbg==(SB)0x000e 00014 (/Users/xxx/work/codepractice/tmp/main.go:4)   MOVQ    $0, main.d+8(SP)0x0017 00023 (/Users/xxx/work/codepractice/tmp/main.go:5)   XORL    AX, AX0x0019 00025 (/Users/xxx/work/codepractice/tmp/main.go:5)   PCDATA  $1, $00x0019 00025 (/Users/xxx/work/codepractice/tmp/main.go:5)   CALL    main.(*Default).Hello(SB)0x001e 00030 (/Users/xxx/work/codepractice/tmp/main.go:6)   ADDQ    $16, SP0x0022 00034 (/Users/xxx/work/codepractice/tmp/main.go:6)   POPQ    BP0x0023 00035 (/Users/xxx/work/codepractice/tmp/main.go:6)   RET0x0024 00036 (/Users/xxx/work/codepractice/tmp/main.go:6)   NOP0x0024 00036 (/Users/xxx/work/codepractice/tmp/main.go:3)   PCDATA  $1, $-10x0024 00036 (/Users/xxx/work/codepractice/tmp/main.go:3)   PCDATA  $0, $-20x0024 00036 (/Users/xxx/work/codepractice/tmp/main.go:3)   CALL    runtime.morestack_noctxt(SB)0x0029 00041 (/Users/xxx/work/codepractice/tmp/main.go:3)   PCDATA  $0, $-10x0029 00041 (/Users/xxx/work/codepractice/tmp/main.go:3)   JMP     00x0000 49 3b 66 10 76 1e 55 48 89 e5 48 83 ec 10 48 c7  I;f.v.UH..H...H.0x0010 44 24 08 00 00 00 00 31 c0 e8 00 00 00 00 48 83  D$.....1......H.0x0020 c4 10 5d c3 e8 00 00 00 00 eb d5                 ..]........rel 26+4 t=7 main.(*Default).Hello+0rel 37+4 t=7 runtime.morestack_noctxt+0

可以看到,在第 14 行调用了该方法。

  • FUNCDATA:FUNCDATA以及PCDATA指令是 gc 相关的,暂时可以忽略。

    FUNCDATA以及PCDATA指令包含有被垃圾回收所使用的信息;这些指令是被编译器加入的。

    The FUNCDATA and PCDATA directives contain information for use by the garbage collector; they are introduced by the compiler.

验证2

既然有接收器的函数会有一个默认入参,入参是接收器本身,那么如果一个没有接收器的函数是不是就没有入参呢。

新写一个 Test() 函数

func Test() {// Do nothing
}

看一下汇编

main.Test STEXT nosplit size=1 args=0x0 locals=0x0 funcid=0x0 align=0x00x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:20)  TEXT    main.Test(SB), NOSPLIT|NOFRAME|ABIInternal, $0-00x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:20)  FUNCDATA        $0, gclocals·g2BeySu+wFnoycgXfElmcg==(SB)0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:20)  FUNCDATA        $1, gclocals·g2BeySu+wFnoycgXfElmcg==(SB)0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:22)  RET0x0000 c3

可以看到 $0-0 代表没有入参,也从侧面印证了入参是接收器。

结论

无论方法还是函数都被存储在了 TEXT 段,拥有一个唯一的地址,使用的时候通过地址去找就可以了,而且接收器被当成了一个隐藏的入参传给函数/方法,这就导致了虽然接收器是 nil,但是如果不使用接收器的值的话,代码跑起来是完全没有问题的。

参考文档

https://www.cnblogs.com/cheyunhua/p/15755496.html

https://github.com/go-internals-cn/go-internals/blob/master/chapter1_assembly_primer/README.md

https://cloud.tencent.com/developer/article/1814882?areaId=106001

这篇关于[Go] 结构体不初始化仍然能够调用其方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/989474

相关文章

Python实现图片分割的多种方法总结

《Python实现图片分割的多种方法总结》图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,本文为大家整理了一些常用的分割方法,大家可以根据需求自行选择... 目录1. 基于传统图像处理的分割方法(1) 使用固定阈值分割图片(2) 自适应阈值分割(3) 使用图像边缘检测分割(4)

Java中Switch Case多个条件处理方法举例

《Java中SwitchCase多个条件处理方法举例》Java中switch语句用于根据变量值执行不同代码块,适用于多个条件的处理,:本文主要介绍Java中SwitchCase多个条件处理的相... 目录前言基本语法处理多个条件示例1:合并相同代码的多个case示例2:通过字符串合并多个case进阶用法使用

Python中__init__方法使用的深度解析

《Python中__init__方法使用的深度解析》在Python的面向对象编程(OOP)体系中,__init__方法如同建造房屋时的奠基仪式——它定义了对象诞生时的初始状态,下面我们就来深入了解下_... 目录一、__init__的基因图谱二、初始化过程的魔法时刻继承链中的初始化顺序self参数的奥秘默认

html5的响应式布局的方法示例详解

《html5的响应式布局的方法示例详解》:本文主要介绍了HTML5中使用媒体查询和Flexbox进行响应式布局的方法,简要介绍了CSSGrid布局的基础知识和如何实现自动换行的网格布局,详细内容请阅读本文,希望能对你有所帮助... 一 使用媒体查询响应式布局        使用的参数@media这是常用的

Spring 基于XML配置 bean管理 Bean-IOC的方法

《Spring基于XML配置bean管理Bean-IOC的方法》:本文主要介绍Spring基于XML配置bean管理Bean-IOC的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一... 目录一. spring学习的核心内容二. 基于 XML 配置 bean1. 通过类型来获取 bean2. 通过

Java数组初始化的五种方式

《Java数组初始化的五种方式》数组是Java中最基础且常用的数据结构之一,其初始化方式多样且各具特点,本文详细讲解Java数组初始化的五种方式,分析其适用场景、优劣势对比及注意事项,帮助避免常见陷阱... 目录1. 静态初始化:简洁但固定代码示例核心特点适用场景注意事项2. 动态初始化:灵活但需手动管理代

基于Python实现读取嵌套压缩包下文件的方法

《基于Python实现读取嵌套压缩包下文件的方法》工作中遇到的问题,需要用Python实现嵌套压缩包下文件读取,本文给大家介绍了详细的解决方法,并有相关的代码示例供大家参考,需要的朋友可以参考下... 目录思路完整代码代码优化思路打开外层zip压缩包并遍历文件:使用with zipfile.ZipFil

Python处理函数调用超时的四种方法

《Python处理函数调用超时的四种方法》在实际开发过程中,我们可能会遇到一些场景,需要对函数的执行时间进行限制,例如,当一个函数执行时间过长时,可能会导致程序卡顿、资源占用过高,因此,在某些情况下,... 目录前言func-timeout1. 安装 func-timeout2. 基本用法自定义进程subp

QT进行CSV文件初始化与读写操作

《QT进行CSV文件初始化与读写操作》这篇文章主要为大家详细介绍了在QT环境中如何进行CSV文件的初始化、写入和读取操作,本文为大家整理了相关的操作的多种方法,希望对大家有所帮助... 目录前言一、CSV文件初始化二、CSV写入三、CSV读取四、QT 逐行读取csv文件五、Qt如何将数据保存成CSV文件前言

Python列表去重的4种核心方法与实战指南详解

《Python列表去重的4种核心方法与实战指南详解》在Python开发中,处理列表数据时经常需要去除重复元素,本文将详细介绍4种最实用的列表去重方法,有需要的小伙伴可以根据自己的需要进行选择... 目录方法1:集合(set)去重法(最快速)方法2:顺序遍历法(保持顺序)方法3:副本删除法(原地修改)方法4: