[Go] 结构体不初始化仍然能够调用其方法

2024-05-14 18:12

本文主要是介绍[Go] 结构体不初始化仍然能够调用其方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

      • 背景
      • 复现
      • 原理
      • 验证
      • 验证2
      • 结论
      • 参考文档

背景

在写代码的时候,偶然没有将结构体初始化,又调用了该结构体的方法,编译器竟然没有报错,而且运行也是正常的。

复现

写了一个小 demo 用于复现,可以看到,声明的 Default 结构体为一个指针,而且并没有将其初始化,接着调用的该结构体的 Hello() 方法

func main() {var d *Defaultd.Hello()
}type Default struct {HAHA string
}func (d *Default) Hello() {fmt.Println("Hello")
}

期望结果是 panic,因为 d 明显是一个空指针,但是实际执行结果却是能够将 Hello 打印出来。

在这里插入图片描述

这不符合预期。

原理

在网络上搜了搜相关的文档,发现流传最广的说法如下:

在 Go 中表达式 Expression.Name 的语法,所调用的函数完全由 Expression 的类型决定。

其调用函数的指向不是由该表达式的特定运行时值来决定,包括我们前面所提到的 nil。

那么我们调用方法时原本以为是

func (d *Default) Hello()

但是实际上是

func Hello(d * Default)

这样一来,能够成功调用也就能理解了。

验证

接下来来验证一下这种说法是否正确。我们使用汇编看一下汇编出来的代码,为了减少汇编代码量,我们将 Hello() 方法里面的 fmt 打印去掉。

func (d *Default) Hello() {// Do nothing
}

汇编命令如下

GOOS=linux GOARCH=amd64 go tool compile -S -N -l main.go

命令解释:

  • -S 将code的汇编输出到标准输出。
  • -N 禁用优化。
  • 禁用内联。

结果如下,我们分段来进行分析

main.(*Default).Hello STEXT nosplit size=6 args=0x8 locals=0x0 funcid=0x0 align=0x00x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  TEXT    main.(*Default).Hello(SB), NOSPLIT|NOFRAME|ABIInternal, $0-80x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  FUNCDATA        $0, gclocals·wgcWObbY2HYnK2SU/U22lA==(SB)0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  FUNCDATA        $1, gclocals·J5F+7Qw7O7ve2QcWC7DpeQ==(SB)0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  FUNCDATA        $5, main.(*Default).Hello.arginfo1(SB)0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  MOVQ    AX, main.d+8(SP)0x0005 00005 (/Users/xxx/work/codepractice/tmp/main.go:14)  RET0x0000 48 89 44 24 08 c3                                H.D$..

我们详细解释一下第一行

0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:12)  TEXT    main.(*Default).Hello(SB), NOSPLIT|NOFRAME|ABIInternal, $0-8
  • 0x0000: 当前指令相对于当前函数的偏移量。

  • main.(*Default).Hello(SB): TEXT 指令声明了 main.(*Default).Hello.text 段(程序代码在运行期会放在内存的 .text 段中)的一部分,并表明跟在这个声明后的是函数的函数体。

  • (SB): SB 是一个虚拟寄存器,保存了静态基地址(static-base) 指针,即我们程序地址空间的开始地址。 "".add(SB) 表明我们的符号位于某个固定的相对地址空间起始处的偏移位置 (最终是由链接器计算得到的)。换句话来讲,它有一个直接的绝对地址: 是一个全局的函数符号。

    所有用户定义的符号都被写为相对于伪寄存器FP(参数以及局部值)和SB(全局值)的偏移量。 SB伪寄存器可以被认为是内存的起始位置,所以对于符号foo(SB)就是名称foo在内存的地址。

    All user-defined symbols are written as offsets to the pseudo-registers FP (arguments and locals) and SB (globals). The SB pseudo-register can be thought of as the origin of memory, so the symbol foo(SB) is the name foo as an address in memory.

  • NOSPLIT: 向编译器表明不应该插入 stack-split 的用来检查栈需要扩张的前导指令。 在我们 add 函数的这种情况下,编译器自己帮我们插入了这个标记: 它足够聪明地意识到,由于 add 没有任何局部变量且没有它自己的栈帧,所以一定不会超出当前的栈;因此每次调用函数时在这里执行栈检查就是完全浪费 CPU 循环了。

    “NOSPLIT”: 不会插入前导码来检查栈是否必须被分裂。协程上的栈帧,以及他所有的调 用,都必须存放在栈顶的空闲空间。用来保护协程诸如栈分裂代码本身。

    “NOSPLIT”: Don’t insert the preamble to check if the stack must be split. The frame for the routine, plus anything it calls, must fit in the spare space at the top of the stack segment. Used to protect routines such as the stack splitting code itself.

  • NOFRAME: (对于TEXT项。)不插入指令以分配栈帧并保存/恢复返回地址,即使这不是叶子函数也是如此。仅适用于声明帧大小为0的函数。

    (For TEXT items.) Do not insert instructions to allocate a stack frame and save/restore the return address, even if this is not a leaf function. Only valid on functions that declare a frame size of 0.

  • ABIInternal:表示ABI类型为ABIInternal,不过汇编 ABIInternal 只能在 runtime 中使用。ABI0 不用写。ABIInternal 定义了一些规则,如参数传递方式、返回值处理方式等,以确保 Go 函数和汇编函数之间能够正确地进行交互。ABI0 遵循平台通用的函数调用约定,实现简单,不用担心底层cpu架构寄存器的差异;ABIInternal 可以指定特定的函数调用规范,可以针对特定性能瓶颈进行优化,在多个Go版本之间可以迭代,灵活性强,支持寄存器传参提升性能。

  • $0-8: $0 代表即将分配的栈帧大小;而 $8 指定了调用方传入的参数大小,为 8 个字节。

    通常来讲,帧大小后一般都跟随着一个参数大小,用减号分隔。(这不是一个减法操作,只是 一种特殊的语法)帧大小 $24-8 意味着这个函数有24个字节的帧以及8个字节的参数,位 于调用者的帧上。如果NOSPLIT没有在TEXT中指定,则必须提供参数大小。对于Go原型的 汇编函数,go vet会检查参数大小是否正确。

    In the general case, the frame size is followed by an argument size, separated by a minus sign. (It’s not a subtraction, just idiosyncratic syntax.) The frame size $24-8 states that the function has a 24-byte frame and is called with 8 bytes of argument, which live on the caller’s frame. If NOSPLIT is not specified for the TEXT, the argument size must be provided. For assembly functions with Go prototypes, go vet will check that the argument size is correct.

可以看到,Hello() 函数是有一个 8 个字节的入参的,而我们知道,在 64 位机器中,指针的大小正好为 8 个字节。说明我们的理论是正确的。

接下来我们可以看一下 main 对 Hello() 方法的调用。

main.main STEXT size=43 args=0x0 locals=0x18 funcid=0x0 align=0x00x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:3)   TEXT    main.main(SB), ABIInternal, $24-00x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:3)   CMPQ    SP, 16(R14)0x0004 00004 (/Users/xxx/work/codepractice/tmp/main.go:3)   PCDATA  $0, $-20x0004 00004 (/Users/xxx/work/codepractice/tmp/main.go:3)   JLS     360x0006 00006 (/Users/xxx/work/codepractice/tmp/main.go:3)   PCDATA  $0, $-10x0006 00006 (/Users/xxx/work/codepractice/tmp/main.go:3)   PUSHQ   BP0x0007 00007 (/Users/xxx/work/codepractice/tmp/main.go:3)   MOVQ    SP, BP0x000a 00010 (/Users/xxx/work/codepractice/tmp/main.go:3)   SUBQ    $16, SP0x000e 00014 (/Users/xxx/work/codepractice/tmp/main.go:3)   FUNCDATA        $0, gclocals·g2BeySu+wFnoycgXfElmcg==(SB)0x000e 00014 (/Users/xxx/work/codepractice/tmp/main.go:3)   FUNCDATA        $1, gclocals·Plqv2ff52JtlYaDd2Rwxbg==(SB)0x000e 00014 (/Users/xxx/work/codepractice/tmp/main.go:4)   MOVQ    $0, main.d+8(SP)0x0017 00023 (/Users/xxx/work/codepractice/tmp/main.go:5)   XORL    AX, AX0x0019 00025 (/Users/xxx/work/codepractice/tmp/main.go:5)   PCDATA  $1, $00x0019 00025 (/Users/xxx/work/codepractice/tmp/main.go:5)   CALL    main.(*Default).Hello(SB)0x001e 00030 (/Users/xxx/work/codepractice/tmp/main.go:6)   ADDQ    $16, SP0x0022 00034 (/Users/xxx/work/codepractice/tmp/main.go:6)   POPQ    BP0x0023 00035 (/Users/xxx/work/codepractice/tmp/main.go:6)   RET0x0024 00036 (/Users/xxx/work/codepractice/tmp/main.go:6)   NOP0x0024 00036 (/Users/xxx/work/codepractice/tmp/main.go:3)   PCDATA  $1, $-10x0024 00036 (/Users/xxx/work/codepractice/tmp/main.go:3)   PCDATA  $0, $-20x0024 00036 (/Users/xxx/work/codepractice/tmp/main.go:3)   CALL    runtime.morestack_noctxt(SB)0x0029 00041 (/Users/xxx/work/codepractice/tmp/main.go:3)   PCDATA  $0, $-10x0029 00041 (/Users/xxx/work/codepractice/tmp/main.go:3)   JMP     00x0000 49 3b 66 10 76 1e 55 48 89 e5 48 83 ec 10 48 c7  I;f.v.UH..H...H.0x0010 44 24 08 00 00 00 00 31 c0 e8 00 00 00 00 48 83  D$.....1......H.0x0020 c4 10 5d c3 e8 00 00 00 00 eb d5                 ..]........rel 26+4 t=7 main.(*Default).Hello+0rel 37+4 t=7 runtime.morestack_noctxt+0

可以看到,在第 14 行调用了该方法。

  • FUNCDATA:FUNCDATA以及PCDATA指令是 gc 相关的,暂时可以忽略。

    FUNCDATA以及PCDATA指令包含有被垃圾回收所使用的信息;这些指令是被编译器加入的。

    The FUNCDATA and PCDATA directives contain information for use by the garbage collector; they are introduced by the compiler.

验证2

既然有接收器的函数会有一个默认入参,入参是接收器本身,那么如果一个没有接收器的函数是不是就没有入参呢。

新写一个 Test() 函数

func Test() {// Do nothing
}

看一下汇编

main.Test STEXT nosplit size=1 args=0x0 locals=0x0 funcid=0x0 align=0x00x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:20)  TEXT    main.Test(SB), NOSPLIT|NOFRAME|ABIInternal, $0-00x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:20)  FUNCDATA        $0, gclocals·g2BeySu+wFnoycgXfElmcg==(SB)0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:20)  FUNCDATA        $1, gclocals·g2BeySu+wFnoycgXfElmcg==(SB)0x0000 00000 (/Users/xxx/work/codepractice/tmp/main.go:22)  RET0x0000 c3

可以看到 $0-0 代表没有入参,也从侧面印证了入参是接收器。

结论

无论方法还是函数都被存储在了 TEXT 段,拥有一个唯一的地址,使用的时候通过地址去找就可以了,而且接收器被当成了一个隐藏的入参传给函数/方法,这就导致了虽然接收器是 nil,但是如果不使用接收器的值的话,代码跑起来是完全没有问题的。

参考文档

https://www.cnblogs.com/cheyunhua/p/15755496.html

https://github.com/go-internals-cn/go-internals/blob/master/chapter1_assembly_primer/README.md

https://cloud.tencent.com/developer/article/1814882?areaId=106001

这篇关于[Go] 结构体不初始化仍然能够调用其方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/989474

相关文章

JVM 的类初始化机制

前言 当你在 Java 程序中new对象时,有没有考虑过 JVM 是如何把静态的字节码(byte code)转化为运行时对象的呢,这个问题看似简单,但清楚的同学相信也不会太多,这篇文章首先介绍 JVM 类初始化的机制,然后给出几个易出错的实例来分析,帮助大家更好理解这个知识点。 JVM 将字节码转化为运行时对象分为三个阶段,分别是:loading 、Linking、initialization

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

如何在页面调用utility bar并传递参数至lwc组件

1.在app的utility item中添加lwc组件: 2.调用utility bar api的方式有两种: 方法一,通过lwc调用: import {LightningElement,api ,wire } from 'lwc';import { publish, MessageContext } from 'lightning/messageService';import Ca

usaco 1.3 Mixing Milk (结构体排序 qsort) and hdu 2020(sort)

到了这题学会了结构体排序 于是回去修改了 1.2 milking cows 的算法~ 结构体排序核心: 1.结构体定义 struct Milk{int price;int milks;}milk[5000]; 2.自定义的比较函数,若返回值为正,qsort 函数判定a>b ;为负,a<b;为0,a==b; int milkcmp(const void *va,c

浅谈主机加固,六种有效的主机加固方法

在数字化时代,数据的价值不言而喻,但随之而来的安全威胁也日益严峻。从勒索病毒到内部泄露,企业的数据安全面临着前所未有的挑战。为了应对这些挑战,一种全新的主机加固解决方案应运而生。 MCK主机加固解决方案,采用先进的安全容器中间件技术,构建起一套内核级的纵深立体防护体系。这一体系突破了传统安全防护的局限,即使在管理员权限被恶意利用的情况下,也能确保服务器的安全稳定运行。 普适主机加固措施:

webm怎么转换成mp4?这几种方法超多人在用!

webm怎么转换成mp4?WebM作为一种新兴的视频编码格式,近年来逐渐进入大众视野,其背后承载着诸多优势,但同时也伴随着不容忽视的局限性,首要挑战在于其兼容性边界,尽管WebM已广泛适应于众多网站与软件平台,但在特定应用环境或老旧设备上,其兼容难题依旧凸显,为用户体验带来不便,再者,WebM格式的非普适性也体现在编辑流程上,由于它并非行业内的通用标准,编辑过程中可能会遭遇格式不兼容的障碍,导致操

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

自定义类型:结构体(续)

目录 一. 结构体的内存对齐 1.1 为什么存在内存对齐? 1.2 修改默认对齐数 二. 结构体传参 三. 结构体实现位段 一. 结构体的内存对齐 在前面的文章里我们已经讲过一部分的内存对齐的知识,并举出了两个例子,我们再举出两个例子继续说明: struct S3{double a;int b;char c;};int mian(){printf("%zd\n",s

c++的初始化列表与const成员

初始化列表与const成员 const成员 使用const修饰的类、结构、联合的成员变量,在类对象创建完成前一定要初始化。 不能在构造函数中初始化const成员,因为执行构造函数时,类对象已经创建完成,只有类对象创建完成才能调用成员函数,构造函数虽然特殊但也是成员函数。 在定义const成员时进行初始化,该语法只有在C11语法标准下才支持。 初始化列表 在构造函数小括号后面,主要用于给