【石上星光】context,go的上下文存储并发控制之道

2024-04-11 01:12

本文主要是介绍【石上星光】context,go的上下文存储并发控制之道,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 1 引言
  • 2 What?
  • 3 How?
    • 3.1 用法一、上下文数据存储
    • 3.2 用法二、并发控制
      • 3.2.1 场景1 主动取消
      • 3.2.2 场景2 超时取消
    • 3.3 用法三、创建一个空Context(emptyCtx)
  • 4 Why?
    • 4.1 go中的上下文思想
      • 4.1.1 上下文是什么?
      • 4.1.2 其他语言中上下文的应用
      • 4.1.3 相比于struct存储,为什么go要把Context作为方法的第一参数?
    • 4.2 go中的并发控制之道
    • 4.3 原理探究
      • 4.3.1 总体概览
      • 4.3.2 上下文数据存储原理
        • 4.3.2.1 数据写入
        • 4.3.2.2 数据读取
      • 4.3.3 并发控制原理
        • 4.3.3.1 主动取消
        • 4.3.3.2 超时取消
      • 4.3.4 原理总结
  • 5 注意点
  • 6 尾语

1 引言

在我们日常开发当中,你肯定会经常遇到这么一种写法

func doSomeThing(ctx context.Context,otherParam int){//dosomething
}

在业务开发当中,几乎所有的方法第一个参数都是ctx,那么这个ctx到底是什么呢?

2 What?

Context是go标准库中一个重要的包,也是go并发编程中的一种重要模式。

主要有以下两种功能:

  • 存储上下文数据
  • 控制Goroutine的生命周期

在go官方推荐的用法中,推荐方法的第一个参数都是context.Context,不要试图把context存储起来。

Do not store Contexts inside a struct type; instead, pass a Context explicitly to each function that needs it. The Context should be the first parameter, typically named ctx:

func DoSomething(ctx context.Context, arg Arg) error {// ... use ctx ...
}

3 How?

3.1 用法一、上下文数据存储

在业务开发中,这种场景比较常见,比如traceid的存入取出。

var key = "trace"// DoSomeThing1 生成traceId放入
func DoSomeThing1(ctx context.Context) {//任意生成的traceIdtrace := "1sadfavsafas"//存入tracenewCtx := context.WithValue(ctx, key, trace)DoSomeThing2(newCtx)
}// DoSomeThing2 取出traceid使用
func DoSomeThing2(ctx context.Context) {//取出traceidtrace := ctx.Value(key)//...
}

DoSomeThing1生成了一个traceid并将其放入ctx,其调用了context.WithValue方法,该方法返回一个新的包含了traceid的ctx,我们将其作为新的ctx传入后续的方法中,放入traceid的逻辑一般在中间件/框架中,我们一般不会感知。

DoSomeThing2从ctx取出traceid并使用。

3.2 用法二、并发控制

3.2.1 场景1 主动取消

newCtx, cancelFunc := context.WithCancel(ctx)
go func(c context.Context) {for {//利用c.Done()返回的通道来判断是否上层是否主动取消select {case <-c.Done()://此时c.Err()返回error携带信息为 "context canceled"print(" c.Err:", c.Err())returndefault:print("doSomethings...")}}
}(newCtx)
//模拟做一些事情
time.Sleep(time.Millisecond * 1)
//上层主动控制取消
cancelFunc()

调用context.WithCancel来获得一个新的具备取消的newCtx和一个取消的方法cancelFunc。

后续调用goroutine时把newCtx传入。

协程中调调用Done方法获得一个通道,该通道可用于感知上层是否主动取消,从而做出一些有针对性的逻辑。

上层通过调用cancelFunc方法来取消ctx。

当然你还可以将取消原因传入

newCtx, cancelFunc := context.WithCancelCause(ctx)
go func(c context.Context) {for {//利用c.Done()返回的通道来判断是否上层是否主动取消select {case <-c.Done()://此时c.Err()返回error携带信息为 "context canceled"print("c.Err:", c.Err().Error())//可以通过context.Cause来获取取消的原因print("cause:", context.Cause(c).Error())returndefault:print("doSomethings...")}}
}(newCtx)
//模拟做一些事情
time.Sleep(time.Millisecond * 1)
//上层主动控制取消
cancelFunc(errors.New("取消原因:我不想继续了"))

3.2.2 场景2 超时取消

在主动取消的基础上,context在其基础还支持另一种超时取消。

//设置超时时间
newCtx, cancelFunc := context.WithTimeout(ctx, time.Millisecond*1)
go func(c context.Context) {for {//利用c.Done()返回的通道来判断是否上层是否主动取消select {case <-c.Done()://主动调用cancel方法返回context canceled,超时返回context deadlineprint("c.Err:", c.Err().Error())//默认情况下超时会返回context deadline exceeded,主动取消会返回context canceledprint("cause:", context.Cause(c).Error())returndefault:print("doSomethings...")}}
}(newCtx)
//模拟做一些事情
time.Sleep(time.Millisecond * 1)
//可以选择主动控制取消
cancelFunc()

我们可以调用context.WithTimeout方法放入超时时间。

为了方便我们调用,context还提供了其他变种操作

newCtx, cancelFunc = context.WithTimeoutCause(ctx, time.Millisecond*1, errors.New("超时取消原因,可以通过context.Cause(c)获取"))
//指定时间超时
newCtx, cancelFunc = context.WithDeadline(ctx, time.Now().Add(time.Millisecond*1))
newCtx, cancelFunc = context.WithDeadlineCause(ctx, time.Now().Add(time.Millisecond*1), errors.New("超时取消原因,可以通过context.Cause(c)获取"))

3.3 用法三、创建一个空Context(emptyCtx)

这个我们直接看用法即可

//一般作为根节点使用,使用场景:初始化/测试
ctx:=context.Background()
//当你没想好用什么类型的context时使用
ctx=context.TODO()

4 Why?

4.1 go中的上下文思想

4.1.1 上下文是什么?

简单来说,就是在 API 之间或者函数调用之间,除了业务参数信息之外的额外信息。比如,服务器接收到客户端的 HTTP 请求之后,可以把客户端的 IP 地址和端口、客户端的身份信息、请求接收的时间、Trace ID 等信息放入到上下文中,这个上下文可以在后端的方法调用中传递。

4.1.2 其他语言中上下文的应用

其实上下文的概念在其他语言也是使用广泛,比如Java 中的ServletContext,ApplicationContext(spring框架),以及Java中的ThreadLocal 类 等等。

相对于go而言,Java上下文的作用只有一个,那就是存值

对于存值而言,go采用的就是参数传递的方式( passed as the first argument in a method),而Java采用的就是结构体存储的方式(stored in a struct type)

4.1.3 相比于struct存储,为什么go要把Context作为方法的第一参数?

这篇官方blog其实已经给出了答案

https://go.dev/blog/context-and-structs

总结一下就是:

  • 更加安全,更容易理解,不用顾虑该Context被其他地方滥用
  • 作为强规范,保证在server里的每个请求都能被正常取消

4.2 go中的并发控制之道

以Java为例,Java中的线程控制往往需要一个“句柄”,才能控制线程,比如Thread.interrupt方法,他需要thread对象才能调用。

相比之下,go由于context的存在,可以很优雅的控制协程。

为了解释go中的并发控制思想,我先来看看go程序是怎么运行的

在这里插入图片描述

如图中所示,每个go程序都是从一个main函数出发的,由main函数开始,我们“开天辟地”,衍生出各种同步/异步的调用。但不管怎么调用,这种调用关系总呈现出一种形态——多叉树

现在我们再来看Context的组织形式。

在这里插入图片描述

怎么样,是不是十分相似!这就是go并发控制的思想核心。

每一次/多次调用都可以抽象为一个context,它的生命周期由这个context去控制。换句话说,每个context背后都意味着一次/多次的调用

你可以这么理解,在go的思想里,context便是协程的 “令牌”

每个协程通过令牌状态(取消or未取消),来决定接下来的行为(继续or阻塞or退出)。

而这枚令牌只能传递给自己的“徒弟”(子节点/调用的函数),所以只有“师傅”有资格拥有这枚令牌,从而“号令”自己的“徒弟”。

对于你的“同门/师傅”,你无法将这枚令牌给他们,因为你没那个机会(context只能作为函数调用的第一个参数传递)。

当然你也有你的“师傅”(父节点),所以当你的“师傅”对你发号施令(cancel),你也得号令你的“徒弟”和你一起(调用子节点的cancel)。

4.3 原理探究

4.3.1 总体概览

首先是接口 Context

type Context interface {//根据key返回value,可以当做map使用Value(key any) any//返回一个通道,用于感知ctx是否结束Done() <-chan struct{}//返回过期时间Deadline() (deadline time.Time, ok bool)//返回上下文err,一般可用于查看ctx关闭的原因(取消/超时)Err() error
}

Context接口有四个方法,Value方法用于用法一(上下文数据存储),剩余三个方法用于用法二(并发控制)

在context包中,实现了该接口的主要结构体有三个:valueCtx、cancelCtx、timerCtx,用于实现不同的功能

type valueCtx struct {Contextkey, val any
}
type cancelCtx struct {Contextmu       sync.Mutex            // protects following fieldsdone     atomic.Value          // of chan struct{}, created lazily, closed by first cancel callchildren map[canceler]struct{} // set to nil by the first cancel callerr      error                 // set to non-nil by the first cancel call
}
type timerCtx struct {cancelCtxtimer *time.Timer // Under cancelCtx.mu.deadline time.Time
}

可以看到每个context内部都持有一个context的指针(struct内嵌了接口),它们的组织关系实际上是一个多叉树。

这种多叉树的结构,和我们调用链非常契合,我想这也是它这么设计的原因。

在这里插入图片描述

接下来你要牢记这张图,这将有利于你理解接下来的原理。

4.3.2 上下文数据存储原理

我们来细看valueCtx结构体

type valueCtx struct {Contextkey, val any
}

可以看到该struct里面内部存了key,val 键值对,而数据的存储就是这一个个key-value。

4.3.2.1 数据写入

之前用法中提到过,数据写入是通过WithValue方法写入的

func WithValue(parent Context, key, val any) Context {if parent == nil {panic("cannot create context from nil parent")}if key == nil {panic("nil key")}if !reflectlite.TypeOf(key).Comparable() {panic("key is not comparable")}return &valueCtx{parent, key, val}
}

可以看到,该方法返回了一个新的context,该context指向的就是原来的ctx。

实际上它就是返回了一个子节点,该子节点上存储了这次存入的key、val键值对。

这就是为什么我们调用WithValue方法后需要将返回值传入后续的方法中。

4.3.2.2 数据读取

调用ctx.Value()即可实现数据读取的操作

func (c *valueCtx) Value(key any) any {if c.key == key {return c.val}return value(c.Context, key)
}func value(c Context, key any) any {for {switch ctx := c.(type) {case *valueCtx:if key == ctx.key {return ctx.val}c = ctx.Contextcase *cancelCtx://本次无关,先隐去...case *timerCtx://本次无关,先隐去...case *emptyCtx:return nildefault:return c.Value(key)}}
}

可以看到数据读取过程是一个不断往上找父节点的过程。当有节点的key相等时,则返回对应的val,否则不断向上查找,直到emptyCtx(一般是根节点)时返回nil。

我们重新来看这张图,

在这里插入图片描述

每个ctx背后都对应着一次函数调用,当前获取到的上下文数据就是父节点的上下文数据,而非后续的子节点/兄弟节点。

这天然和我们函数调用相契合。

4.3.3 并发控制原理

这里我们举两种典型用法为例子,其他变种大同小异。

4.3.3.1 主动取消

我们先来仔细看下cancelCtx结构体,

// A cancelCtx can be canceled. When canceled, it also cancels any children
// that implement canceler.
type cancelCtx struct {Contextmu       sync.Mutex            // protects following fieldsdone     atomic.Value          // of chan struct{}, created lazily, closed by first cancel callchildren map[canceler]struct{} // set to nil by the first cancel callerr      error                 // set to non-nil by the first cancel call
}

其中最重要的便是children这个字段,该字段是一个map,内部存储的是该ctx下所有cancelCtx类型的子节点的指针,就好像图中紫线所示。

在这里插入图片描述

接下来我们看context.WithCancel 是如何创建cancelCtx的

func WithCancel(parent Context) (ctx Context, cancel CancelFunc) {if parent == nil {panic("cannot create context from nil parent")}//1.生成一个子节点结构体c := newCancelCtx(parent)//2.向上寻找上一个cancelCtx,和其建立联系propagateCancel(parent, &c)//3.放回一个匿名函数,其逻辑就是调用了取消方法return &c, func() { c.cancel(true, Canceled) }
}
func newCancelCtx(parent Context) cancelCtx {return cancelCtx{Context: parent}
}

cancelCtx节点生成和valCtx一样,也是生成parent的子节点,内部含一个指针执行父节点。

第二步便是propagateCancel,该函数大致逻辑就是向上寻找上一个cancelCtx,和其建立联系,以下仅展示关键代码

func propagateCancel(parent Context, child canceler) {if p, ok := parentCancelCtx(parent); ok {//若是找到了,则将自己加入上一个cancelCtx的children中if p.children == nil {p.children = make(map[canceler]struct{})}p.children[child] = struct{}{}} else {//若是自身就是那个最顶层的cancelCtx,则会开启一个协程监听父节点是否结束,如果结束则会调用cancel方法atomic.AddInt32(&goroutines, +1)go func() {select {case <-parent.Done():child.cancel(false, parent.Err())case <-child.Done():}}()}
}
//向上找父节点,找不到返回nil,false
func parentCancelCtx(parent Context) (*cancelCtx, bool) {p, ok := parent.Value(&cancelCtxKey).(*cancelCtx)//省略...
}

接下来它会不断向上找上一个cancelCtx

  • 若是找到了,则将自己加入上一个cancelCtx的children中
  • 若是没找到,意味着自身就是那个最顶层的cancelCtx,则会开启一个协程监听父节点是否结束,如果结束则会调用cancel方法

第三步则会返回指向父节点的cancelCtx,同时返回一个匿名函数,该方法内部就调用该节点cancel函数。

接下看cancel函数

func (c *cancelCtx) cancel(removeFromParent bool, err error) {//...d, _ := c.done.Load().(chan struct{})if d == nil {c.done.Store(closedchan)} else {close(d)}for child := range c.children {// NOTE: acquiring the child's lock while holding parent's lock.child.cancel(false, err)}c.children = nil//...
}

cancel方法主要干了两件事:

  • 向done 里存入一个chan,用于通知该ctx已经结束
  • 遍历调用子节点cancelCtx的cancel方法

到此,总结一下主动取消的原理:

  • cancelCtx内部存了下一层cancelCtx类型的子节点指针,当cancel时它也会cancel子节点
  • 调用WithCancel函数返回的是一个子节点ctx,调用过程会将自己“注册”到父节点中;没有父节点的会监听上层ctx是否Done了,当监听到父节点已经结束时,调用自身cancel函数取消
4.3.3.2 超时取消

接下来我们看timerCtx

type timerCtx struct {cancelCtx//计时器,用于到时间了触发cancel函数timer *time.Timer //到期时间deadline time.Time
}

相信聪明的你在看到结构体的时候,就已经恍然大悟了…

可以看到timerCtx内嵌了cancelCtx,这意味着timerCtx拥有所有cancelCtx的能力,在此基础上有两个时间字段timer和deadline。

回到用法二超时取消场景,context通过WithDeadline 和 WithTimeout获取到cancelCtx,这里我们依然只保留关键代码

func WithTimeout(parent Context, timeout time.Duration) (Context, CancelFunc) {return WithDeadline(parent, time.Now().Add(timeout))
}
func WithDeadline(parent Context, d time.Time) (Context, CancelFunc) {//...c := &timerCtx{cancelCtx: newCancelCtx(parent),deadline:  d,}//向父节点注册自己propagateCancel(parent, c)//...//在deadline到来时,调用cancel函数c.timer = time.AfterFunc(dur, func() {c.cancel(true, DeadlineExceeded)})return c, func() { c.cancel(true, Canceled) }
}

其实这里只多了一个逻辑——到了Deadline时间后主动调用cancel函数,以达到超时取消的效果。

4.3.4 原理总结

context本质的数据结构是一种多叉树,它和我们函数调用关系天然契合。

在常规上下文存储数据方面,

  • 每个节点都存储了key,val 键值对
  • 调用参数传递的规范是context上下文不被滥用的核心
  • 查找数据时,会由子节点不断向上查找

在并发控制方面,

  • context可以理解为“令牌”,下游调用的生命周期通过感知“令牌”的状态来进行控制
  • 当context的状态变更,也会导致子节点context状态变更,从而控制下游的调用
  • 超时控制,不过是利用timer包定了个“闹钟”,到时间执行cancel函数

5 注意点

以下是我在业务开发过程中所积累的一点点经验,供大家参考

  • 请求http时,如果整体时间不长,可以重新创建一个ctx来避免超时控制
  • 用接口调用去触发定时任务时,建议开启协程时传入一个新的ctx,避免上层有超时控制
  • 仅对传输进程和 API 边界的请求范围数据使用上下文值,而不用于将可选参数传递给函数(别把本该参数传递的参数,放在context传递,这会造成方法入参不明确)

6 尾语

本文从概念、使用、原理探究,由浅入深地讲解了go的context包,同时阐述我自己的一些理解和思考。

如有不正确的地方,欢迎指正!如有更好的建议,欢迎探讨!

其他碎碎念:

我从大学开始便有写博文的习惯,一开始是因为想记录学习,因为热爱这个专业,当然也夹杂着功利的心态。那一点点成就感让我将这个习惯一直坚持到了大学毕业。

工作之后,便开始有些懈怠,总是觉得自己的时间不够用,其实这也是一个借口,就算有时间,也不一定有动力坚持。

大学时期,想法很天真,总觉得有技术就很“厉害”。工作之后,我开始怀疑,技术是否真的有用,或者说是否真的有必要投入这么多精力去钻研,再或者说——什么是技术?

抱歉,我说的很乱,但这确实是我曾经思考迷茫的问题。

因为一些缘故,我觉得不能再这样懈怠下去,不管是什么原因,我都应该拾起曾经丢掉的一些东西,于是我迸生出一个想法,就是这个博文系列,我给它起名叫作 【石上星光】。

在这个系列中我希望写一些 有体系、高质量、更纯粹的文章,希望我能坚持下去吧。

这篇关于【石上星光】context,go的上下文存储并发控制之道的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/892677

相关文章

使用JavaScript操作本地存储

《使用JavaScript操作本地存储》这篇文章主要为大家详细介绍了JavaScript中操作本地存储的相关知识,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... 目录本地存储:localStorage 和 sessionStorage基本使用方法1. localStorage

Go信号处理如何优雅地关闭你的应用

《Go信号处理如何优雅地关闭你的应用》Go中的优雅关闭机制使得在应用程序接收到终止信号时,能够进行平滑的资源清理,通过使用context来管理goroutine的生命周期,结合signal... 目录1. 什么是信号处理?2. 如何优雅地关闭 Go 应用?3. 代码实现3.1 基本的信号捕获和优雅关闭3.2

Python实现局域网远程控制电脑

《Python实现局域网远程控制电脑》这篇文章主要为大家详细介绍了如何利用Python编写一个工具,可以实现远程控制局域网电脑关机,重启,注销等功能,感兴趣的小伙伴可以参考一下... 目录1.简介2. 运行效果3. 1.0版本相关源码服务端server.py客户端client.py4. 2.0版本相关源码1

Spring Security 基于表达式的权限控制

前言 spring security 3.0已经可以使用spring el表达式来控制授权,允许在表达式中使用复杂的布尔逻辑来控制访问的权限。 常见的表达式 Spring Security可用表达式对象的基类是SecurityExpressionRoot。 表达式描述hasRole([role])用户拥有制定的角色时返回true (Spring security默认会带有ROLE_前缀),去

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

HDFS—存储优化(纠删码)

纠删码原理 HDFS 默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。 Hadoop3.x 引入了纠删码,采用计算的方式,可以节省约50%左右的存储空间。 此种方式节约了空间,但是会增加 cpu 的计算。 纠删码策略是给具体一个路径设置。所有往此路径下存储的文件,都会执行此策略。 默认只开启对 RS-6-3-1024k

高并发环境中保持幂等性

在高并发环境中保持幂等性是一项重要的挑战。幂等性指的是无论操作执行多少次,其效果都是相同的。确保操作的幂等性可以避免重复执行带来的副作用。以下是一些保持幂等性的常用方法: 唯一标识符: 请求唯一标识:在每次请求中引入唯一标识符(如 UUID 或者生成的唯一 ID),在处理请求时,系统可以检查这个标识符是否已经处理过,如果是,则忽略重复请求。幂等键(Idempotency Key):客户端在每次

Go Playground 在线编程环境

For all examples in this and the next chapter, we will use Go Playground. Go Playground represents a web service that can run programs written in Go. It can be opened in a web browser using the follow

go基础知识归纳总结

无缓冲的 channel 和有缓冲的 channel 的区别? 在 Go 语言中,channel 是用来在 goroutines 之间传递数据的主要机制。它们有两种类型:无缓冲的 channel 和有缓冲的 channel。 无缓冲的 channel 行为:无缓冲的 channel 是一种同步的通信方式,发送和接收必须同时发生。如果一个 goroutine 试图通过无缓冲 channel

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而