mysql insert 源码_MySQL源码学习(四):从insert看btr

2023-10-19 17:30

本文主要是介绍mysql insert 源码_MySQL源码学习(四):从insert看btr,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Btr: B+ Tree,是innodb的核心数据结构,它作为数据的索引,让数据库能够快速找到指定的数据。

B+ Tree的相关说明网上已经很多,本文通过insert操作的调用栈,来分析btr的操作过程。

·Btr操作在insert的哪个过程中被调用?

ac0925e43487cd09b2613c5282f5cd5a.png

图1 insert的函数调用栈(btr部分)

图1是一次insert操作打印的trace日志。大家可以看到第一行write_record函数,这个步骤是在mysql_insert函数中调用的。下面先调用innobase的write_row接口来执行pimary key的auto_increment操作,生成主键。然后再调用row_ins方法来向btr中插入数据。

本文要关注的流程主要在row_ins中的流程。

·row_ins

该函数在storage/innobase/row/row0ins.cc文件中,可以看出这是跟存储引擎相关的操作。

af5eb5f5d9e2c6a1bc5c0dfdfb26547a.png

图2 row_ins的主要流程

其中,Trace日志中打印了其中的3个流程,就包含在“插入index和数据”这个步骤中”:

row_ins_index_entry_step

|  row_ins_cluster_index_entry_low

|  |  btr_cur_search_to_nth_level

row_ins_index_entry_step:向表中插入一个索引

row_ins_cluster_index_entry_low: cluster_index这里是指聚簇索引,很熟悉的词吧。这里会插入一个聚簇索引,并且忽略外键的限制。如果发现主键已经存在(主键冲突),那么除非这条已经有的记录已经被事务标记为“已删除”,否则就会报主键冲突错误。

btr_cur_search_to_nth_level:  在btr上搜索指定的索引,并把cursor定位到指定的level。改函数支持两种模式,PAGE_CUR_LE和PAGE_CUR_GE。Insert使用PAGE_CUR_LE这种方式进行搜索。

·分配index

84a794f21f039b5b808013e00a9b5f70.png

图3 index的获取

row_ins函数第一部分,通过dict_table_get_first_index(node->table)来获取索引。Row_ins_get_row_from_select和row_ins_get_row_from_values分别对应了INSERT … SELECT语句和INSERT … values语句(包括多个values)。这两个函数中会把value值保存到node对象中。

·插入数据

1e4377e48aa758d6ea7d9bf415732537.png

图4 index和数据的插入

如图4所示,row_ins_index_entry_step方法是执行index插入的入口方法。返回如果成功,则说明插入成功。如果返回错误码是DB_DUPLICTE_KEY,则会判断是否包含了on duplicate update的语法,如果有的话,则会将索引保存到node->duplicate对象中,以便后面继续执行。如果没有包含on duplicate update的语法,则直接返回主键冲突的错误。

row_ins_index_entry_step中的三个主要流程上面已经介绍过。这里重点看row_ins_clust_index_entry_low函数中的流程:

bea701543bfbf7ea9ef4da8cd442c4ef.png

图5 获取btr中的cursor

btr_pcur_open方法,获取到这个新生成的index到底放到btr的哪个位置。这个位置,就由Cursor来标记标记。

bf7ee4f6496cd379650786741ef1985e.png

图6 btr_pcur_get_btr_cur宏定义

·pcur和cursor的关系

pcur是persistent cursor。因为btr是会分裂和变动的,当btr被分裂时,cursor的位置也会对应的进行变化。因此通过一层pcur的封装,将cursor的变化对外屏蔽,针对一个index,我们只需要通过一个固定的pcur去获取当前的cursor就可以了。

678eebed8355fbada23da252aa2eb892.png

图7 btr_pcur_t依赖于btr_cur

获取到了真实的cursor后,就可以拿到对应的leaf节点,就是具体的page。如图8所示,btr的leaf是page,而不是record,从这两个代码就可以证明。而插入的数据最终,是写入到rec_t中的。这里只是对page是否有记录做了初步的判断,记录的插入请看图9:。

2e6e930478cc52dc3a0b1a2f2e82f2c5.png

图8 通过cursor拿到page

请看图9中的btr_cur_optimistic_insert方法:

a2ce1b0622536d31fedd1e7e0f2023bc.png

图9 数据的插入

该方法会把记录写入到record中,同时如果需要重做btr,会着这里面进行调整。

0b39f9dc30f8b1634c88a4aecdc94f25.png

图10 插入流程

如图10所示,首先通过cursor拿到page,并记录下插入之间的record地址。通过page_cur_tuple_direct_insert方法插入记录后。再次通过相同cursor拿到record地址,并判断插入前和插入后的record地址是否相同。如果不同,说明btr发生了重构。这也证明了corsor指向的btr位置是在不断变化的。Corsor是在btr上的绝对位置,而这个位置上的数据会因为btr的重构而改变,因此外面加入了一层psersistent cursor,使得能够通过同一个index快速找到cursor。

这篇关于mysql insert 源码_MySQL源码学习(四):从insert看btr的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/241279

相关文章

将sqlserver数据迁移到mysql的详细步骤记录

《将sqlserver数据迁移到mysql的详细步骤记录》:本文主要介绍将SQLServer数据迁移到MySQL的步骤,包括导出数据、转换数据格式和导入数据,通过示例和工具说明,帮助大家顺利完成... 目录前言一、导出SQL Server 数据二、转换数据格式为mysql兼容格式三、导入数据到MySQL数据

MySQL分表自动化创建的实现方案

《MySQL分表自动化创建的实现方案》在数据库应用场景中,随着数据量的不断增长,单表存储数据可能会面临性能瓶颈,例如查询、插入、更新等操作的效率会逐渐降低,分表是一种有效的优化策略,它将数据分散存储在... 目录一、项目目的二、实现过程(一)mysql 事件调度器结合存储过程方式1. 开启事件调度器2. 创

SQL Server使用SELECT INTO实现表备份的代码示例

《SQLServer使用SELECTINTO实现表备份的代码示例》在数据库管理过程中,有时我们需要对表进行备份,以防数据丢失或修改错误,在SQLServer中,可以使用SELECTINT... 在数据库管理过程中,有时我们需要对表进行备份,以防数据丢失或修改错误。在 SQL Server 中,可以使用 SE

Go中sync.Once源码的深度讲解

《Go中sync.Once源码的深度讲解》sync.Once是Go语言标准库中的一个同步原语,用于确保某个操作只执行一次,本文将从源码出发为大家详细介绍一下sync.Once的具体使用,x希望对大家有... 目录概念简单示例源码解读总结概念sync.Once是Go语言标准库中的一个同步原语,用于确保某个操

mysql外键创建不成功/失效如何处理

《mysql外键创建不成功/失效如何处理》文章介绍了在MySQL5.5.40版本中,创建带有外键约束的`stu`和`grade`表时遇到的问题,发现`grade`表的`id`字段没有随着`studen... 当前mysql版本:SELECT VERSION();结果为:5.5.40。在复习mysql外键约

SQL注入漏洞扫描之sqlmap详解

《SQL注入漏洞扫描之sqlmap详解》SQLMap是一款自动执行SQL注入的审计工具,支持多种SQL注入技术,包括布尔型盲注、时间型盲注、报错型注入、联合查询注入和堆叠查询注入... 目录what支持类型how---less-1为例1.检测网站是否存在sql注入漏洞的注入点2.列举可用数据库3.列举数据库

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

mysql数据库分区的使用

《mysql数据库分区的使用》MySQL分区技术通过将大表分割成多个较小片段,提高查询性能、管理效率和数据存储效率,本文就来介绍一下mysql数据库分区的使用,感兴趣的可以了解一下... 目录【一】分区的基本概念【1】物理存储与逻辑分割【2】查询性能提升【3】数据管理与维护【4】扩展性与并行处理【二】分区的

MySQL中时区参数time_zone解读

《MySQL中时区参数time_zone解读》MySQL时区参数time_zone用于控制系统函数和字段的DEFAULTCURRENT_TIMESTAMP属性,修改时区可能会影响timestamp类型... 目录前言1.时区参数影响2.如何设置3.字段类型选择总结前言mysql 时区参数 time_zon

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat