Vastbase编程利器:PL/pgSQL原理简介

2024-03-28 10:28

本文主要是介绍Vastbase编程利器:PL/pgSQL原理简介,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

PL/pgSQL是Vastbase提供的一种过程语言,在普通SQL语句的使用上增加了编程语言的特点,可以用于创建函数、存储过程、触发器过程以及创建匿名块等。

本文介绍Vastbase中PL/pgSQL的执行流程,包括PL/pgSQL的编译运行


1、编译

PL/pgSQL的编译部分核心是解释出可以被内核识别的变量、命名空间和语句节点链表

1.1 编译上下文

typedef struct PLpgSQL_compile_context {struct PLpgSQL_datum** plpgsql_Datums;struct PLpgSQL_function* plpgsql_curr_compile;struct PLpgSQL_nsitem* ns_top;
}

PLpgSQL_compile_context结构用来保存编译期间的上下文信息,其核心成员是plpgsql_Datums、ns_top和plpgsql_curr_compile。

  • plpgsql_Datums:保存识别出的变量,是一个数组
  • ns_top:保存识别出的命名空间,是一个链表
  • plpgsql_curr_compile:保存识别出的语句节点链表

1.2 变量数组

typedef struct PLpgSQL_datum { /* Generic datum array item */int dtype; /* 变量类型 */int dno; /* 变量在变量数组的下标,即变量是变量数组的第几个元素 */
} PLpgSQL_datum;

PL/pgSQL支持多种类型的变量,包括普通的变量、表达式、复合类型和数组类型等。不同的变量类型用相应的结构表示,例如:普通变量使用PLpgSQL_var表示,表达式使用PLpgSQL_expr表示等。

Vastbase使用面向对象的思想,设计PL/pgSQL的变量,PLpgSQL_datum结构表示变量的抽象父类,共有4个结构体成员,PLpgSQL_var和PLpgSQL_expr等表示子类,子类结构的前4个成员与PLpgSQL_datum结构保持一致。

PL/pgSQL变量的来源主要有:

  • 函数的入参
  • 声明部分声明的变量
  • 内置变量,例如found变量和游标变量等

1.3 命名空间链表

typedef struct PLpgSQL_nsitem { /* Item in the compilers namespace tree */int itemtype; /* 命名空间类型 */int itemno; /* 命名空间关联的变量在变量数组的下标 */struct PLpgSQL_nsitem* prev; /* 指向上一个命名空间 */char name[FLEXIBLE_ARRAY_MEMBER]; /* 命名空间字符串 */
} PLpgSQL_nsitem;

PL/pgSQL里,命名空间(namespace)表示变量或标签的名称。主要有以下类型的命名空间:

PL/pgSQL在运行语句时,通过标识符查找命名空间链表,若查找到命名空间,则根据命名空间的itemno在变量数组里获取变量,进行相应的操作。

1.4 语法解析

Vastbase的PL/pgSQL有独立的词法分析和语法分析器。PL/pgSQL主要有两种大类的块:声明块语句块

声明块

声明块是以DECLARE关键字作为开始标记以BEGIN关键字作为结束标记的语句块

在声明块内可以声明变量和定义类型。新定义的类型会被记录到系统表元信息中。声明的变量会被记录到变量数组和命名空间链表里,对于复合类型的变量,PL/pgSQL会对其进行展开,即会创建${变量名}.${属性}这样的变量和命名空间。

语句块

语句块是指以BEGIN关键字作为开始标记,以END关键字作为结束标记的语句块

语句块内可以嵌套新的声明块和语句块。内层语句块可以访问外层声明块的类型和变量,反之不允许。

语句块以分号作为语句分隔符,每个语句都会被解析为不同类型的语句节点。

typedef struct { /* One EXCEPTION ... WHEN clause */PLpgSQL_condition* conditions;List* action; /* List of statements */
} PLpgSQL_exception;typedef struct PLpgSQL_stmt_block {List* body; /* List of statements */PLpgSQL_exception_block* exceptions;
} PLpgSQL_stmt_block;

PL/pgSQL使用PLpgSQL_stmt_block结构表示经过语法解析后的PL/pgSQL语句块,PLpgSQL_stmt_block结构有两个核心的成员,分别是body和exceptions。

body是语句块内正常运行的语句节点链表。

exceptions是PLpgSQL_exception类型变量链表。

当语句节点链表内的语句发生异常时,进入exceptions成员表示的异常处理流程。PLpgSQL_exception结构里,conditions成员表示该异常处理块的异常类型,action成员就是该类型异常的处理语句节点链表,当运行时发生了匹配conditions的异常,则执行该异常的action进行异常处理。

PL/pgSQL支持的语句类型比较丰富,以下是一些常用的语句类型归类:

  • 嵌套语句块:PLPGSQL_STMT_BLOCK
  • 赋值语句:PLPGSQL_STMT_ASSIGN
  • 条件分支:PLPGSQL_STMT_IF/PLPGSQL_STMT_GOTO/PLPGSQL_STMT_CASE
  • 循环控制:PLPGSQL_STMT_LOOP/PLPGSQL_STMT_WHILE/PLPGSQL_STMT_FORI/PLPGSQL_STMT_FORS/PLPGSQL_STMT_FORC/PLPGSQL_STMT_FOREACH_A/PLPGSQL_STMT_EXIT
  • 返回语句:PLPGSQL_STMT_RETURN/PLPGSQL_STMT_RETURN_NEXT/PLPGSQL_STMT_RETURN_QUERY
  • 打印输出:PLPGSQL_STMT_RAISE
  • 执行语句:PLPGSQL_STMT_EXECSQL/PLPGSQL_STMT_DYNEXECUTE/PLPGSQL_STMT_DYNFORS/PLPGSQL_STMT_PERFORM
  • 游标相关:PLPGSQL_STMT_OPEN/PLPGSQL_STMT_FETCH/PLPGSQL_STMT_CLOSE
  • 事务控制:PLPGSQL_STMT_COMMIT/PLPGSQL_STMT_ROLLBACK/PLPGSQL_STMT_SAVEPOINT
  • 其他:PLPGSQL_STMT_GETDIAG/PLPGSQL_STMT_NULL/PLPGSQL_STMT_SIGNAL/PLPGSQL_STMT_RESIGNAL

1.5 编译缓存

PL/pgSQL的编译是一个耗时操作,每次运行前都重新编译对性能来说影响非常大。为解决这个问题,对于使用PL/pgSQL定义的函数/存储过程,Vastbase 把编译结果缓存在会话的内存中。在会话运行期间,如果函数/存储过程的定义没有发生变化,则只需要编译一次,后续函数/存储过程的运行会从缓存获取编译结果。

2、运行

PL/pgSQL运行依赖SPI(Server Programming Interface)机制,把需要运行的SQL语句发送到内核模块中,内核模块通过预定义的钩子函数对语句中引用的变量进行解析处理。

2.1 SPI机制

SPI机制提供了一系列接口连接并访问数据库内核,

PLPGSQL_STMT_EXECSQL语句节点的工作流程大致如下图:

  • 流程说明
  • SPI_connect:PL/pgSQL语句块执行前,连接到内核服务端,整个语句块的执行只需要连接一次
  • SPI_prepare_params:发送待执行的sql语句到服务端,获取执行计划
  • setup_param_list:设置语句的参数
  • SPI_execute_plan_with_paramlist:发送参数到服务的,执行语句
  • SPI_finish:断开与内核服务端的连接,释放资源

2.2 执行语句块

PL/pgSQL经过编译后,编译上下文保存了变量数组、命名空间链表和语句节点链表。如下图,执行语句实际上就是遍历语句节点链表,根据不同的语句节点类型,调用不同的处理函数。

2.3 异常处理

如下图所示,异常处理块实际上是通过PG_TRY/PG_CATCH/PG_END_TRY实现

当调用exec_stmt_block执行的语句块时,如果PLpgSQL_stmt_block的exceptions成员不为空,即定义了异常处理块,则使用PG_TRY/PG_CATCH/PG_END_TRY异常处理工具进行exec_stmts(block→body)的调动,捕获异常后,调用exec_stmts(exception→action)进行异常处理。

2.4 参数处理

PL/pgSQL内允许语句内引用声明块内声明的变量或函数入参,代码如下:

CREATE TABLE t_test(id INT);
DECLARE id INT;
BEGINid := 1;INSERT INTO t_test values (id);
END;
/

第6行的INSERT语句会被语法解析器解析成PLPGSQL_STMT_EXECSQL语句节点,PL/pgSQL会把整个语句原封不动发送到内核服务端中并生成计划,那么内核的语义分析模块就需要识别出括号内的id标识符是一个参数。

Vastbase通过钩子函数实现参数识别和值替换,代码如下:

struct ParseState {PreParseColumnRefHook p_pre_columnref_hook;PostParseColumnRefHook p_post_columnref_hook;ParseParamRefHook p_paramref_hook;
}
typedef struct ParamListInfoData {ParamFetchHook paramFetch; /* parameter fetch hook */
} ParamListInfoData;

通过设置ParseState结构p_post_columnref_hook钩子,内核在进行对写入字段进行语义分析时,会调用钩子函数,该钩子函数对命名空间链表进行查找,如果查找到则构造Param节点记录变量在PL/pgSQL变量里数组中的位置和类型,并挂载Query树上。

通过设置ParamListInfoData结构paramFetch钩子,内核在生成执行计划的预处理表达式阶段,调用该钩子,根据Param结构信息拿到该参数的在变量值,并把该Param结构替换为Const结构。

通过两个钩子函数,使得PL/pgSQL执行sql语句时,可以引用声明块内声明的变量或函数入参。

3、总结

通过上述介绍可以看出,Vastbase的PL/pgSQL模块与常规的编程语言类似,均支持赋值、条件分支、循环等多种语句类型,通过PL/pgSQL模块,可以在Vastbase服务端编写较为复杂的逻辑。其生命周期分为编译和运行两个阶段,使用PL/pgSQL编写函数/存储过程时,还通过缓存编译结果,使得函数调用变得更加高效。

这篇关于Vastbase编程利器:PL/pgSQL原理简介的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/855353

相关文章

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

hdu4407(容斥原理)

题意:给一串数字1,2,......n,两个操作:1、修改第k个数字,2、查询区间[l,r]中与n互质的数之和。 解题思路:咱一看,像线段树,但是如果用线段树做,那么每个区间一定要记录所有的素因子,这样会超内存。然后我就做不来了。后来看了题解,原来是用容斥原理来做的。还记得这道题目吗?求区间[1,r]中与p互质的数的个数,如果不会的话就先去做那题吧。现在这题是求区间[l,r]中与n互质的数的和

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

【编程底层思考】垃圾收集机制,GC算法,垃圾收集器类型概述

Java的垃圾收集(Garbage Collection,GC)机制是Java语言的一大特色,它负责自动管理内存的回收,释放不再使用的对象所占用的内存。以下是对Java垃圾收集机制的详细介绍: 一、垃圾收集机制概述: 对象存活判断:垃圾收集器定期检查堆内存中的对象,判断哪些对象是“垃圾”,即不再被任何引用链直接或间接引用的对象。内存回收:将判断为垃圾的对象占用的内存进行回收,以便重新使用。

业务协同平台--简介

一、使用场景         1.多个系统统一在业务协同平台定义协同策略,由业务协同平台代替人工完成一系列的单据录入         2.同时业务协同平台将执行任务推送给pda、pad等执行终端,通知各人员、设备进行作业执行         3.作业过程中,可设置完成时间预警、作业节点通知,时刻了解作业进程         4.做完再给你做过程分析,给出优化建议         就问你这一套下

键盘快捷键:提高工作效率与电脑操作的利器

键盘快捷键:提高工作效率与电脑操作的利器 在数字化时代,键盘快捷键成为了提高工作效率和优化电脑操作的重要工具。无论是日常办公、图像编辑、编程开发,还是游戏娱乐,掌握键盘快捷键都能带来极大的便利。本文将详细介绍键盘快捷键的概念、重要性、以及在不同应用场景中的具体应用。 什么是键盘快捷键? 键盘快捷键,也称为热键或快捷键,是指通过按下键盘上的一组键来完成特定命令或操作的方式。这些快捷键通常涉及同

hdu4407容斥原理

题意: 有一个元素为 1~n 的数列{An},有2种操作(1000次): 1、求某段区间 [a,b] 中与 p 互质的数的和。 2、将数列中某个位置元素的值改变。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.Inpu

hdu4059容斥原理

求1-n中与n互质的数的4次方之和 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;import java.io.PrintWrit