【MySQL数据库开发设计规范】之SQL使用规范

2024-05-16 04:12

本文主要是介绍【MySQL数据库开发设计规范】之SQL使用规范,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎点开这篇文章,自我介绍一下哈,本人姑苏老陈 ,是一名JAVA开发老兵。

本文收录于 《MySQL数据库开发设计规范》专栏中,该专栏主要分享一些关于MySQL数据库开发设计相关的技术规范文章,定期更新,欢迎关注,谢谢 :-)

文章目录

    • 一、前言
    • 二、SQL使用规范
    • 三、总结

一、前言

在我们对数据库技术方案设计的时候,我们是否有自己的设计理念或者原则,还是更多的依据自己的直觉去设计,是否曾经懊悔线上发生过的一次低级故障,可能稍微注意点就可以避免,是否想过怎么才能很好的避免,规范的价值正是我们工作的检查清单,需要我们不断从错误中积累有效经验来指导未来的工作。

本文介绍MySQL数据库开发设计规范之SQL使用规范。

PS:以下规范在大型互联网公司经过了充分的验证,尤其适用于并发量大、数据量大的业务场景。

在这里插入图片描述

二、SQL使用规范

1.【强制】禁止使用SELECT *,只获取必要的字段,需要显示说明列属性;
说明:按需获取字段,可以减少网络带宽消耗,能有效利用覆盖索引,表结构变更对程序基本无影响。

2.【强制】禁止使用INSERT INTO t_xxx VALUES(xxx),必须显示指定插入的列属性;

3.【强制】WHERE条件中必须使用合适的类型,避免MySQL进行隐式类型转化;
说明:因为MySQL进行隐式类型转化之后,可能会将索引字段类型转化成=号右边值的类型,导致使用不到索引,原因和避免在索引字段中使用函数是类似的;

示例:select uid from t_user where phone=15855550101,其中phone字段为varchar类型,此时查询中使用数字查询,会导致索引失效);

4.【强制】禁止在WHERE条件的属性上使用函数或者表达式;

反例:SELECT uid FROM t_user WHERE from_unixtime(day)>='2024-05-12',会导致全表扫描;正例:SELECT uid FROM t_user WHERE day>= unix_timestamp('2024-05-12 00:00:00');反例:SELECT uid FROM t_user WHERE age +1>40,会导致全表扫描;

5.【强制】禁止负向查询,以及%开头的模糊查询;
说明:负向查询比如使用NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等,会导致全表扫描;

反例:select * from t_user where user_name like ‘%子轩’;
反例:select * from t_user where user_name not like ‘陈%’;

6.【强制】应用程序必须捕获SQL异常,并有相应处理;

7.【推荐】sql语句尽可能简单、大的sql想办法拆成小的sql语句;
说明:简单的SQL容易使用到MySQL的querycache、减少锁表时间特别是MyISAM、可以使用多核cpu;

8.【推荐】事务要简单,整个事务的时间长度不要太长;

9.【强制】避免在数据库中进行数学运算或者函数运算;
说明:MySQ不擅长数学运算和逻辑判断,在数据库中进行数学运算或者函数运算,也容易将业务逻辑和DB耦合在一起;

10.【推荐】sql中使用到OR的改写为用IN() ;
说明:or的效率没有in的效率高;

11.【参考】SQL语句中IN包含的值不应过多,里面数字的个数建议控制在1000个以内;

12.【推荐】limit分页注意效率,Limit越大,效率越低。
说明: Limit过大的改下方法如下

1)改写方法一
延迟回表写法,select xx,xx from t t1, (select id from t where ....  limit 10000,10) t2 where t1.id = t2.id;
2)改写方法二
select id from t limit 10000, 10; 应该改为 => select id from t where id > 10000 limit 10;

13.【推荐】尽量使用union all替代union;

14.【参考】避免使用大表JOIN;

15.【推荐】对数据的更新要打散后批量更新,不要一次更新太多数据;

16.【推荐】使用合理的SQL语句减少与数据库的交互次数;

17.【参考】注意使用性能分析工具Sql explain / showprofile / mysqlsla;

18.【推荐】能不用NOT IN就不用NOT IN,坑太多了,会把空和NULL给查出来;

19.【推荐】关于分页查询,程序里建议合理使用分页来提高效率,limit、offset较大要配合子查询使用;

20.【强制】禁止在线上数据库中跑大查询;

21.【强制】禁止单条SQL语句同时更新多个表;

22.【推荐】统计表中记录数时使用COUNT(*),而不是COUNT(primary_key)和COUNT(1);
说明:count( * ) 会统计值为 NULL 的行,而 count( 列名 ) 不会统计此列为 NULL 值的行;

23.【推荐】上万条大数据量批量插入时,INSERT语句使用batch提交,values的个数不应过多;
说明:INSERT语句使用batch提交,格式为INSERT INTO tableVALUES(),(),()……;

例如:
INSERT INTO students (id, name) VALUES
(1, 'Alice'),
(2, 'Bob'),
(3, 'Charlie');

24.【推荐】获取大量数据时,建议分批次获取数据,每次获取数据少于2000条,结果集应小于1M;

25.【推荐】在做开发时建议使用数据库框架(如mybatis)或prepared statement,可以提升性能并避免SQL注入;

26.【强制】禁止跨库查询(为数据迁移和分库分表留出余地,降低耦合度,降低风险);

27.【推荐】尽量避免使用子查询,可以把子查询优化为join操作;
说明: 子查询是嵌套在另一个 SELECT, INSERT, UPDATE, 或 DELETE查询的 SQL 查询。子查询的结果集无法使用索引,子查询会产生临时表操作,如果子查询数据量大会影响效率,消耗过多的CPU及IO资源。

28.【强制】超过三个表禁止join。
说明:需要join的字段,数据类型必须绝对一致;多表关联查询时,保证被关联的字段需要有索引。即使双表join也要注意表索引、SQL 性能。

29.【推荐】SQL性能优化的目标:至少要达到range级别,要求是ref级别,如果可以的话,consts最好;

30.【推荐】尽量不要使用物理删除(即直接删除,如果要删除的话提前做好备份),而是使用逻辑删除,使用字段delete_flag做逻辑删除,类型为tinyint,0表示未删除,1表示已删除;

31.【强制】在代码中写分页查询逻辑时,若count 为0应直接返回,避免执行后面的分页语句;

32.【强制】程序连接不同的数据库要使用不同的账号;

33.【推荐】使用ISNULL()来判断是否为NULL值;

三、总结

以上介绍了软件开发过程中,在使用SQL语句时,可以遵循的一些技术规范。希望对大家有帮助,谢谢 :-)

附本文参考资料:

  • 阿里云官方知乎:https://www.zhihu.com/org/a-li-yun-97-77
  • 阿里云开发者官方社区:https://developer.aliyun.com/
  • 阿里开发者官方CSDN社区:https://blog.csdn.net/alitech2017?type=blog
  • 阿里云云栖号CSDN:https://blog.csdn.net/yunqiinsight/category_10231626.html
  • 阿里巴巴技术团队发布的《JAVA开发手册》泰山版
  • 阿里云开发者官方微信公众号

如果您对文章中内容有疑问,欢迎在评论区进行留言,我会尽量抽时间给您回复。如果文章对您有帮助,欢迎点赞、收藏。您的点赞,是对我最大的支持和鼓励,谢谢 :-)

这篇关于【MySQL数据库开发设计规范】之SQL使用规范的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/993843

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

如何去写一手好SQL

MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。 《阿里巴巴Java开发手册》提出单表行数超过500万行或者单表容量超过2GB,才推荐分库分表。性能由综合因素决定,抛开业务复杂度,影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考,并非铁律。 博主曾经操作过超过4亿行数据

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件