聚簇索引和非聚簇索引(相关小知识点)

2024-09-05 20:58

本文主要是介绍聚簇索引和非聚簇索引(相关小知识点),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

终于有时间写写博客,记录下聚簇索引与非聚簇索引的相关小知识点。

知识点

1、聚簇索引和非聚簇索引的各自适用场景?

2、聚簇索引和非聚簇索引的优劣势?

优势:

  • 叶子节点会存储数据,找到叶子节点就找到了数据行,无需回表;

  • 对于辅助索引,使用主键作为指针而不是地址值,,减少了出现行移动或者数据页分裂时辅助索引的维护工作;

  • 在排序场景下,由于聚簇索引的物理位置和数据行的逻辑位置的有序性,效率更高;

  • 范围查找适用聚簇索引;

劣势:

  • 维护索引代价比较昂贵,移动行时会形成碎片;

  • 主键是随机值时,使用聚簇索引会比全表扫描更慢,因为每次插入数据都有可能会出现大量行移动;

  • 主键较大时,不要使用聚簇索引,因为此时辅助索引也会变得更大(所有辅助索引叶子节点的值都是主键值)

3、主键使用自增id的好处?

聚簇索引的数据的物理存放顺序和索引顺序一致,也就是说,在磁盘上也是连续存储的,这样可以减少内存碎片,同时减少数据物理地址的调整,这里需要注意的是Myisam的主索引和辅助索引实际上是一样的(个人理解),都是非聚簇索引,其物理地址实际是不相邻的,在查找时可能会有多次IO,如图:

                                                             

但是,当涉及到大数据量的排序(注意是大数据量的排序)和全表扫描时,还是Myisam比较适用,因为索引占空间较小,而排序操作是需要在内存中完成的。

4、索引的优化

  • 尽量选择较小的数据类型,这样节点存储的key就多,树的高度就小,从而可以减少IO次数;

  • 选择离散度高的列作为索引,越有利于数据的查找,当离散到一定程度就是全表扫描;

  • 联合索引尽量把离散度高的、索引长度小的放前面

5、索引失效场景

  • like以%开头,如like “%1232%”

  • not in和<>操作会使索引失效,因为b+tree本质是二分查找树,无法根据这些操作符做出选择;

  • select尽量使用指定列查询,避免使用select *,这样可以使用到覆盖索引;

  • 联合索引不符合最左匹配时会使索引失效;

  • 最左匹配原则从最左一列开始,直至遇到范围查询停止,其右边的列都无法用到索引;

总结

回表不一定会更慢,使用索引也不一定比全表快,怎么用好索引是门很深的学问。

这篇关于聚簇索引和非聚簇索引(相关小知识点)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1140052

相关文章

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

基本知识点

1、c++的输入加上ios::sync_with_stdio(false);  等价于 c的输入,读取速度会加快(但是在字符串的题里面和容易出现问题) 2、lower_bound()和upper_bound() iterator lower_bound( const key_type &key ): 返回一个迭代器,指向键值>= key的第一个元素。 iterator upper_bou

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

两个月冲刺软考——访问位与修改位的题型(淘汰哪一页);内聚的类型;关于码制的知识点;地址映射的相关内容

1.访问位与修改位的题型(淘汰哪一页) 访问位:为1时表示在内存期间被访问过,为0时表示未被访问;修改位:为1时表示该页面自从被装入内存后被修改过,为0时表示未修改过。 置换页面时,最先置换访问位和修改位为00的,其次是01(没被访问但被修改过)的,之后是10(被访问了但没被修改过),最后是11。 2.内聚的类型 功能内聚:完成一个单一功能,各个部分协同工作,缺一不可。 顺序内聚:

log4j2相关配置说明以及${sys:catalina.home}应用

${sys:catalina.home} 等价于 System.getProperty("catalina.home") 就是Tomcat的根目录:  C:\apache-tomcat-7.0.77 <PatternLayout pattern="%d{yyyy-MM-dd HH:mm:ss} [%t] %-5p %c{1}:%L - %msg%n" /> 2017-08-10

Node Linux相关安装

下载经编译好的文件cd /optwget https://nodejs.org/dist/v10.15.3/node-v10.15.3-linux-x64.tar.gztar -xvf node-v10.15.3-linux-x64.tar.gzln -s /opt/node-v10.15.3-linux-x64/bin/npm /usr/local/bin/ln -s /opt/nod

git ssh key相关

step1、进入.ssh文件夹   (windows下 下载git客户端)   cd ~/.ssh(windows mkdir ~/.ssh) step2、配置name和email git config --global user.name "你的名称"git config --global user.email "你的邮箱" step3、生成key ssh-keygen

zookeeper相关面试题

zk的数据同步原理?zk的集群会出现脑裂的问题吗?zk的watch机制实现原理?zk是如何保证一致性的?zk的快速选举leader原理?zk的典型应用场景zk中一个客户端修改了数据之后,其他客户端能够马上获取到最新的数据吗?zk对事物的支持? 1. zk的数据同步原理? zk的数据同步过程中,通过以下三个参数来选择对应的数据同步方式 peerLastZxid:Learner服务器(Follo

STL经典案例(四)——实验室预约综合管理系统(项目涉及知识点很全面,内容有点多,耐心看完会有收获的!)

项目干货满满,内容有点过多,看起来可能会有点卡。系统提示读完超过俩小时,建议分多篇发布,我觉得分篇就不完整了,失去了这个项目的灵魂 一、需求分析 高校实验室预约管理系统包括三种不同身份:管理员、实验室教师、学生 管理员:给学生和实验室教师创建账号并分发 实验室教师:审核学生的预约申请 学生:申请使用实验室 高校实验室包括:超景深实验室(可容纳10人)、大数据实验室(可容纳20人)、物联网实验

rtmp流媒体编程相关整理2013(crtmpserver,rtmpdump,x264,faac)

转自:http://blog.163.com/zhujiatc@126/blog/static/1834638201392335213119/ 相关资料在线版(不定时更新,其实也不会很多,也许一两个月也不会改) http://www.zhujiatc.esy.es/crtmpserver/index.htm 去年在这进行rtmp相关整理,其实内容早有了,只是整理一下看着方