集群索引和WITHOUT ROWID优化

2023-10-08 16:28

本文主要是介绍集群索引和WITHOUT ROWID优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

介绍

默认情况下,每一行都有一个特殊的rowid列,用于标识一行数据。使用WITHOUT ROWID后,rowid列不会被创建,且时候有空间和性能方面的优势。
WITHOUT ROWID表使用集群索引作为主键。

语法

CREATE TABLE IF NOT EXISTS wordcount(word TEXT PRIMARY KEY,cnt INTEGER
) WITHOUT ROWID;

必须使用PRIMARY KEY指定主键。

兼容

3.8.2以及之后的版本可用。使用早期版本打开WITHOUT ROWID表将会报错。

rowid关键字

原文链接:https://www.sqlite.org/lang_createtable.html#rowid

不使用WITHOUT ROWID创建的表会自动创建rowid列,类型为8字节有符号整数。在访问列数据时可以通过"rowid",“oid”,"rowid"代替列名称。

如果表在创建时指定了主键只包含一个INTEGER类型的列,这个列会成为rowid列。类型必须是明确的"INTEGER”,其它整数类型的列不行。

CREATE TABLE t(x INTEGER PRIMARY KEY, y, z);

该示例中的x将作为rowid列,也就是说通过上面说明的别名可以直接检索到x列。

有一个例外就是,PRIMARY KEY后面如果紧跟DESC,也就是"PRIMARY KEY DESC"出现时,这一列不会被作为rowid列。这是一个因历史问题而保留下来的例外。

  • CREATE TABLE t(x INTEGER PRIMARY KEY ASC, y, z);
  • CREATE TABLE t(x INTEGER, y, z, PRIMARY KEY(x ASC));
  • CREATE TABLE t(x INTEGER, y, z, PRIMARY KEY(x DESC));

这三个示例中的x都会被当作rowid列。

  • CREATE TABLE t(x INTEGER PRIMARY KEY DESC, y, z);
    这个示例中的x不会被当作rowid列。

使用UPDATE更新rowid列时,可以使用"rowid",“oid”,“rowid”,或者被当作rowid别名的列名称。

更新一个rowid列时如果指定NULL或blob,或一个无法无损转换为整数的字符串或REAL,将会报"datatype missmatch"错误。插入时除NULL值外,其它相同处理。对于NULL值,系统会自动分配一个整数提供给rowid列。

与rowid表的区别

WITHOUT ROWID只是一个优化选项,并不提供新的能力。在有些情况下能节省空间和提高访问速度。

  1. 必须要指定主键。创建一个没有主键的WITHOUT ROWID表将会报错。
  2. 关于"INTEGER PRIMARY KEY"的特定行为不会被使用,因为没有rowid列。
  3. AUTOINCREMENT特性不会在WITHOUT ROWID表上生效。创建表时在WITHOUT ROWID表上使用AUTOINCREMENT会报错。
  4. 主键包含的每一列都会被强制应用NOT NULL特性。但是由于早期版本的BUG和历史原因,rowid表中的主键包含的列允许NULL特性存在。
  5. sqlite3_last_insert_rowid()函数不能使用,因为没有rowid列。
  6. incremental blob I/O 在一个表上进行增量IO操作的机制无法使用,因为其依赖于rowid列。
  7. sqlite3_update_hook()设置的回调函数不会工作,因为其依赖于rowid列。

优势

减少空间和处理过程。

CREATE TABLE IF NOT EXISTS wordcount(word TEXT PRIMARY KEY,cnt INTEGER
);

示例创建的表使用两个B-Trees存储数据。主表使用rowid作为关键字存储每一行数据,同时word索引也有一个单独的B-Trees存储word和rowid数据。当使用word查表时,先从第2个B-Trees查询rowid,再根据rowid从主表中提取数据。
在这个例子中,word列的数据被存储了2次,一是在主表,一是在索引树,检索发生了2次才完成。

CREATE TABLE IF NOT EXISTS wordcount(word TEXT PRIMARY KEY,cnt INTEGER
) WITHOUT ROWID;

在这个例子中,只有一个B-Trees存储索引和数据,查询操作也只需要一次就能完成。

使用WITHOUT ROWID的时机

在表没有整数类型的主键,或者有复合主键的情况下,可以考虑使用。

只有一个整数主键的WITHOUT ROWID表,正常工作是没有问题的,但速度上可能没有rowid表快。就是说,只有一个整数主键的情况下,尽量不要使用WITHOUT ROWID。

当一行数据不太大时使用WITHOUT ROWID更好。一个经验就是一行数据大小不超过数据库分页大小的1/20。例如对于1KB的分页,一行数据最好不要超过50字节,对于4KB则不要超过200字节。

当然WITHOUT ROWID表对于任意大小的行数据都是能正常工作的,只是超过上面的大小时使用rowid表在速度上会更快。
sqlite3_analyzer.exe工具可用于一个数据表的平均一行数据大小。

如何检测表是否为WITHOUT ROWID表

PRAGMA_index_info命令用于检测WITHOUT ROWID表的主键信息,对于rowid表,该命令返回空数据。

原文索引:https://www.sqlite.org/withoutrowid.html

这篇关于集群索引和WITHOUT ROWID优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/166548

相关文章

Deepseek使用指南与提问优化策略方式

《Deepseek使用指南与提问优化策略方式》本文介绍了DeepSeek语义搜索引擎的核心功能、集成方法及优化提问策略,通过自然语言处理和机器学习提供精准搜索结果,适用于智能客服、知识库检索等领域... 目录序言1. DeepSeek 概述2. DeepSeek 的集成与使用2.1 DeepSeek API

Tomcat高效部署与性能优化方式

《Tomcat高效部署与性能优化方式》本文介绍了如何高效部署Tomcat并进行性能优化,以确保Web应用的稳定运行和高效响应,高效部署包括环境准备、安装Tomcat、配置Tomcat、部署应用和启动T... 目录Tomcat高效部署与性能优化一、引言二、Tomcat高效部署三、Tomcat性能优化总结Tom

Java实现Elasticsearch查询当前索引全部数据的完整代码

《Java实现Elasticsearch查询当前索引全部数据的完整代码》:本文主要介绍如何在Java中实现查询Elasticsearch索引中指定条件下的全部数据,通过设置滚动查询参数(scrol... 目录需求背景通常情况Java 实现查询 Elasticsearch 全部数据写在最后需求背景通常情况下

解读Redis秒杀优化方案(阻塞队列+基于Stream流的消息队列)

《解读Redis秒杀优化方案(阻塞队列+基于Stream流的消息队列)》该文章介绍了使用Redis的阻塞队列和Stream流的消息队列来优化秒杀系统的方案,通过将秒杀流程拆分为两条流水线,使用Redi... 目录Redis秒杀优化方案(阻塞队列+Stream流的消息队列)什么是消息队列?消费者组的工作方式每

Pandas中多重索引技巧的实现

《Pandas中多重索引技巧的实现》Pandas中的多重索引功能强大,适用于处理多维数据,本文就来介绍一下多重索引技巧,具有一定的参考价值,感兴趣的可以了解一下... 目录1.多重索引概述2.多重索引的基本操作2.1 选择和切片多重索引2.2 交换层级与重设索引3.多重索引的高级操作3.1 多重索引的分组聚

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

MySQL不使用子查询的原因及优化案例

《MySQL不使用子查询的原因及优化案例》对于mysql,不推荐使用子查询,效率太差,执行子查询时,MYSQL需要创建临时表,查询完毕后再删除这些临时表,所以,子查询的速度会受到一定的影响,本文给大家... 目录不推荐使用子查询和JOIN的原因解决方案优化案例案例1:查询所有有库存的商品信息案例2:使用EX

MySQL中my.ini文件的基础配置和优化配置方式

《MySQL中my.ini文件的基础配置和优化配置方式》文章讨论了数据库异步同步的优化思路,包括三个主要方面:幂等性、时序和延迟,作者还分享了MySQL配置文件的优化经验,并鼓励读者提供支持... 目录mysql my.ini文件的配置和优化配置优化思路MySQL配置文件优化总结MySQL my.ini文件