本文主要是介绍数据库系统原理概念整理(备考),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
基本概念
数据模型 描述数据的概念和工具
关系数据模型 用关系描述数据
数据模型 包含三个方面 结构 操作 约束
对应于 关系数据模型 关系(表) 关系代数 主外键约束,断言
逻辑数据模型:详尽的描述数据,不关心具体的物理层实现,如关系数据模型中,设计实体及实体间的关系,属性,约束等等。业务逻辑的体现。
逻辑模型 --------查询处理----------物理模型
逻辑方面:SQL结构化查询语言,描述关系代数的。
物理方面:真正找的时候得面向操作系统和硬件。操作系统有文件系统文件系统是一条一条的记录存在一个文件里。 对文件有创建删除、对记录增删改的操作。
数据真正存储是在磁盘上,磁盘这边发生实际的存取操作存取操作
磁盘最小存取单位其实是扇区。但文件系统对磁盘存取的最小逻辑单位是块。
model/schema/pattern
model 模型,是一种描述问题的工具 比如对象模型,关系模型。这类模型是一些规定,这些规定描述了如何去描述一个概念,同时还规定了一系列的操作,这些操作描述了概念之间如何进行交互。他是用来帮助人们记录和分析问题的。
schema模式 可以认为使用模型model建模得到的东西就是模式。虽然MySQL管他的数据库叫做模式,但是一个运行中的数据库并不是一个模式,而是一个模式的一个具体实例。因为同一个模式可以有很多个实现,比如Northwind数据库在很多人的机器上都有,但是都是用的Northwind数据库模式。
模式pattern 而Pattern更多的用于描述概念实例之间的关系,重点是实例的特征。比如某些数据具有一些特定的模式(Pattern),比如电话号码总是【区号-号码】自我感觉是一些方式,套路,方法。数据挖掘挖的就是数据的pattern。
数据库特点
封闭假设:全部事实存在数据表格里
中心化:DBA管理
一致性:数据库从一个一致性的状态到另一个一致性的状态。
数据库发展
逻辑-面向对象-半结构化XML\PDF-NoSQL(键值对)
数据库领域成就
- 关系数据模型 和语义语法
- 索引 化解大海捞针的问题 查询导向相关数据
索引是一个根据值查地址的表,一个map地图。就和文件分配表一样,拿着文件名找文件存在磁盘的位置。
B+树
1.logdN
2.磁盘预读
hash 等值 点查询
索引的使用条件 小表直接全表扫描
大表 索引
特大表 分区技术 找到一组数据索引后扫描就行了
- 查询优化 代价较小的执行计划
代数优化 对查询语句进行变换,如先做投影选择,再做l连接等二元操作。
物理优化 根据系统提供的存取路径,选择合适的存取策略,如选择顺序扫描还是索引。
规则优化 对查询做一些启发式规则以执行查询的策略。
代价估算优化,用代价模型估算出可供选择的执行策略的代价,选择代价最小的策略。
查询的时间开销 三部分 磁盘IO 计算CPU代价 通信代价
优化数据访问 减少请求的数据量,只返回必要的数据,缓存。
减少服务器的扫描,如使用索引
- 并发调度 吞吐量
- 分布式的可扩展性 垂直扩展性和水平扩展性
知识图谱相关
为什么需要知识图谱
数据量越来越大,人们处理困难,机器无法直接获取互联网上文本的语义信息。为了让机器理解背后的语义,对可描述的实体建模,添
这篇关于数据库系统原理概念整理(备考)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!