数据库系统原理概念整理(备考)

2024-09-08 02:08

本文主要是介绍数据库系统原理概念整理(备考),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

基本概念

数据模型 描述数据的概念和工具
关系数据模型 用关系描述数据
数据模型 包含三个方面 结构 操作 约束
对应于 关系数据模型 关系(表) 关系代数 主外键约束,断言
逻辑数据模型:详尽的描述数据,不关心具体的物理层实现,如关系数据模型中,设计实体及实体间的关系,属性,约束等等。业务逻辑的体现。
逻辑模型 --------查询处理----------物理模型
逻辑方面:SQL结构化查询语言,描述关系代数的。
物理方面:真正找的时候得面向操作系统和硬件。操作系统有文件系统文件系统是一条一条的记录存在一个文件里。 对文件有创建删除、对记录增删改的操作。
数据真正存储是在磁盘上,磁盘这边发生实际的存取操作存取操作
磁盘最小存取单位其实是扇区。但文件系统对磁盘存取的最小逻辑单位是块。

model/schema/pattern

model 模型,是一种描述问题的工具 比如对象模型,关系模型。这类模型是一些规定,这些规定描述了如何去描述一个概念,同时还规定了一系列的操作,这些操作描述了概念之间如何进行交互。他是用来帮助人们记录和分析问题的。

schema模式 可以认为使用模型model建模得到的东西就是模式。虽然MySQL管他的数据库叫做模式,但是一个运行中的数据库并不是一个模式,而是一个模式的一个具体实例。因为同一个模式可以有很多个实现,比如Northwind数据库在很多人的机器上都有,但是都是用的Northwind数据库模式。

模式pattern 而Pattern更多的用于描述概念实例之间的关系,重点是实例的特征。比如某些数据具有一些特定的模式(Pattern),比如电话号码总是【区号-号码】自我感觉是一些方式,套路,方法。数据挖掘挖的就是数据的pattern。

数据库特点

封闭假设:全部事实存在数据表格里
中心化:DBA管理
一致性:数据库从一个一致性的状态到另一个一致性的状态。

数据库发展

逻辑-面向对象-半结构化XML\PDF-NoSQL(键值对)

数据库领域成就

  • 关系数据模型 和语义语法
  • 索引 化解大海捞针的问题 查询导向相关数据
    索引是一个根据值查地址的表,一个map地图。就和文件分配表一样,拿着文件名找文件存在磁盘的位置。
    B+树
    1.logdN
    2.磁盘预读

hash 等值 点查询
索引的使用条件 小表直接全表扫描
大表 索引
特大表 分区技术 找到一组数据索引后扫描就行了

  • 查询优化 代价较小的执行计划
    代数优化 对查询语句进行变换,如先做投影选择,再做l连接等二元操作。
    物理优化 根据系统提供的存取路径,选择合适的存取策略,如选择顺序扫描还是索引。
    规则优化 对查询做一些启发式规则以执行查询的策略。
    代价估算优化,用代价模型估算出可供选择的执行策略的代价,选择代价最小的策略。
    查询的时间开销 三部分 磁盘IO 计算CPU代价 通信代价

优化数据访问 减少请求的数据量,只返回必要的数据,缓存。
减少服务器的扫描,如使用索引

  • 并发调度 吞吐量
  • 分布式的可扩展性 垂直扩展性和水平扩展性

知识图谱相关

为什么需要知识图谱
数据量越来越大,人们处理困难,机器无法直接获取互联网上文本的语义信息。为了让机器理解背后的语义,对可描述的实体建模,添

这篇关于数据库系统原理概念整理(备考)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1146807

相关文章

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

hdu4407(容斥原理)

题意:给一串数字1,2,......n,两个操作:1、修改第k个数字,2、查询区间[l,r]中与n互质的数之和。 解题思路:咱一看,像线段树,但是如果用线段树做,那么每个区间一定要记录所有的素因子,这样会超内存。然后我就做不来了。后来看了题解,原来是用容斥原理来做的。还记得这道题目吗?求区间[1,r]中与p互质的数的个数,如果不会的话就先去做那题吧。现在这题是求区间[l,r]中与n互质的数的和

数论入门整理(updating)

一、gcd lcm 基础中的基础,一般用来处理计算第一步什么的,分数化简之类。 LL gcd(LL a, LL b) { return b ? gcd(b, a % b) : a; } <pre name="code" class="cpp">LL lcm(LL a, LL b){LL c = gcd(a, b);return a / c * b;} 例题:

软件设计师备考——计算机系统

学习内容源自「软件设计师」 上午题 #1 计算机系统_哔哩哔哩_bilibili 目录 1.1.1 计算机系统硬件基本组成 1.1.2 中央处理单元 1.CPU 的功能 1)运算器 2)控制器 RISC && CISC 流水线控制 存储器  Cache 中断 输入输出IO控制方式 程序查询方式 中断驱动方式 直接存储器方式(DMA)  ​编辑 总线 ​编辑

hdu4407容斥原理

题意: 有一个元素为 1~n 的数列{An},有2种操作(1000次): 1、求某段区间 [a,b] 中与 p 互质的数的和。 2、将数列中某个位置元素的值改变。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.Inpu

hdu4059容斥原理

求1-n中与n互质的数的4次方之和 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;import java.io.PrintWrit

【VUE】跨域问题的概念,以及解决方法。

目录 1.跨域概念 2.解决方法 2.1 配置网络请求代理 2.2 使用@CrossOrigin 注解 2.3 通过配置文件实现跨域 2.4 添加 CorsWebFilter 来解决跨域问题 1.跨域概念 跨域问题是由于浏览器实施了同源策略,该策略要求请求的域名、协议和端口必须与提供资源的服务相同。如果不相同,则需要服务器显式地允许这种跨域请求。一般在springbo

寻迹模块TCRT5000的应用原理和功能实现(基于STM32)

目录 概述 1 认识TCRT5000 1.1 模块介绍 1.2 电气特性 2 系统应用 2.1 系统架构 2.2 STM32Cube创建工程 3 功能实现 3.1 代码实现 3.2 源代码文件 4 功能测试 4.1 检测黑线状态 4.2 未检测黑线状态 概述 本文主要介绍TCRT5000模块的使用原理,包括该模块的硬件实现方式,电路实现原理,还使用STM32类

【MRI基础】TR 和 TE 时间概念

重复时间 (TR) 磁共振成像 (MRI) 中的 TR(重复时间,repetition time)是施加于同一切片的连续脉冲序列之间的时间间隔。具体而言,TR 是施加一个 RF(射频)脉冲与施加下一个 RF 脉冲之间的持续时间。TR 以毫秒 (ms) 为单位,主要控制后续脉冲之前的纵向弛豫程度(T1 弛豫),使其成为显著影响 MRI 中的图像对比度和信号特性的重要参数。 回声时间 (TE)

rtmp流媒体编程相关整理2013(crtmpserver,rtmpdump,x264,faac)

转自:http://blog.163.com/zhujiatc@126/blog/static/1834638201392335213119/ 相关资料在线版(不定时更新,其实也不会很多,也许一两个月也不会改) http://www.zhujiatc.esy.es/crtmpserver/index.htm 去年在这进行rtmp相关整理,其实内容早有了,只是整理一下看着方