数据库系统概念(第三周 第一二堂总结)

2024-03-26 11:28

本文主要是介绍数据库系统概念(第三周 第一二堂总结),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

前言

关系模型的操作方式

问题1——表示方法

操作表示方法比较

关系代数对于空值的处理

关系模型数据语言特点

问题2——操作种类

 基本运算

其他运算

拓展关系

外连接

聚集函数

 聚集函数(分组)

总结 


前言

前文讲了关系模型,以及设计一个关系模型所考虑的三个角度:数据结构完整性约束以及操作方式

对于关系模型来说:数据结构就是关系。完整性约束有:1、主体完整性 2、参照完整性 3、用户完整性

接下去我们来研究关系模型中的操作方式,也就是我们在关系模型中能对关系做哪些操作以及用什么方法去表示这些操作

总结来看研究操作方式就是研究两个问题:1、表示方法  2、操作种类

以下练习题数据库关系参照下图:

关系模型的操作方式

问题1——表示方法

操作表示方法比较

对于关系模型的操作类型的表示通常有两种:1、SQL语言描述 2、关系代数描述

两者的关系如下:

关系代数通过符号化数学化的语言,来描述数据库的行为关系,相当于简化版的 SQL。比如并,交,差,笛卡尔积,除法,选择,投影等等。

SQL 则是结构化查询语句,相比于关系代数,更方便被计算机识别的一种查询语言。

更加严谨的说法(摘录自《数据库系统概念》)

关系数据模型有三种等价的操作语言:关系代数、SQL、关系演算(元组关系演算和域关系演算)。

它们的非过程化程度依次递增,主要应用领域也不同.SQL是关系数据库的标准语言,关系代数和关系演算是它的理论基础.大多商用的DBMS先把用户提交的SQL查询转化成等价的扩展关系代数表达式,在执行之前需要根据等价规则对其优化。

所以,我们先从简单的入手,先从关系代数的角度去描述对关系数据库的操作 

关系代数对于空值的处理

选择:保留确定为真的元组

投影等:不确定为真的NULL值也会保留

关系模型数据语言特点

总结 

一、操作对象以及所得结果都是关系

二、 操作符单一,语言类型单一

三、非过程化语言,只要描述目的需求,并不说明如何做

问题2——操作种类

 基本运算

选择、投影、更名、笛卡尔积、集合并、集合差

选择:对行进行操作,可以理解为选择满足要求的记录

投影:选择满足要求的属性 ,可以理解为对列进行操作,结果会去掉相同的元组

笛卡尔积: 关系之间做笛卡尔积结果就是:关系之间组合出所有可能

不难得到R和S的笛卡尔积的记录数量等于R的记录数*S的记录数

特殊的:

如果遇到两个关系中存在同名属性,关系代数会自动在属性名前面加上关系名

课堂小练习——下面哪条语句执行效率更高?

答案是:第二条语句(先选择再笛卡尔积再选择,效率高于笛卡尔积后选择)(可以从算法时间复杂度来理解,前者把后者中部分的乘复杂度转为了加复杂度)

 并运算:本质就是把两个关系里面的元组合并到一个新的关系里面,但是要求两个关系相容。

相容有两个要求:1、两个关系的属性数量相同。2、两个关系上对应属性的数据类型相同。

差运算: 所有出现在一个关系而不在另一个关系中的元组集合,同样要求R和S必须是相容的

课堂小练习

答案:方案一、方案三(方案二这种是在一对多关系中的典型错误

更名运算:对关系代数表达式的运算结果进行更名,创建新副本+更名

课堂练习1:

查询数学成绩比王红同学数学成绩高的学生姓名

优化后结果:优化本质:先筛选再笛卡尔积、

课堂练习2:

利用自然连接=笛卡尔积+筛选的本质进行处理

课堂练习3:

(具体数据库示例见前言)

注意:自然连接=笛卡尔积+选择条件+选择后列合并。本题中选c2的同学学号,和选c1的同学学号进行自然连接,得到的就是两者都选的同学学号

课堂练习4:

此处的更名是必要的

课堂练习3:

(具体数据库示例见前言)

注意:自然连接=笛卡尔积+选择条件+选择后列合并。本题中选c2的同学学号,和选c1的同学学号进行自然连接,得到的就是两者都选的同学学号


其他运算

集合交、θ连接、自然连接、除、赋值

θ连接:本质就是笛卡尔积+选择条件。先进行笛卡尔积运算得到新的关系,然后对这个关系进行选择得到最终结果(选择条件可以自己写)

自然连接:本质就是笛卡尔积 +选择条件+选择后列合并(选择条件就是相同属性名的值要求相等)+删除重复的属性

 集合交:集合交运算可以用集合并运算和集合差运算来代替R \cap S=R-(R-S),同样参与交运算的关系必须是相容的

课堂小练习

答案是:方案2(方案1的结果是空集合)

 赋值运算:操作完成后把操作结果赋值给新的关系

除运算: 解决关系之间的包含问题除运算=属性除+元组除。对于R/S,属性除就是直接在R中去掉S中的属性,元组除就是留下象集能够除尽S的元组。

象集与除运算:

举个例子:

课堂练习1:

查询选修了全部课程的学生的学号(数据库关系示例见前言)

课堂练习2:

查询至少选修了C1和C2课程的学生学号(数据库关系示例见前言)

正确答案是 方案一

方案二得到的是选修C1和C2并成绩相同的同学
课堂练习3:

除运算与基本运算的转化:


拓展关系

外连接

原因:

在进行自然连接时(T、TC、C关系进行),由于TC、C中的原因导致T中部分元组并没有显示出来,而有时我们想要即使存在NULL的属性也要显示元组

定义:

外连接:在自然连接时因失配发生信息丢失,利用外连接可以让其中一方关系附加一个取值全为空的元组。本质就是:外连接=自然连接+失配的元组

形式:

左侧关系中失配的元组:在和右侧关系的匹配中失败的元组,保留下左侧关系+空值关系

其他两个同理 

例子:

聚集函数

定义 :

计算给定关系的统计信息(求和、求平均、求方差等),返回单一值。聚集函数的关系可以说多重集(一个元组可以出现多次),利用name-distinct可以使用去除重复元组的聚集函数

种类:

1、sum求和:

2、 avg平均值:

3、max/min最大最小值:

4、count计数:

 聚集函数(分组)

定义:

将一个关系中的元组分为若干个组,并在组内使用聚集函数

示例: 

课堂练习:

正确答案为:方案一 

总结 

本文的所有知识点、图片均来自《数据库系统概念》(黑宝书)、山东大学李晖老师PPT。不可用于商业用途转发。

 本篇已经码了五个多小时了,算是最完整最长篇幅的一篇数据库关系代数的文章了

如果能帮助到大家,大家可以点点赞、收收藏呀~ 

这篇关于数据库系统概念(第三周 第一二堂总结)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/848343

相关文章

Kubernetes常用命令大全近期总结

《Kubernetes常用命令大全近期总结》Kubernetes是用于大规模部署和管理这些容器的开源软件-在希腊语中,这个词还有“舵手”或“飞行员”的意思,使用Kubernetes(有时被称为“... 目录前言Kubernetes 的工作原理为什么要使用 Kubernetes?Kubernetes常用命令总

Python中实现进度条的多种方法总结

《Python中实现进度条的多种方法总结》在Python编程中,进度条是一个非常有用的功能,它能让用户直观地了解任务的进度,提升用户体验,本文将介绍几种在Python中实现进度条的常用方法,并通过代码... 目录一、简单的打印方式二、使用tqdm库三、使用alive-progress库四、使用progres

Android数据库Room的实际使用过程总结

《Android数据库Room的实际使用过程总结》这篇文章主要给大家介绍了关于Android数据库Room的实际使用过程,详细介绍了如何创建实体类、数据访问对象(DAO)和数据库抽象类,需要的朋友可以... 目录前言一、Room的基本使用1.项目配置2.创建实体类(Entity)3.创建数据访问对象(DAO

Java向kettle8.0传递参数的方式总结

《Java向kettle8.0传递参数的方式总结》介绍了如何在Kettle中传递参数到转换和作业中,包括设置全局properties、使用TransMeta和JobMeta的parameterValu... 目录1.传递参数到转换中2.传递参数到作业中总结1.传递参数到转换中1.1. 通过设置Trans的

C# Task Cancellation使用总结

《C#TaskCancellation使用总结》本文主要介绍了在使用CancellationTokenSource取消任务时的行为,以及如何使用Task的ContinueWith方法来处理任务的延... 目录C# Task Cancellation总结1、调用cancellationTokenSource.

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

git使用的说明总结

Git使用说明 下载安装(下载地址) macOS: Git - Downloading macOS Windows: Git - Downloading Windows Linux/Unix: Git (git-scm.com) 创建新仓库 本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令 git init ,用以创建新的git 克隆仓库 执行指令用以创建一个本地仓库的

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

整数Hash散列总结

方法:    step1  :线性探测  step2 散列   当 h(k)位置已经存储有元素的时候,依次探查(h(k)+i) mod S, i=1,2,3…,直到找到空的存储单元为止。其中,S为 数组长度。 HDU 1496   a*x1^2+b*x2^2+c*x3^2+d*x4^2=0 。 x在 [-100,100] 解的个数  const int MaxN = 3000