2.1 关系数据结构及形式化定义

本文主要是介绍2.1 关系数据结构及形式化定义，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

思维导图：

2.1.1 关系

笔记：

关系数据库模型是一个简单但强大的方式来表示数据及其之间的关系。下面是这节的关键内容：

- **关系模型核心概念**
* 关系数据模型的核心是“关系”，它在逻辑上表现为一个二维表。
* 此表中，每一行称为一个元组，每一列称为一个属性或域。
* 数据的逻辑结构只是二维表，这使得关系模型既简单又强大。

- **域 (Domain)**
* 域定义了可能的值的集合，每个域都有一个与之关联的数据类型。
* 示例：整数、实数、小于25字节的字符串集合都是有效的域。

- **笛卡尔积 (Cartesian Product)**
* 笛卡尔积是定义在一组域上的集合运算。
* 如果我们有两个集合，笛卡尔积就是所有可能的元组组合。
* 例如，给定三个域 D₁, D₂, D₃, 它们的笛卡尔积会产生一个包含所有可能组合的新集合。

- **元组 (Tuple)**
* 一个元组是关系中的一行，由多个分量或值组成。
* 每个分量代表域中的一个值。
* 在示例中，(张清玫，计算机专业，李勇) 是一个元组。

- **二维表**
* 笛卡尔积的结果可以表示为一个二维表，每行表示一个元组，每列表示一个域的值。

从上述内容中，我们可以理解关系模型的基本构建块：域、元组、关系。这为后续章节介绍关系操作、完整性约束和其他概念打下了基础。

我的理解：

关系数据库模型中的概念可以在日常生活中找到相应的类比，以帮助我们更好地理解。以下是对这一节概念的简化和日常类比：

1. **关系**: 想象一张电子表格或Excel表格。这张表格就是一个“关系”。每行代表一个实体（如一个人、一本书等），每列代表实体的某个属性（如姓名、年龄或书的标题）。

2. **域 (Domain)**: 域可以看作是一个特定的列可能有的所有值的集合。例如，对于一个“性别”列，域可能是{男，女}。这就像在填写表格时，某列下你只能从特定的选择列表中选择。

3. **笛卡尔积 (Cartesian Product)**: 想象你有两副扑克牌，你想列出所有可能的两张牌的组合。这样的组合列表就是笛卡尔积的结果。在数据库中，笛卡尔积指的是从多个域中取值形成的所有可能的元组组合。

4. **元组 (Tuple)**: 这就像电子表格中的一行。它表示一个完整的记录，例如一个学生或一个订单。

5. **二维表**: 这是整个关系的表示，就像一个完整的Excel表格。在这个表格中，你可以看到所有的记录和它们的属性。

总结一下：

- 关系数据库模型其实就是通过二维表来组织和存储数据的一种方式。
- 这些表中的每一行代表一个记录，每一列代表一个属性。
- 这些属性的取值范围被称为“域”。
- 通过组合不同域的取值，我们可以得到许多可能的记录组合，这就是笛卡尔积。

理解这些基本概念是掌握关系数据库操作、查询和设计的基础。

这一节详细介绍了关系数据库中的关系的基本性质和定义。以下是对这些内容的笔记摘要：

1. **主码**: 如果假设研究生不会重名, `POSTGRADUATE`属性的每个值都唯一地标识了一个元组，因此它可以作为`SAP`关系的主码。

2. **关系类型**:
- **基本关系/基表**: 实际存在的表，是存储数据的逻辑表示。
- **查询表**: 查询结果对应的表。
- **视图表**: 由基本表或其他视图表导出的，是虚表，不对应实际存储的数据。

3. **关系的性质**:
- 关系是有限的。
- 列可以任意交换。
- 任意两个元组的候选码不能相同。
- 行可以任意交换。
- 分量必须取原子值。

4. **关系的规范化**:
- 关系模型要求关系必须是规范化的。
- 每一个分量都必须是不可分的数据项。
- 规范化的关系简称为范式(Normal Form, NF)。
- “表中有表”是不允许的。

5. **例子**: 表2.3展示了导师与研究生之间的一对多关系，但由于`POSTGRADUATE`属性中的分量取了两个值，这不符合规范化的要求。

6. **实际数据库产品的性质**: 不是所有的关系数据库产品都完全满足这6条性质。例如，有的仍然区分了属性顺序和元组的顺序。元组有时被称为记录。

通过这些笔记，可以清晰地理解关系数据库的关键概念，特别是关于关系的性质和规范化的要求。

2.1.2 关系模式

1. **型与值的区分**：在关系数据库中，关系模式代表“型”，而关系代表“值”。
2. **关系模式描述**：关系模式指明了元组集合的结构，如何由哪些属性构成，这些属性来自哪些域，以及它们之间的映像关系。
3. **完整性约束**：现实世界的事实和规则限定了关系模式所有可能的关系必须满足一定的完整性约束条件。
4. **定义2.4**：关系模式(relation schema)形式化地表示为R(U,D,DOM,F)。
5. **关系与关系模式的区别**：关系模式是静态的描述，而关系是动态的，表示在某一时刻的状态或内容。