关系数据库

最新推荐文章于 2022-02-09 17:38:22 发布

jpfjkslT

最新推荐文章于 2022-02-09 17:38:22 发布

阅读量246

点赞数

本文链接：https://blog.csdn.net/learnstudy2/article/details/108174917

版权

在关系数据库中，关系的定义为：给定一组域D1，D2，…，Dn，这些域中可以使相同的域。D1，D2，…，Dn的笛卡尔积D1×D2×…×Dn的子集叫做在域D1，D2，…，Dn上的关系，表示为R（D1，D2，…，Dn）。这里R表示关系的名字，n是关系的目或度。

属性 attribute
域 domain：每个属性的取值范围所对应一个值的集合，称为该属性的域。
目或度 degree
候选码 candidate key：若关系中的某一属性或属性组的值能唯一的标识一个元组，则称该属性或属性组为候选码。
主码 primary key ：或称为主键，若一个关系有多个候选码，则选定其中一个为主码。
主属性 prime attribute：包含在任何候选码中的诸属性称为主属性。不包含在任何候选码中的属性称为非主属性。
外码 foreign key：如果关系模式 $R$ 中的属性或属性组非该关系的码，但它是其他关系的码，那么该属性集对关系模式 $R$ 而言是外码
全码 all key：关系模型的所有属性组是这个关系模式的候选码，称为全码。

设 $D_1,D_2,D_3,\cdots,D_n$ 为任意集合，定义 $D_1,D_2,D_3,\cdots,D_n$ 的笛卡儿积为：
$D_1 \times D_2 \times D_3 \times \cdots \times D_n = \{(d_1,d_2,d_3,\cdots,d_n)|d_i \in D_i,i=1,2,3,\cdots n\}$
其中集合中的每一个元素 $(d_1,d_2,d_3,\cdots,d_n)$ 叫做一个 $n$ 元组（ $n$ -tuple，即 $n$ 个属性的元组），元组中的每一个值 $d_i$ 叫做元组一个分量。若 $D_i(i=1,2,3,\cdots,n)$ 为有限集，其基数（Cardinal Number，元组的个数）为 $m_i(i=1,2,3,\cdots,n)$ ，则 $D_1 \times D_2 \times D_3 \times \cdots \times D_n$ 的基数 $M$ 为： $M=\prod\limits_{i=1}^nm_i$ 。

$D_1 \times D_2 \times D_3 \times \cdots \times D_n$ 的子集叫做在域 $D_1,D_2,D_3,\cdots,D_n$ 上的关系，记为 $R(D_1,D_2,D_3,\cdots,D_n)$ ，称关系 $R$ 为 $n$ 元关系。
关系中属性的个数称为元数，元组的个数称为基数。

关系的描述称为关系模式，可以形式化地表示为：
$R (U, D, d o m, F)$
其中 $R$ 表示关系名， $U$ 是组成该关系的属性名集合， $D$ 是属性的域， $d o m$ 是属性向域的映像集合， $F$ 为属性间数据的依赖关系集合。
通常将关系模式简记为：
$R(U)或R(A_1,A_2,A_3,\cdots,A_n)$
其中， $R$ 为关系名， $A_1,A_2,A_3,\cdots,A_n$ 为属性名或域名，属性向域的映像常常直接说明属性的类型、长度。通常在关系模式主属性加下划线表示该属性为主码属性。

关系的完整性约束共分为三类：实体完整性、参照完整性（也称引用完整性）和用户定义完整性。

实体完整性 entity integrity。规定基本关系 $R$ 的主属性 $A$ 不能取空值。
参照完整性 referential integrity。
用户定义完整性 user defined integrity。

五种基本的关系代数运算

五种基本的关系代数运算包括并、差、笛卡儿积、投影和选择。

1. 并 Union

关系 $R$ 与 $S$ 具有相同的关系模式，即 $R$ 与 $S$ 的元数相同（结构相同）。关系 $R$ 与 $S$ 并由属于 $R$ 或属于 $S$ 的元组构成的集合组成，记作 $R\cup S$ ，其形式定义如下：
$R\cup S=\{t|t \in R \vee t \in S\}$

2. 差 Difference

关系 $R$ 与 $S$ 具有相同的关系模式，关系 $R$ 与 $S$ 的差是由属于 $R$ 但不属于 $S$ 的元组构成的集合，记作 $R - S$ ，其形式定义如下：
$S=\{t|t \in R \wedge t \in S\}$

3. 广义笛卡儿积 Extended Cartesian Product

两个元素分别为 $n$ 目和 $m$ 目的关系 $R$ 和 $S$ 的广义笛卡儿积是一个 $(n + m)$ 列的元组的集合，元组的前 $n$ 列是关系 $R$ 的一个元组，后 $m$ 列是关系 $S$ 的一个元组，记作 $\times S$ ，其形式定义如下：
$\times S = \{t|t=< t^n,t^m > \wedge t^n \in R \wedge t^m \in S\}$
$t^n,t^m>$ 意为元组 $t^n$ 和 $t^m$ 拼接成的一个元组。

4. 投影 Projection

投影运算是从关系的垂直方向进行运算，在关系 $R$ 中选择出若干属性列 $A$ 组成新的关系，记作 $\pi_A(R)$ ，其形式定义如下：
$\pi_A(R)=\{t[A]|t \in R\}$

5. 选择 Selection

选择运算是从关系的水平方向进行运算，是从关系 $R$ 中选择满足给定条件的诸元组，记作 $\sigma_F(R)$ ，其形式定义如下：
$\sigma_F(R)=\{t|t \in R \wedge F(t) = True\}$
其中， $F$ 中的运算对象是属性名（或列的序号）或常数，运算符、算术比较运算符和逻辑运算符。
$\sigma_{1 \geq 6}(R)$ 表示选取 $R$ 关系中第一个属性值大于第六个属性值的元组；
$\sigma_{1 \geq '6'}(R)$ 表示选取 $R$ 关系中第一个属性值大于6的元组；

6. 交 Intersection

关系 $R$ 与 $S$ 具有相同的关系模式，关系 $R$ 与 $S$ 的交是由属于 $R$ 同时又属于 $S$ 的元组构成的集合，关系 $R$ 与 $S$ 的交记作 $\cap S$ ，其形式定义如下：
$\cap S = \{t| t\in R \wedge t \in S\}$
$\cap S = R-(R-S)$ 或者 $\cap S = S - (S-R)$

7. 连接 join

连接分为 $\theta$ 连接、等值连接及自然连接三种。连接运算是从两个关系 $R$ 和 $S$ 的笛卡儿积中选取满足条件的元组。因此，可以认为笛卡儿积是无条件连接，其他的连接操作认为是有条件连接。

$\theta$ 连接
$\theta$ 连接是从 $R$ 与 $S$ 的笛卡儿积中选取属性间满足一定条件的元组。其形式定义如下：
$\mathop {\bowtie}\limits_{X \theta Y} S = \{t|t=<t^n,t^m > \wedge t^n \in R \wedge t^m \in S \wedge t^n[X] \theta t^m[Y]\}$
其中： $\theta Y'为连接的条件$ ， $\theta$ 是比较运算符， $X$ 和 $Y$ 分别为 $R$ 和 $S$ 上度数相等，且可比的属性组。 $t^n[X]$ 表示 $R$ 中 $t^n$ 元组的相应于属性 $X$ 的一个分量。 $t^m[Y]$ 表示 $S$ 中 $t^m$ 的相应于属性 $Y$ 的一个分量。需要说明的是：
$\theta$ 连接也可以表示为：
$\mathop {\bowtie}\limits_{i \theta j} S = \{t|t=<t^n,t^m > \wedge t^n \in R \wedge t^m \in S \wedge t^n[i] \theta t^m[j]\}$
其中： $i=1,2,3\cdots,n,j=1,2,3,\cdots,m$ ， $\theta j'$ 的含义为从两个关系 $R$ 和 $S$ 中选取 $R$ 的第 $i$ 列和 $S$ 的第 $j$ 列满足 $\theta$ 运算的元组进行连接。
$\theta$ 连接可以由基本的关系运算笛卡儿积和选取运算导数。因此 $\theta$ 连接可表示为：
$\mathop {\bowtie}\limits_{X \theta Y} S = \sigma_{X \theta Y } (R \times S) 或 R \mathop {\bowtie}\limits_{i \theta j} =\sigma_{i \theta (i+j) } (R \times S)$
等值连接 Equijoin
当 $\theta$ 为“ $=$ ”时，称之为等值连接，记为 $\mathop {\bowtie}\limits_{X = Y} S$ 。其形式定义如下：
$\mathop {\bowtie}\limits_{X = Y} S = \{t|t=<t^n,t^m > \wedge t^n \in R \wedge t^m \in S \wedge t^n[X] = t^m[Y]\}$
自然连接 Natural Join
自然连接是一种特殊的等值连接，它要求两个关系中进行比较的分量必须是相同的属性组，并且在结果集中将重复属性列去掉。
若 $t^n$ 表示 $R$ 关系的元组变量， $t^m$ 表示 $S$ 关系的元组变量； $R$ 和 $S$ 具有相同的属性组 $B$ ，且 $B=(B_1,B_2,\cdots,B_k)$ ；并假定 $R$ 关系的属性为 $A_1,A_2,\cdots,A_{n-k},B_1,B_2,\cdots,B_k$ ， $S$ 关系的属性为 $B_1,B_2,\cdots,B_k,B_{k+1},B_{k+2},\cdots,B_m$ ；为 $S$ 的元组变量 $t^m$ 去掉重复属性 $B$ 所组成的新元组变量为 $t^{m^*}$ 。自然连接可以记为 $\bowtie S$ ，其形式定义如下：
$\bowtie S=\{t|t=<t^n,t^{m^*} > \wedge t^n \in R \wedge t^m \in S \wedge R.B_1 = S.B_1 \wedge R.B_2 = S.B_2 \wedge \cdots \wedge R.B_n = S.B_n \}$
自然连接可以由基本的关系元素笛卡儿积和选取运算导出，因此自然连接可表示为：
$\bowtie S=\prod_{A_1,A_2,\cdots,A_{n-k},R.B_1,R.B_2,\cdots,R.B_k,B_{k+1},B_{k+2},\cdots,B_m}(\sigma_{R.B_1 = S.B_1 \wedge R.B_2 = S.B_2 \wedge \cdots \wedge R.B_k = S.B_k}(R \times S))$

8. 除 Division

9.广义投影 Generalized Projection

10. 外连接 Outer Jion

11. 聚集函数

设 $R (U)$ 是属性集 $U$ 上的关系模式， $X 、 Y$ 是 $U$ 的子集。若对 $R (U)$ 中的任何一个可能的关系 $r$ ， $r$ 中不可能存在两个元组在 $X$ 上的属性值相等，而在 $Y$ 上的属性值不等，则称 $X$ 函数决定 $Y$ 或 $Y$ 函数依赖于 $X$ ，记作： $\rightarrow Y$ 。

如果 $\rightarrow Y$ ，但 $\not \subseteq X$ ，则称 $\rightarrow Y$ 是非平凡的函数依赖。
如果 $\rightarrow Y$ ，但 $\subseteq X$ ，则称 $\rightarrow Y$ 是平凡的函数依赖。

函数依赖是语义范畴的概念，我们只能根据语义确定函数依赖。

在 $R (U)$ 中，如果 $\rightarrow Y$ ，并且对于 $X$ 的任何一个真子集 $X^{'}$ ，都有 $X^{'}$ 不能决定 $Y$ ，则称 $Y$ 对 $X$ 完全函数依赖，记作： $X\overset f \rightarrow Y$ 。如果 $\rightarrow Y$ ，但 $Y$ 不完全函数依赖于 $X$ ，则称 $Y$ 对 $X$ 部分函数依赖，记作： $X\overset p \rightarrow Y$ 。部分函数依赖也称局部函数依赖。

在 $R (U, F)$ 中，如果 $\rightarrow Y, Y \not \subseteq X, Y \not \rightarrow X, Y \rightarrow Z$ ，则称 $Z$ 对 $X$ 传递依赖。

设 $K$ 为 $R (U, F)$ 中的属性组合，若 $\rightarrow U$ ，且对于 $K$ 的任何一个真子集 $K^{'}$ ，都有 $K^{'}$ 不能决定 $U$ ，则 $K$ 为 $R$ 的候选码，若有多个候选码，则选一个作为主码。

若 $R (U)$ 中的属性或属性组 $X$ 非 $R$ 的码，但 $X$ 是另一个关系的码，则称 $X$ 是 $R$ 的外码或称外键。

若关系模式 $R (U)$ 中， $X 、 Y 、 Z$ 是 $U$ 的子集，并且 $Z = U - X - Y$ 。当且仅当对 $R (U)$ 中的任何一个关系 $r$ ，给定一对 $(x, z)$ 值，有一组 $Y$ 的值，这组值仅仅决定于 $x$ 值而与 $z$ 无关，则称” $Y$ 多值依赖于 $X$ “或” $X$ 多值决定 $Y$ “成立。记为： $\rightarrow \rightarrow Y$ 。
多值依赖具有如下性质：

多值依赖具有对称性。即若 $\rightarrow \rightarrow Y$ ，则 $\rightarrow \rightarrow Z$ ，其中 $Z = U - X - Y$ 。
多值依赖的传递性。即若 $\rightarrow \rightarrow Y,Y \rightarrow \rightarrow Z$ ，则 $\rightarrow \rightarrow Z-Y$
函数依赖可以看成是多值依赖的特殊情况。
若 $\rightarrow \rightarrow Y,X \rightarrow \rightarrow Z$ ，则 $\rightarrow \rightarrow YZ$ 。
若 $\rightarrow \rightarrow Y,X \rightarrow \rightarrow Z$ ，则 $\rightarrow \rightarrow Y \cap Z$ 。
若 $\rightarrow \rightarrow Y,X \rightarrow \rightarrow Z$ ，则 $\rightarrow \rightarrow Z-Y$ 。

1NF 第一范式

若关系模式 $R$ 的每一个分量是不可再分的数据项，则关系模式 $R$ 属于第一范式，记为 $\in$ 1NF

2NF 第二范式

若关系模式 $\in 1NF$ ，且每一个非主属性完全依赖于码，则关系模式 $\in$ 2NF。换句话说，当1NF消除了非主属性对码的部分函数依赖，则成为2NF。
包含在任何一个候选码中的属性叫做主属性，否则叫做非主属性。

3NF 第三范式

若关系模式 $R (U, F)$ 中若不存在这样的码 $X$ ，属性组 $Y$ 及非主属性 $\not \subseteq Y)$ 使得 $\rightarrow Y,(Y \not \rightarrow X)Y \rightarrow Z$ 成立，则关系模式 $\in$ 3NF。
即当2NF消除了非主属性对码的传递函数依赖，则称为3NF。