三级数据库第五章考试要点
发布网友
发布时间:2023-07-14 17:15
我来回答
共1个回答
热心网友
时间:2024-11-03 07:04
第五章
一、关系数据库系统概述(一)关系数据库系统
关系数据库系统是支持关系数据模型的数据库系统。关系数据库应用数学方法来处理数据库中的数据。最早提出将这类方法用于数据处理的是1962年CODASYL发表的“信息代数”一文,之后有1968年David Child在7090机上实现的集合论数据结构,但系统而严格地提出关系模型的是美国IBM公司的E.F.Codd。1970年E.F.Codd连续发表了多篇论文,奠定了关系数据库的理论基础。
(二)关系数据模型
关系数据模型由关系数据结构、关系操作集合和关系完整性约束3大要素组成。
(1)关系数据结构关系模型的数据结构单一,在关系模型中,现实世界的实体以及实体间的各种联系均用关系来表示。在用户看来,关系模型中数据的逻辑结构是一张二维表。
(2)关系操作集合关系模型中常用的关系操作包括:选择(select)、投影(project)、连接(join)、除(divide)、并(union)、交(intersection)、差(difference)等,以及查询(query)操作和增(insert)、删(delete)、改(update)操作两大部分。查询的表达能力是其中最主要的部分。关系操作的特点是集合操作方式,即操作的对象和结果都是集合。这种操作方式也称为一次一个集合(set-at-a-time)的方式。相应地,非关系数据模型的数据操作方式则为一次一个记录(record-at-a-time)的方式。关系模型给出了关系操作的能力和特点,关系操作通过关系语言实现。关系语言的特点(它的优点)是高度非过程化,所谓非过程化是指:①用户不必请求DBA为他建立特殊的存取路径,存取路径的选择由DBMS的优化机制来完成。②用户也不必求助于循环,递归来完成数据的重复操作。
(3)关系的完整性约束数据库的数据完整性是指数据库中数据的正确性和相容性,那是一种语义概念,包括两个方面:①与现实世界中应用需求的数据的相容性和正确性。②数据库内数据之间的相容性和正确性。
二、关系模型的数据结构(一)关系模型的数据结构和基本术语
在关系数据模型(relation model)中,数据结构用单一的二维表结构来表示实体及实体间的联系。
(1)关系(relation):一个关系对应一个二维表,二维表就是关系名。
(2)属性(attribute)和值域(domain):在二维表中的列(字段),称为属性。属性的个数称为关系的元数,列的值称为属性值;属性值的取值范围称为值域。
(3)关系模式(relation schema):在二维表中的行定义(记录的型),即对关系的描述称为关系模式,一般表示为:关系名(属性1,属性2,…,属性n)
(4)元组(tuple):在二维表中的一行(记录的值),称为一个元组。关系模式和元组的集合通称为关系。
(5)分量(component):元组中的一个属性值
(6)候选码(candidate key)或候选键:如果在一个关系中,存在多个属性(或属性组合)都能用来惟一标识该关系的元组,这些属性(或属性组合)都称为该关系的候选码或候选键。
(7)主码(primary key)或主键:在一个关系的若干个候选码中指定一个用来惟一标识该关系的元组,这个被指定的候选码称为该关系的主码或主键。
(8)主属性(primary attribute)和非主属性(nonprimary attribute):关系中包含在任何一个候选码中的属性称为主属性或码属性,不包含在任何一个候选码中的属性称为非主属性或非码属性。
(9)外码(foreign key)或外键:当关系中的某个属性(或属性组)虽然不是该关系的主码或只是主码的一部分,但却是另一个关系的主码时,称该属性(或属性组)为这个关系的外码。
(10)参照关系(referencing relation)与被参照关系(referencing relation):参照关系也称从关系,被参照关系也称主关系,它们是指以外码相关联的两个关系。以外码作为主码的关系称为被参照关系;外码所在的关系称为参照关系或目标关系(target relation)。由此可见,被参照关系与参照关系是通过外码相联系的,这种联系通常是1:n的联系。对于数据库要分清型(type)和值(value)的概念,数据库的型是指对数据库的结构和属性的说明,关系数据库的型即对关系数据库结构的描述,它包括若干关系集合。数据库的值是型的一个具体赋值,关系数据库的值是这些关系模式在某一时刻对应的关系的集合。所以,数据库的型亦称为数据库的内涵(intention),数据库的值亦称为数据库的外延(extensive)。数据库的型是稳定的,而数据库的值是随时间不断变化的,因为数据库中的数据在不断变更。
(二)关系的形式定义和关系数据库对关系的限定
1.关系的形式定义
从数学的观点定义关系称为关系的形式定义。有如下两种定义方法:
(1)用集合论的观点定义关系:关系是一个元数为K的元组集合,即这个关系有若干个元组,每个元组有K个属性值(把关系看成一个集合,集合中的元素是元组)。
(2)用值域的概念来定义关系:关系是属性值域笛卡尔积的一个子集。设一个关系的属性是A 1 ,…,An,其对应的值域为D 1 …,D n (也可以有相同的),定义D 1 ,…,D n 的笛卡尔积D=D 1 ×D 2 …×D n ={(d 1 ,…,d n )|d i ∈Di,1≤i≤n}。D中的每一个子集称为关系。这里D的元素(d , …,d n )就是一个n元元组(n-tuple),元素中的每一个值di称为元组的一个分量。若Di(i=1,2…,,n)为有限集,其基数(Cardinal numder)为mi(i=1,2,…,n),则D 1 ×D 2 ×…D n 的基数M为 M=- n i=1 mi笛卡尔积可表示为一个二维表,表中的每行对应一个元组,表中的每列对应一个域。
2.关系数据库对关系的限定
(1)每一个属性是不可分解的。这是关系数据库对关系的最基本的一条限定,要求关系的每一个分量必须是一个不可分的数据项,也就是说,不允许表中还有表。
(2)每一个关系模式中属性的数据类型以及属性的个数是固定的,并且每个属性必须命名,在同一个关系模式中,属性名必须是不同的。
(3)每一个关系仅仅有一种记录类型,即一种关系模式。
(4)在关系中元组的顺序(即行序)是无关紧要的。
(5)在关系中属性的顺序可任意交换,交换时应连同属性名一起交换才行,否则顺序是重要的。
(6)同一个关系中不允许出现完全相同的元组。