《数据库原理与应用》复习总结


数据库技术就是主要研究如何科学的组织和存储数据,高效的获取和处理数据,并可以满足用户各种不同的信息需求的技术,因为对数据库技术的需求非常大,所以学习这门课的知识和技术是非常必要的,应熟练弄清,掌握数据,数据管理,数据库,数据模型和概念模型的等专业术语的内涵。

第1章 绪论

1.掌握数据库、数据库管理系统、数据库系统(组成)的概念

2.了解数据库技术发展的三个阶段

3.掌握三级模式及二级映像的概念

4.理解数据库管理系统的主要功能

知识点:

数据:数据库系统研究和处理的对象,描述世界事物的符号记录,有以下四个特征:

1:数据有“值”和“型"之分

”值“指的是数据的具体数值,”型“指的是数据的结构。

2:数据受取值范围和类型的约束。

3:有定性表示和定量表示之分。

4:具有载体和多种表现形式。

数据库:长期存储在计算机内,有组织的,可共享,统一管理的数据集合,是一个按照数据结构来存储数据的计算机软件系统。

1:保管数据的仓库,数据管理新的方法和技术,能更合理的组织数据,更方便更合理的维护,控制,利用数据。

一个数据的集合的特点:

1:最小的冗余度。

2:应用程序对数据资源共享。

3:数据独立性高。

4:统一管理和控制。

数据库管理系统(DBMS):位于用户和计算机操作系统之间的提供数据管理的软件。

对数据库实现统一的管理和控制,以保证数据库的安全性和完整性,用户可以通过DBMS访问数据库的内容,数据库管理员可以通过DBMS维护数据。

主要功能:

1:数据定义能力:由数据库定义语言(DLL),实现定义功能。

2:数据操纵能力:DBMS提供数据操作语言 <http://baike.baidu.com/view/3426309.htm>DML(Data
Manipulation Language),供用户实现对数据的追加、删除、更新、查询等操作。

3:数据库的组织 <http://baike.baidu.com/view/46944.htm>、存储与管理:DBMS要分类组织、存储
<http://baike.baidu.com/view/87682.htm>和管理各种数据,包括数据字典
<http://baike.baidu.com/view/70173.htm>、用户数据、存取路径等。

4:数据库的建立及维护功能:数据库的恢复、数据库的并发控制 <http://baike.baidu.com/view/1672732.htm>、数据库的
完整性控制 <http://baike.baidu.com/view/3253924.htm>、数据库安全性控制,数据库的数据载入、转换、转储、数据库
<http://baike.baidu.com/view/1088.htm>的重组合重构以及性能监控等功能,

数据库系统:

包含计算机硬件,数据库,数据库管理系统,应用程序系统及数据库管理员,带有数据库并利用数据库技术进行数据库管理的计算机系统。

数据库系统相对于文件系统具有以下特点:

1:数据的结构化。

2:数据库系统的数据冗余度小,数据共享度高。

3:数据库系统的数据和程序之间具有较高的独立性。

4:数据库中数据的最小存取单位是数据项。

5:统一的数据管理和控制。

6:提供数据库保护。

第2章 数据建模

1.掌握实体联系模型(E-R图)的表示方法,包括实体、属性、联系及联系类型。

2.理解数据模型的三要素

3.了解层次、网状数据模型的特点

知识点:

数据库常用模型:1,层次模型:

2,网状模型,3,关系模型,4面向对象模型。

 1.实体(Entity)

  一个实体是现实世界客观存在的一个事物。可以是一个具体的事物,如一所房子、一个元件、一个人等,也可以是抽象的事物,如一个想法、一个计划、或一个工程项目等等。实体由它们自己的属性值表示其特征。实体分为强实体和弱实体。

 2.实体集:
  结构和特性相同的实体组成的集合称为实体集。例如,学生实体集,班级实体集等。

3.实体类型:
  描述实体集的信息结构,通常包括类型名和实体的属性名集合。例如,学生(学号,姓名,性别,年龄,班级)。
  4.属性:
  描述实体或联系的特性。实体的每个特性称为一个属性。属性有属性名、属性类型、属性定义域和属性值之分。
  5.实体标识(码或键):
  其值能唯一地标识每个实体的属性集称为实体的标识。在关系数据库中实体的标识称为码或键,其标识码是实体的单个属性或属性子集的值。
  例如,学生的学号,既是学生的属性又是学生的标识码,研究所的标识可以是研究所的所名或所的编号。
  6.联系:

  现实世界中,事物之间的相互联系是客观存在的,联系反映实体间的相互关系。这种联系必然要在信息世界中进行描述。而且,联系除用作属性外,联系本身也可以有属性值。
  例如,每个教师隶属一个研究所,每个教师和其隶属的一个研究所之间有一个隶属联系。 
  7.联系集:
  实体间相同类型的联系也构成联系集合。例如,多个教师和他们隶属的研究所之间就形成隶属联系集。
  8.联系类型:
  描述具有共同特性的实体之间联系集的信息结构,通常包括联系的类型名、联系的属性等。

  例如,每个教师和其隶属的一个研究所之间是"属于"联系;每个教师和其所教授的学生之间是"教与学"的联系;零件供应商和其供应的零件之间有"供应"联系,"供应"联系的属性有供应数量等。

 

 


·数据(Data):

反映客观世界的事实,并可以区分其特征的符号:字符、数字、文本、声音、图形、图像、图表、图片等,它们是现实世界中客观存在的,可以输入到计算机中进行存储和管理的。
· 信息(Information):
由原始数据经加工提炼而成的、用于决定行为、计划或具有一定语义的数据称为信息。
· 数据库DB(Data Base):
是现实世界中相互关联的大量数据及数据间关系的集合。
· 数据库管理系统DBMS(Data Base Management System):
是对数据库中的数据进行存储和管理的软件系统。包括存储、管理、检索和控制数据库中数据的各种语言和工具,是一套系统软件。 
· 数据库系统DBS(Data Base System):
是对数据库和数据库管理系统的总称。是指相互关联的数据集合与操纵数据的软件工具集合。DBS = DB+DBMS
· 数据库应用程序接口API(Application Programming Interface):
是由DBMS为开发应用程序提供的操纵和访问数据库中数据的接口函数、过程或语言。
· 数据库应用程序AP(Application Program):
满足某类用户要求的操纵和访问数据库的程序。
· 数据仓库(Data Warehouse)
一个数据仓库就是一个自带数据库的商业应用系统。利用现有的数据资源,把数据转换为信息,从中挖掘出知识,提炼成智慧,创造出效益。 
· 数据发掘(Data Mining)
数据发掘可帮助商业用户处理大量存在的数据,以期发现一些"意外的关系",以便增加市场份额和利润。
· 信息发掘(Information Mining):
信息发掘是指在文档、地图、照片、声音和影像之汪洋大海中发现相关信息,即面向内容的检索。
· 数据模式(Data Model):
在数据库中,对数据(实体)的描述称为数据库模式。用相应的模式定义语言来描述。
· 数据模型(Data Model):
是对现实世界特征的数字化的模拟和抽象。
· 字段( Field):
层次数据模型中数据的最小单位,描述实体的属性。
· 片段(Segment):
是IMS层次数据模型中描述实体的单位,由字段集合组成的记录。也是应用程序访问数据库数据的单位。
· 数据项(Data Item):
是DBTG命名的网状数据模型中的最小数据单位, 表示实体的属性。
· 记录(Record ):
是DBTG命名的网状数据模型中描述实体的单位,是数据项的有序集合。

· 域(Domain):
域是值的集合,即值的取值范围。
· 关系(Relation):
一个关系就是一张二维表, 每张表有一个表名。
· 元组(Tuple):
关系表中的一行称为一个元组。元组可表示一个实体或实体之间的联系。
· 属性( Attribute):
关系表中的一个列称为关系 的一个属性,即元组的一个数据项。属性有属性名、属性类型、属性值域和属性值之分。属性名在表中是唯一的。

 

· 关键字( Primary Key ):
表中的一个属性或几个属性的组合、其值能唯一地标识关系中的一个元组。关键字属性不能取空值。
· 外部关键字(Forgien Key):
在一个关系中含有的与另一个关系的关键字相对应的属性组称为该关系的外部关键字。外部关键字取空值或为外部表中对应的关键字值。
· 网络库(Net-Library):
一个通信软件包,对数据库请求和结果打包,由网络协议传送。也称Net-Library,在客户机和服务器上都要安装。
第3章 关系数据库

 

2.理解关系的6个性质

3.掌握概念:码、主属性与非主属性、全码及外码,关系模式的表示方法。

4.掌握关系的三类完整性约束条件(实体完整性、参照完整性及用户定义的完整性)

5.熟练使用关系代数表达各类查询(集合运算、选择、投影、连接、除) ;能够根据数据表结构,使用关系代数表达查询要求。

知识点:

关系的六个特点:

(1)同一属性的数据具有同质性。

(2)同一关系的属性名具有不能重复性。

(3)关系中的列位置可以交换。

(4)同一关系中的元组不能完全相同。

(5)元组顺序可以交换。

(6)每一个分量都必须是不可分的数据项。

关系的码:

候选码:唯一标识关系中元组的一个属性或属性集。

比如:“学生关系”中学号能唯一标识每一个学生。若有多个候选码,则可以选一个做为主码,

主属性:包含在候选码中的任一属性称为主属性。

非主属性:不包含在任何候选码中的属性,比如:学生关系中的“学号”,教室关系中的“教室号”。

数据概念模型:

E-R图:

例下:

  UML模型:                           

通常有四种:

1:层次模型。

2:网状模型。

3:关系模型。

4:面向对象模型。

关系模式的形式化表示:

R(U,D,DOM,F);

R:关系名。

U:组成该关系的属性所来自的域。

DOM:属性向域的映像集合。

F:属性间的数据依赖关系集合。

实体完整性规则:

属性A是是基本关系R的主属性,则属性A的值不能为空值。

参照完整性;(F的每个属性为空值,或等于某个元组的主码值)。例下:



用户定义的完整性。

关系代数的运算符:



 

第4章 规范化理论

1.掌握概念:函数依赖、部分函数依赖、完全函数依赖及传递函数依赖。

4.掌握范式概念:1NF、2NF、3NF

5.掌握模式的分解方法及步骤;能够根据给定的关系模式,判断其范式类型,并根据要求进行分解,达到规定的范式级别。

 6.理解关系模式分解的原则

知识点:

关系模式的基本要求:

(1)元组的每一个分量必须是不可分的数据项。

(2)数据库中的数据冗余尽可能少。

(3)当对数据进行更新操作时,不会产生更新异常。

(4)进行插入操作,不会产生插入异常。

(5)进行删除操作,不会产生删除异常。

关系数据库中的规范化理论主要包含三个方面的内容:

1,函数依赖,2,范式,3,模式设计。

在数据的规范化理论中,模式分解应满足的几个条件是:遵守规范化理论,保持原有的依赖关系,无损连接性。

1NF:消除非主属性对键的部分函数依赖关系,变为2NF.

2NF:  消除非主属性对键的传递函数依赖关系,变为3NF.

3NF:消除主属性对键的部分函数,和传递函数依赖关系,变为BCNF.

在规范化的过程中,逐渐消除了存储异常,使数据冗余度尽量小,便于插入,删除,更新。

第5章 数据库设计

1.理解数据库设计的6个步骤及采用的方法

3.掌握概念结构(E-R图)设计方法,理解各分E-R图之间常见的三类冲突

4.掌握E-R图向关系模式转换的规则,了解数据模型的优化

能够根据给定的语义,找出相关实体、实体的属性、实体间联系,画出E-R图,并能转换为相应的关系模式。

知识点:

数据库设计的任务,内容,特点:

(1)广义的数据库设计,是指建立数据库及其应用系统,包括选择合适的计算机平台和数据库管理系统、设计数据库、以及开发数据库应用系统等.

(2)狭义的数据库设计,是指
根据一个组织的信息需求、处理需求和相应的数据库支撑环境(主要是数据库管理系统DBMS),设计出数据库,包括概念结构、逻辑结构和物理结构。其成果主要是数据库。

(3)数据库设计有两种不同的方法:一种是以信息需求为主,兼顾处理需求,称为面向数据的设计方法,一种是处理需求为主,兼顾信息需求,称为面向过程的设计方法。

优缺点:第一种:可以比较好的反映数据的内存数据,既可以满足当前应用需求,也可以满足潜在需求。

                第二种:初始阶段可能比较满足,但随着应用的发展和变化,需要进行很大的改动,设计,以满足实际需求。

                在实际应用中,对于用户的数据是变动的,所以一般采用面向数据的设计方法。

数据库设计的成果:(1)数据库模式;(2)数据库为基础的典型应用程序,最基本的成果是数据库模式。

数据库设计的特点:

同其他工程一样,数据库也有自己的特点,主要表现在以下四个方面:

(1)复杂性。(2)反复性,(3)试探性,(4)分布进行。

数据库设计方法:

数据库方法学的指导原则:

1:可以在短时间内,合理的工作量,产生有实用价值的数据库结构。

2:具有足够的灵活性和通用性,可以供具有不同经验的人使用,使用与于不同数据模型的DBMS限制。

规范化的设计方法:新奥尔良法,它将常见的数据库设计分为四个阶段:需求分析,概念分析,逻辑分析,物理分析。

基于E-R模型的数据库设计方法,基于3NF的设计方法。

数据库设计的步骤:

1:需求分析:

 


需求分析阶段,主要是准确收集用户信息需求和处理需求,并对收集的结果进行整理和分析,形成需求说明。需求分析是整个设计活动的基础,也是最困难和最耗时的一步。如果需求分析不准确或不充分,可能导致整个数据库设计的返工。

2:概念设计:

 


概念结构设计是数据库设计的重点,对用户需求进行综合、归纳、抽象,形成一个概念模型(一般为ER模型),形成的概念模型是与具体的DBMS无关的模型,是对现实世界的可视化描述,属于信息世界,是逻辑结构设计的基础。

3:逻辑结构设计阶段:

 

逻辑结构设计是将概念结构设计的概念模型转化为某个特定的DBMS所支持的数据模型,建立数据库逻辑模式,并对其进行优化,同时为各种用户和应用设计外模式。

4:物理设计:

 

物理结构设计是为设计好的逻辑模型选择物理结构,包括存储结构和存取方法,建立数据库物理模式(内模式)。

5: 实施和维护阶段:

 


实施阶段就是使用DLL语言建立数据库模式,将实际数据载入数据库,建立真正的数据库;在数据库上建立应用系统,并经过测试、试运行后正式投入使用。维护阶段是对运行中的数据库进行评价、调整和修改。


 



需求分析工具:

1:数据流图和数据字典。

2:UML统一建模语言:用例,静态,行为,实现图。

概念设计方法,步骤:

(1)自顶向下。

(2)自底向上。

(3)逐步扩张。

(4)混合策略。

E-R图设计方法:

是一种广泛采用的概念模型设计方法。表示方法如下:

1,实体。

2,属性。

3,联系。

UML设计方法:

UML类图与E-R图的区别:



逻辑结构步骤:

1.将概念模型结构转化为一般的关系,网状,层次模型。

2.将转化来的关系,网状,层次模型向特定的DBMS支持下的数据模型转化。

3.对数据模型继续优化。

第6章 SQL语言

1.数据定义语言、数据查询语言、数据更新语言

2. 索引、视图的概念

能够根据给出的表结构和查询要求,写出相应的SQL 语句

 第7章 数据库安全保护(非重点章节)

1.掌握概念:事务、事务的特征

2.理解安全性控制的概念及常用的方法,掌握权限授予与回收的基本语句,

3.理解完整性控制的概念

4.理解并发控制的概念、并发所导致的三类数据的不一致性,具体参见:

理解封锁的概念,了解封锁协议

 5.了解数据库恢复的概念及原理