1.1数据库系统概述

1.1.1数据库的4个基本概念

数据:描述事物的符号记录;
数据库:长期存储在计算机内、有组织的、可共享的大量数据的集合;数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享;
数据库管理系统:位于用户与操作系统之间的一层数据管理系统,其主要功能包括:①数据定义功能,如数据定义语言(DDL)②数据组织、存储和管理③数据操纵功能④数据库的事务管理和运行管理⑤数据库的建立和维护功能⑥其他功能
数据库系统:由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员(DBA)组成的存储、管理、处理和维护数据的系统。

1.1.2数据库的特点

数据结构化:数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别;“整体”结构化是指数据库中的数据不再仅仅针对某一个应用,而是面向整个组织或企业;不仅数据内部是结构化的,数据之间是具有联系的。
数据的共享性高、冗余度低易扩充:数据共享可以大大减少数据冗余,节约存储空间;数据共享还可以避免数据之间的不相容性与不一致性;这就使得数据库系统弹性大,易于扩充。
数据独立性高:数据独立性包括物理独立性、逻辑独立性;物理独立性指用户的应用程序与数据库中数据的物理存储是相互独立的;逻辑独立性:用户的应用程序与数据库的逻辑结构是相互独立的。
数据由数据库管理系统统一管理和控制:数据库管理系统提供了数据的安全性保护:保护数据已防止不合法使用造成的数据泄密和破坏、数据的完整性检查:数据的正确性有效性相容性、并发控制、数据库恢复功能。
数据库是长期存储在计算机内有组织、大量、共享的数据集合。他可以供各种用户共享,具有最小冗余度和较高的数据独立性。数据库管理系统在数据库建立、运用和维护是对数据库进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。

1.2数据模型

1.2.1两类数据模型

概念模型:也称信息模型,按用户的观点来对数据和信息建模,主要用于数据库设计。
逻辑模型和物理模型:逻辑模型包含层次模型、网状模型、关系模型、面向对象数据模型、对象关系模型、半架构化模型等,逻辑模型按照计算机系统的观点对数据建模,主要用于数据库管理系统的实现;物理模型是对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方法,或在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的,数据库设计人员要了解和选择物理模型。
大致的模型确立过程如图1所示:
数据库系统概论 1.绪论-LMLPHP

1.2.2概念模型

信息世界中的基本概念:
实体:客观存在并可相互区别的事物称为实体。
属性:实体所具有的某一特性称为属性。
:唯一表示实体的属性集称为码。
实体型:用属性名及其属性名集合来抽象和刻画同类实体称为实体型。
实体集:统一类型实体的集合称为实体集。
联系:实体之间的联系通常有一对一,一对多,多对多 等多种类型。
概念模型可以用实体-联系方法表示,也称为E-R图。

1.2.3数据模型的组成要素

数据结构:描述数据库的组成对象以及对象之间的联系。
数据操作:数据库中各种对象(型)的实例(值)允许执行的操作的集合,脑阔操作及有关的操作规则。(增删改查)
数据的完整性约束条件:一组完整性规则。

1.2.4常用的数据模型

主要的逻辑模型有:层次模型、网状模型、关系模型、面向对象数据模型、对相关关系数据模型、半结构化数据模型。
格式化模型:层次模型、网状模型
格式化模型中数据结构的基本单位是基本层次联系;基本层次联系是指两个记录以及他们之间的一对多(包括一对一)的联系。

1.2.5层次模型

大致结构如图实例所示:
数据库系统概论 1.绪论-LMLPHP
层次模型的数据结构
1.有且只有一个结点没有双亲结点,这个结点称为根结点;
2.根以外的其他结点有且只有一个双亲结点;
3.每个结点表示一个记录类型,所以层次模型只能处理一对多的关系。
层次模型的数据操纵与完整性约束
1.进行插入操作时,如果没有响应的双亲结点值就不能插入它的子女结点值;
2.进行删除操作时,如果删除双亲结点值,则相应的子女结点值也将被同时删除。
层次模型的优点
1.层次模型的数据结构比较简单清晰;
2.层次数据库的查询速率高;
3.层次模型提供了良好的完整性支持。
层次模型的缺点
1.现实世界中许多联系是非层次性的,多对多的关系不适用;
2.如果一个结点具有多个双亲结点等,用层次模型表示这类联系就很笨拙,只能通过引入用于书(易产生不一致性)或创建非自然的数据结构(引入虚拟结点)来解决。对插入和删除操作的限制较多;
3.查询子女结点必须通过双亲;
4.结构严密,层次命令趋于程序化。

1.2.6网状模型

网状模型的大致结构如图所示:
数据库系统概论 1.绪论-LMLPHP
网状模型的数据结构
1.允许一个以上的结点无双亲;
2.一个结点可以有多于一个的双亲;
3.每个结点表示一个记录类型;
4.网状模型中子女结点与双亲结点的联系可以不唯一。
网状模型的数据操纵与完整性约束
1.支持记录码的概念;
2.保证一个联系中双亲记录和子女记录之间是一对多的联系;
3.可以支持双亲记录和子女记录之间的某些约束条件。
网状模型的优点
1.能更为直接的描述现实世界;
2.具有良好的性能,存取效率较高。
网状模型的缺点
1.结构较为负责;
2.网状模型的DDL、DML复杂,并且需要嵌入某一种高级语言中;
3.由于记录之间的联系是通过存取路径实现的,应用程序在访问数据时必须选择适当的存取路径,所以用户需要了解系统的结构的细节,不利于开发与使用。

1.2.7关系模型

关系模型的大致结构如图所示:
数据库系统概论 1.绪论-LMLPHP
关系模型的数据结构
关系:一个关系对应通常说的一张表;
元组:表中的一行即为一个元组;
属性:表中的一列即为一个属性;
:也称为码键,表中的某个属性组可以唯一确定一个元组,就为码;
:一组具有相同数据类型的值的集合;
分量:一个元组中的一个属性值;
关系模式:对关系的描述,一般格式:关系名(属性1,属性2…)
关系模型要求关系必须是规范化的,关系的每一个分量必须是一个不可分的数据项。
关系模型的优点
1.数据结构单一
关系模型中,不管是实体还是实体之间的联系,都用关系来表示,而关系都对应一张二维数据表,数据结构简单、清晰。
2.关系规范化,并建立在严格的理论基础上
构成关系的基本规范要求关系中每个属性不可再分割,同时关系建立在具有坚实的理论基础的严格数学概念基础上。
3.概念简单,操作方便
关系模型最大的优点就是简单,用户容易理解和掌握,一个关系就是一张二维表格,用户只需用简单的查询语言就能对数据库进行操作。
关系模型的缺点:
由于存储路径对用户隐蔽,查询效率低于格式化数据模型,为提高性能,需要开发人员对用户请求进行优化。

1.3数据库系统的结构

1.3.1数据库系统模式的概念

:对某一类数据的结构和属性的说明;
:型的一个具体赋值;
模式:数据库中全体数据的逻辑结构和特征的面熟,仅仅涉及型的描述,不涉及具体的值;
实例:模式的一个具体值,同一个模式可以有多个实例;
模式是相对稳定的,实例时相对变动的。

1.3.2数据库系统的三级模式

数据库领域公认的标准结构是三级模式结构,它包括外模式、概念模式、内模式,有效地组织、管理数据,提高了数据库的逻辑独立性和物理独立性。用户级对应外模式,概念级对应概念模式,物理级对应内模式,使不同级别的用户对数据库形成不同的视图。所谓视图,就是指观察、认识和理解数据的范围、角度和方法,是数据库在用户“眼中"的反映,很显然,不同层次(级别)用户所“看到”的数据库是不相同的。
外模式
外模式又称子模式或用户模式,对应于用户级。它是某个或某几个用户所看到的数据库的数据视图,是与某一应用有关的数据的逻辑表示。外模式是从模式导出的一个子集,包含模式中允许特定用户使用的那部分数据。用户可以通过外模式描述语言来描述、定义对应于用户的数据记录(外模式),也可以利用数据操纵语言(Data Manipulation Language,DML)对这些数据记录进行操作。外模式反映了数据库系统的用户观。
概念模式
概念模式又称模式或逻辑模式,对应于概念级。它是由数据库设计者综合所有用户的数据,按照统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述,是所有用户的公共数据视图(全局视图)。它是由数据库管理系统提供的数据模式描述语言(Data Description Language,DDL)来描述、定义的。概念模式反映了数据库系统的整体观。
内模式
内模式又称存储模式,对应于物理级。它是数据库中全体数据的内部表示或底层描述,是数据库最低一级的逻辑描述,它描述了数据在存储介质上的存储方式和物理结构,对应着实际存储在外存储介质上的数据库。内模式由内模式描述语言来描述、定义的。内模式反映了数据库系统的存储观。
在一个数据库系统中,只有唯一的数据库, 因而作为定义 、描述数据库存储结构的内模式和定义、描述数据库逻辑结构的模式,也是唯一的,但建立在数据库系统之上的应用则是非常广泛、多样的,所以对应的外模式不是唯一的,也不可能是唯一的。
数据库系统概论 1.绪论-LMLPHP

1.3.3数据库的二级映像功能与数据独立性

外模式/模式映像:每个外模式都有一个与之对应的外模式/模式映像,一个数据库有多个该模式,当模式改变时,有数据库管理员对各个外模式/模式的映像作为改变,可以使外模式不变,因为应用程序根据外模式编写,这样保证了数据与程序的逻辑独立性;
模式/内模式映像:数据库中模式/内模式是唯一的,当数据库的存储结构改变时,有数据库管理员对模式/内模式映像做出相应改变,可以使模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性。

1.4数据库系统的组成

1.数据库(database,DB)是指长期存储在计算机内的,有组织,可共享的数据的集合。数据库中的数据按一定的数学模型组织、描述和存储,具有较小的冗余,较高的数据独立性和易扩展性,并可为各种用户共享。
2.硬件:构成计算机系统的各种物理设备,包括存储所需的外部设备。硬件的配置应满足整个数据库系统的需要。
3.软件:包括操作系统、数据库管理系统及应用程序。数据库管理系统(database management system,DBMS)是数据库系统的核心软件,是在操作系统的支持下工作,解决如何科学地组织和存储数据,如何高效获取和维护数据的系统软件。其主要功能包括:数据定义功能、数据操纵功能、数据库的运行管理和数据库的建立与维护。
4.人员:主要有4类。第一类为系统分析员和数据库设计人员:系统分析员负责应用系统的需求分析和规范说明,他们和用户及数据库管理员一起确定系统的硬件配置,并参与数据库系统的概要设计。数据库设计人员负责数据库中数据的确定、数据库各级模式的设计。第二类为应用程序员,负责编写使用数据库的应用程序。这些应用程序可对数据进行检索、建立、删除或修改。第三类为最终用户,他们利用系统的接口或查询语言访问数据库。第四类用户是数据库管理员(data base administrator,DBA),负责数据库的总体信息控制。DBA的具体职责包括:具体数据库中的信息内容和结构,决定数据库的存储结构和存取策略,定义数据库的安全性要求和完整性约束条件,监控数据库的使用和运行,负责数据库的性能改进、数据库的重组和重构,以提高系统的性能。

07-24 19:50