一 数据库概念设计
1.3概念设计的任务:
- 定义和描述应用领域涉及的数据范围
- 获取应用领域或问题域的信息模型
- 描述清楚数据的属性特征
- 描述数据之间的关系
- 定义描述数据的约束
- 说明数据的安全性要求
- 支持用户的各种数据处理需求
- 保证信息模型方便的转换成数据库逻辑结构
1.2概念设计的依据:
需求分析的文档,需求说明书,功能模型(数据流图或IDEF0图)
信息模型(ER图)和数据库概念说明书是数据库逻辑设计的依据
1.2 数据库概念设计过程
- 明确建模目标
- 定义实体集
- 定义联系: 标识实体集之间的方法是建立联系矩阵
- 建立信息模型(构造ER模型
- 确定实体集属性
- 对信息模型进行集成与优化
1.3 数据建模方法
- 能够真实客观的描述现实社会中数据之间的关系
- 组成模型的概念少,语义清楚,容易理解
- 不同概念的语义不重叠,概念无多义性
- 用图形方式描述数据,数据易观易懂,有利于数据库设计者和用户交流
- 这种数据模型容易转换成数据库逻辑设计阶段需要的数据结构
ER建模方法
- 实体或实例:实体指客观存在并且可互相区分的事务
- 实体集
- 属性:每个属性的取值范围叫做域
- 码
- 联系 :一对一联系,一对多联系,多对多联系
IDEF1X建模方法
- 实体集(独立实体集,从属实体集)
- 联系:确定型连接联系(标定型联系,非标定型联系,分类联系)
二 数据库逻辑设计
标识ER模型中的联系,依次转换与每个联系相关联的实体集及联系
三 数据库物理设计
数据库的物理结构
- 文件的组织
- 文件的结构
- 文件的存取
- 索引技术
3.1 索引技术
有序索引
- 聚集索引
- 非聚集索引
- 稠密索引
- 稀疏索引
- 主索引
- 辅索引
- 唯一索引
- 单层索引
- 多层索引
散列索引
索引建立的原则
经常查询,连接,统计操作,数据量大的基本表可以考虑建立索引
一个基本表可以建立一个聚集索引,还可以建立多个非聚集索引
索引可以删除和修改
建立索引的属性
- 主码
- 查询较多的属性
- 参与连接操作的属性
- 频繁搜索的属性
- 属性由许多不同值的时候,索引有用,属性由同值的时候,不适合索引
3.2物理设计内容
- 数据库逻辑模式描述
- 文件组织与存取设计
- 数据分布设计
- 确定系统配置
- 物理模式评估
数据库逻辑模式描述
- 面向目标数据库描述基本表和视图
- 设计基本表业务规则
DB文件组织与存储设计
- 使用事务-基本表交叉引用矩阵
- 估计各个事务的执行频率
为一些基本表选择合适的文件结构的原则: - 基本表数据量少,插入,删除,更新等操作频繁,采用堆文件组织方式
- 顺序文件支持基于查找码的顺序访问
- 访问顺序随机,散列文件合适
- 索引文件结构,适合于大数据基本表
- 多表连接频繁,聚集文件合适
数据分布设计
不同类型的数据的物理分布
基本表和索引表分开存储,放置在不同的磁盘上
应用数据的划分于分布
根据数据使用的特征分布,频繁使用分区和非频繁使用分区
时间地点分区
分布式数据库系统:垂直分布和水平分布
派生数据分布
关系模式的去规范化