目录
一、数据库的基本概念
数据库要学习的四个基本概念,主要是:数据、数据库系统、数据库、数据管理系统。数据(Date)是描述事物的记录,数据库系统(DBS),数据库管理系统(DBMS)相当于仓库管理员,数据库(DB)。他们之间的关系是数据库系统包括数据库管理系统,数据库,数据。
使用数据库可以高效且条理分明的存储数据,使人们能够更加迅速、方便的管理数据。数据库具有以下特点:
(1)可以结构化存储大量的数据信息,方便用户进行有效的检索和访问
(2)可以有效的保持数据信息的一致性、完整性,降低数据冗余
(3)可以满足应用的共享和安全方面的要求
1.1 数据库的组成
数据(Date)
- 描述事物的符号记录
- 包括数字,文字、图形,图像、声音、档案记录等
- 以“记录”形式按统一的格式进行储存
- 相同格式和类型的数据统一存放在一起,而不会把"人”和"书"混在一起存储。这样,数据的存储就能够井然有序。
数据如何保存:最外层是mysql服务—》mysql数据库—》数据表—》记录为行,字段为列—>数据保存在一行行记录中
表
- 将不同的记录组织在一起
- 用来储存具体数据
- 记录:行
- 字段(属性):列
- 以 行+列 的形式就组成了表(数据存储在表中)
关系数据库的表由记录组成,记录由字段组成,字段由字符或数字组成。它可以供各种用户共享,具有最小冗余度和较高的数据独立性,它是统一管理的相关数据的集合。
数据库
- 表的集合,是存储数据的仓库
- 以一定的组织方式存储的相互有关的数据集合
1.2 数据库管理系统(DBMS)
是实现对数据库资源有效组织、管理和存取的系统软件,在操作系统的支持下,支持用户对数据库的各项操作
DBMS主要包括以下功能:
- 数据库的建立和维护功能:包括建立数据库的结构和数据的录入与转换、数据库的转储与恢复、数据库的重组与性能监视等功能。
- 数据定义功能:包括定义全局数据结构、局部逻辑数据结构、存储结构、保密模式及信息格式等功能。保证存储在数据库中的数据正确、有效和相容,以防止不合语义的错误数据被输入或输出。
- 数据操纵功能:包括数据查询统计和数据更新两个方面。
- 数据库的运行管理功能:这是数据库管理系统的核心部分,包括并发控制、存取控制、数据库内部维护等功能。
- 通信功能:DBMS 与其他软件系统之间的通信,如Access能与其他office组件进行数据交换。
1.3 数据库系统(DBS)
- 是一个人机系统,由硬件、OS、数据库、DBMS、应用软件和数据库用户组成
- 用户可以通过DBMS或应用程序操作数据库
1.4 DBMS的工作模式
1.接受应用程序的数据请求和处理请求
2.将用户的数据请求(高级指令)转换为复杂机器代码(底层指令)
3.实现对数据库的操作
4.从数据库的操作中接受查询结果
5.对查询结果进行处理(格式转换)
6.将处理结果返回给用户
二、数据库的发展史
第一代数据库:20世纪60年代起,第一代数据库系统问世,是层次模型和网状模型的数据库系统。
第二代数据库:20世纪70年代初,第二代数据库——关系型数据库开始出现;20世纪80年代初,IBM公司的关系数据库系统DB2问世,开始逐步取代层次与网状模型的数据库,成为行业主流。
第三代数据库:20世纪80年代开始,适应不同领域的新型数据库系统不断涌现,面对对象的数据库系统,实用性强、适应面广。20世纪90年代后期,形成了多种数据库系统共同支撑应用的局面。一些新的元素被添加进主流数据库系统中,如:SQL+NOSQL组合使用。
三、关系型数据库与非关系型数据库
3.1 关系型数据库
关系数据库系统是基于关系模型的数据库系统;关系模型的数据结构使用简单易懂的二维数据表
每一行称为一条记录,用来描述一个对象的信息
每一列称为一个字段,用来描述对象的一个属性
关系模型可用简单的"实体-关系-属性"来表示
实体:也称为实例,对应现实世界中可区别于其他对象的“事件”或“事物”
如银行客户、银行账户等。
属性:实体所具有的某一特性,一个实体可以有多个属性;如“银行客户”实体集中的每个实体均具有姓名、住址、电话等属性。
联系:实体集之间的对应关系称为联系,也称为关系;如银行客户和银行账户之间存在“储蓄”的关系。
所有实体及实体之间联系的集合构成一个关系数据库
在二维表中,每一行称为一条记录,用来描述一个对象的信息;每一列成为一个字段,用来描述对象的一个属性。
3.2 非关系数据库
- 非关系数据库也被称作NoSQL (Not Only SQL)
- 存储数据不以关系模型为依据,不需要固定的表格式
优点:
- 数据库可高并发读写
- 对海量数据高效率存储与访问
- 数据库具有高扩展性与高可用性
- 常用的非关系数据库:Redis、mongoDB等
四、关系型数据库和非关系型数据库的区别
4.1 关系型数据库
关系数据库结构是二维数据库表,二维表当中每个字段(列)用来描述对象的一个属性,每个记录(行)用来描述一个对象的信息(完整信息),关系数据库写到哪里也就是存储在硬盘当中读写系统就会受到的Io限制或者瓶颈。
关系型数据库最典型的数据结构是表,由二维表及其之间的联系所组成的一个数据组织。
优点:
- 易于维护:都是使用表结构,格式一致;
- 使用方便:SQL语言通用,可用于复杂查询;
- 复杂操作:支持SQL,可用于一个表以及多个表之间非常复杂的查询。
缺点:
- 读写性能比较差,尤其是海量数据的高效率读写;
- 固定的表结构,灵活度稍欠;
- 高并发读写需求,传统关系型数据库来说,硬盘I/o是一个很大的瓶颈。
4.2 非关系型数据库
非关系数据库也被称作NoSQL(Not Only SQL)
存储数据不以关系模型为依据,不需要固定的表格式
MongoDB 、 Redis(内存数据库/缓存数据库)K-V键值对、与之类似的Memcache,K-V键值对
redis-memecache对比:
相同点:存储高热数据(在内存中高速运行)
不同点:redis可以做持久化保存,可以存储对象
非关系型数据库严格上不是一种数据库,应该是一种数据结构化存储方法的集合,可以是文档或者键值对等。
优点:
- 格式灵活:存储数据的格式可以是key,value形式、文档形式、图片形式等等,文档形式、图片形式等等,使用灵活,应用场景广泛,而关系型数据库则只支持基础类型。
- 速度快:nosql可以使用硬盘或者随机存储器作为载体,而关系型数据库只能使用硬盘;
- 高扩展性;
- 成本低:nosql数据库部署简单,基本都是开源软件。
缺点:
- 不提供sql支持,学习和使用成本较高;
- 无事务处理;
- 数据结构相对复杂,复杂查询方面稍欠。
五、MySQL存储引擎
5.1 InnoDB存储引擎(快速读取,不支持事务)
InnoDB是事务型数据库的首选引擎,支持事务安全表(ACID),支持行锁定和外键,上图也看到了,InnoDB是默认的MySQL引擎。InnoDB主要特性有:
1、InnoDB给MySQL提供了具有提交、回滚和崩溃恢复能力的事物安全(ACID兼容)存储引擎。InnoDB锁定在行级并且也在SELECT语句中提供一个类似Oracle的非锁定读。这些功能增加了多用户部署和性能。在SQL查询中,可以自由地将InnoDB类型的表和其他MySQL的表类型混合起来,甚至在同一个查询中也可以混合
2、InnoDB是为处理巨大数据量的最大性能设计。它的CPU效率可能是任何其他基于磁盘的关系型数据库引擎锁不能匹敌的
3、InnoDB存储引擎完全与MySQL服务器整合,InnoDB存储引擎为在主内存中缓存数据和索引而维持它自己的缓冲池。InnoDB将它的表和索引在一个逻辑表空间中,表空间可以包含数个文件(或原始磁盘文件)。这与MyISAM表不同,比如在MyISAM表中每个表被存放在分离的文件中。InnoDB表可以是任何尺寸,即使在文件尺寸被限制为2GB的操作系统上
4、InnoDB支持外键完整性约束,存储表中的数据时,每张表的存储都按主键顺序存放,如果没有显示在表定义时指定主键,InnoDB会为每一行生成一个6字节的ROWID,并以此作为主键
5、InnoDB被用在众多需要高性能的大型数据库站点上
InnoDB不创建目录,使用InnoDB时,MySQL将在MySQL数据目录下创建一个名为ibdata1的10MB大小的自动扩展数据文件,以及两个名为ib_logfile0和ib_logfile1的5MB大小的日志文件
5.2 MyISAM存储引擎(更注重写,支持事务)
MyISAM基于ISAM存储引擎,并对其进行扩展。它是在Web、数据仓储和其他应用环境下最常使用的存储引擎之一。MyISAM拥有较高的插入、查询速度,但不支持事物。MyISAM主要特性有:
1、大文件(达到63位文件长度)在支持大文件的文件系统和操作系统上被支持
2、当把删除和更新及插入操作混合使用的时候,动态尺寸的行产生更少碎片。这要通过合并相邻被删除的块,以及若下一个块被删除,就扩展到下一块自动完成
3、每个MyISAM表最大索引数是64,这可以通过重新编译来改变。每个索引最大的列数是16
4、最大的键长度是1000字节,这也可以通过编译来改变,对于键长度超过250字节的情况,一个超过1024字节的键将被用上
5、BLOB和TEXT列可以被索引
6、NULL被允许在索引的列中,这个值占每个键的0~1个字节
7、所有数字键值以高字节优先被存储以允许一个更高的索引压缩
8、每个MyISAM类型的表都有一个AUTO_INCREMENT的内部列,当INSERT和UPDATE操作的时候该列被更新,同时AUTO_INCREMENT列将被刷新。所以说,MyISAM类型表的AUTO_INCREMENT列更新比InnoDB类型的AUTO_INCREMENT更快
9、可以把数据文件和索引文件放在不同目录
10、每个字符列可以有不同的字符集
11、有VARCHAR的表可以固定或动态记录长度
12、VARCHAR和CHAR列可以多达64KB
使用MyISAM引擎创建数据库,将产生3个文件。文件的名字以表名字开始,扩展名之处文件类型:frm文件存储表定义、数据文件的扩展名为.MYD(MYData)、索引文件的扩展名时.MYI(MYIndex)