2-MySQL数据库基础

一、数据与数据管理的历史

1、数据、数据库、数据库系统和数据库管理系统

为了了解世界，交流信息，人们需要描述事物。在计算机中，为了存储和处理这些事物，就要抽出对这些事物感兴趣的特征并组成一个记录来描述。例如：在学生的档案中，如果人们最感兴趣的是学生的姓名、性别、年龄、出生年月、籍贯、所在系、入学时间，就可以这样描述：（王兵，男， 1987，北京，计算机系， 2006）。这里的学生记录就是数据。

有了数据之后，就需要把数据存储起来，方便查询使用等，把这种存储数据的“ 仓库” 称之为数据库（ Database， DB）。数据库管理系统（ Database Management System， DBMS）是用于创建、管理和维护数据库时所使用的软件，介于用户和操作系统之间，可对数据库进行管理。

数据库系统包括 3 个主要的组成部分。

⑴ 数据库：用于存储数据的存储空间。

⑵ 数据库管理系统：用于管理数据库的软件。

⑶ 数据库应用程序：为了提高数据库系统的处理能力所使用的管理数据库的软件补充。

2、数据管理的历史

（1）简单应用 (20 世纪 50 年代以前)

这个阶段最基本的特征是无数据管理及完全分散的手工方式。

（2）文件系统 (20 世纪 50 年代后期到 60 年代中期)

这个阶段的基本特征是有了面向应用的数据管理功能，工作方式是分散的非手工的。

（3）数据库系统 (20 世纪 60 年代后期开始)

20 世纪 60 年代后期，计算机在管理中的应用更加广泛，数据量急剧增大，对数据共享的要求越来越迫切；同时，大容量磁盘已经出现，联机实时处理业务增多；软件费用占系统总费用的比例日益上升，硬件价格大幅下降，编制和维护应用软件所需成本相对增加。在这种情况下，为了解决多用户、多应用共享数据的需求，使数据为尽可能多地为应用程序服务，出现了数据库系统。

3、MySQL 的起源与版本

MySQL 是一个小型关系型数据库管理系统，开发者为瑞典 MySQL AB 公司，在 2008 年 1 月 16 号被 Sun 公司收购。 MySQL 被广泛地应用在 Internet 上的中小型网站中。

MySQL有如下几个版本：

⑴ MySQL Community Server，社区版本，开源免费，但不提供官方技术支持。

⑵ MySQL Enterprise Edition，企业版本，需付费，可以试用 30 天。

⑶ MySQL Cluster，集群版，开源免费，可将几个 MySQL Server 封装成一个 Server。

⑷ MySQL Cluster CGE，高级集群版，需付费。

⑸ MySQL Workbench（ GUI TOOL），一款专为 MySQL 设计的 ER/ 数据库建模工具。它是著名的数据库设计工具 DBDesigner4 的继任者。 MySQL Workbench 又分为两个版本，分别是社区版（ MySQL Workbench OSS）、商用版（ MySQL Workbench SE）。

MySQL Community Server 是开源免费的，这也是我们通常用的 MySQL 的版本。

4、MySQL 与 Oracle

数据库软件有很多种，常见的数据库有甲骨文公司（ Oracle 公司）的 Oracle、 IBM 公司的 DB2、微软公司的Access 与 SQL Server 以及 MySQL。

MySQL 是最受欢迎的开源 SQL 数据库管理系统，它由 MySQL AB 开发、发布和支持。 MySQL AB 是一家基于 MySQL 开发人员的商业公司，它是一家使用了一种成功的商业模式来结合开源价值和方法论的第二代开源公司。 MySQL 是 MySQL AB 的注册商标。

MySQL 是一个快速、多线程、多用户、健壮的 SQL 数据库服务器。 MySQL 服务器支持关键任务、重负载生产系统的使用，也可以将它嵌入到一个大配置( Mass- Deployed) 的软件中去。

与其他数据库管理系统相比， MySQL 具有以下优势。

(1) MySQL 是一个关系数据库管理系统。

(2) MySQL 是开源的。

(3) MySQL 服务器是一个快速、可靠和易于使用的数据库服务器。

(4) MySQL 服务器工作在客户/ 服务器或嵌入系统中。

(5) 有大量的 MySQL 软件可以使用。

Oracle 公司（甲骨文公司）是规模较大的企业软件公司，向遍及 145 个国家的用户提供数据库、工具和应用软件以及相关的咨询、培训和支持服务。在 2008 年， Oracle 公司是继 Microsoft 及 IBM 后，全球收入排名第三的软件公司。但在 2013 年年底， Oracle 公司击败 IBM, 成为全球收入排名第二的软件公司。

Oracle 数据库产品具有以下优良特性。

Oracle 数据库之所以取得如此的成就，与它具有的很多优点是分不开的。

(1) 兼容性。 Oracle 产品采用标准 SQL，并经过美国国家标准技术所( NIST) 测试。与 IBM SQL/ DS、 DB2、 INGRES、 IDMS/ R 等兼容。

(2) 可移植性。 Oracle 的产品可运行于很宽范围的硬件与操作系统平台上。可以安装在 70 种以上不同的大、中、小型机上；可在 VMS、 DOS、 UNIX、 Windows 等多种操作系统下工作。

(3) 可连接性。 Oracle 能与多种通信网络相连，支持各种协议( TCP/ IP、 DECnet、 LU6. 2 等)。

(4) 高生产率。

Oracle 产品提供了多种开发工具，能极大地方便用户进行进一步的开发。

(5) 开放性。

Oracle 良好的兼容性、可移植性、可连接性和高生产率使 Oracle RDBMS 具有良好的开放性。

二、关系型数据模型

1、关系型数据模型的结构

建立数据库系统离不开数据模型。一种是独立于计算机系统的数据模型。其典型代表就是著名的“ 实体- 关系模型”。另一种数据模型是直接面向数据库的逻辑结构。目前理论成熟、使用普及的模型就是关系模型。关系模型是由若干个关系模式组成的集合，关系模式的实例称为关系，每个关系实际上是一张二维表格。关系模型用键导航数据。SQL 语言是关系数据库的代表性语言，已经得到了广泛的应用。典型的关系数据库产品有 DB2、 Oracle、 Sybase、 SQL Server 等。

关系模型有 3 个组成部分：数据结构、数据操作和完整性规则。关系模型建立在严格的数学概念的基础上，它用二维表来描述实体与实体间的联系。下面介绍关系模型中的一些术语。

⑴ 关系（ Relation）：对应通常所说的一张表。

⑵ 元组（ Tuple）：表中的一行即为一个元组，可以用来标识实体集中的一个实体，表中任意两行（元组）不能相同；

⑶ 属性（ Attribute）：表中的一列即为一个属性，给每个属性起一个名称即属性名，表中的属性名不能相同。

⑷ 主键（ Key）：表中的某个属性组，它可以唯一确定一个元组。

⑸ 域（ Domain）：列的取值范围称为域，同列具有相同的域，不同的列也可以有相同的域。

⑹ 分量：元组中的一个属性值。

⑺ 关系模式：对关系的描述。可表示为：关系名（属性 1，属性 2，…，属性 n）。

关系是一种规范化的二维表格，具有如下性质。

⑴ 属性值具有原子性，不可分解。

⑵ 没有重复的元组。

⑶ 理论上没有行序，但是使用时有时可以有行序。在关系数据库中，关键码（简称键）是关系模型的一个重要概念，是用来标识行（元组）的一个或几个列（属性）。如果键是唯一的属性，则称为唯一键；反之由多个属性组成，则称为复合键。

键的主要类型如下。

⑴ 超键：在一个关系中，能唯一标识元组的属性或属性集称为关系的超键。

⑵ 候选键：如果一个属性集能唯一标识元组，且又不含有多余的属性，那么这个属性集称为关系的候选键。

⑶ 主键：如果一个关系中有多个候选键，则选择其中的一个键为关系的主键。用主键可以实现关系定义中“ 表中任意两行（元组）不能相同” 的约束。

⑷ 外键：如果一个关系 R 中包含另一个关系 S 的主键所对应的属性组 F，则称此属性组 F 为关系 R 的外键，并称关系S 为参照关系，关系 R 是依赖关系。为了表示关联，可以将一个关系的主键作为属性放入另外一个关系中，第二个关系中的那些属性就称为外键。

2、关系型数据模型的操作与完整性

关系数据库的数据操作语言（ Data Manipulation Language， DML）的语句分为查询语句和更新语句两大类。查询语句用于描述用户的各类检索要求；更新语句用于描述用户的插入、修改和删除等操作。

关系数据操作语言建立在关系代数基础上，具有以下特点。

⑴ 以关系为单位进行数据操作，操作的结果也是关系。

⑵ 非过程性强。很多操作只需指出做什么，而无需步步引导怎么去做。

⑶ 以关系代数为基础，借助于传统的集合运算和专门的关系运算，使关系数据语言具有很强的数据操作能力。

下面介绍在数据操作语言中对数据库进行查询和更新等操作的语句。

● SELECT 语句：按指定的条件在一个数据库中查询的结果，返回的结果被看作记录的集合。

● SELECT… INTO 语句：用于创建一个查询表。

● INSERT INTO 语句：用于向一个表添加一个或多个记录。

● UPDATE 语句：用于创建一个更新查询，根据指定的条件更改指定表中的字段值。该语句不生成结果集，而且当使用更新查询更新记录之后，不能取消这次操作。

● DELETE 语句：用于创建一个删除查询，可从列在 FROM 子句之中的一个或多个表中删除记录，且该子句满足WHERE 子句中的条件，可以使用 DELETE 删除多个记录。

● INNER JOIN 操作：用于组合两个表中的记录，只要在公共字段之中有相符的值。可以在任何 FROM 子句中使用 INNER JOIN 运算，这是最普通的连接类型。只要在这两个表的公共字段之中有相符的值，内部连接将组合两个表中的记录。

● LEFT JOIN 操作：用于在任何 FROM 子句中组合来源表的记录。使用 LEFT JOIN 运算来创建一个左边外部连接。左边外部连接将包含从第一个（左边）开始的两个表中的全部记录，即使在第二个（右边）表中并没有相符值的记录。

● RIGHT JOIN 操作：用于在任何 FROM 子句中组合来源表的记录。使用 RIGHT JOIN 运算创建一个右边外部连接。右边外部连接将包含从第二个（右边）表开始的两个表中的全部记录，即使在第一个（左边）表中并没有匹配值的记录。

● PARAMETERS 声明：用于声明在参数查询中的每一个参数的名称及数据类型。该声明是可选的，但是当使用时，须置于任何其他语句之前，包括 SELECT 语句。

● UNION 操作：用于创建一个联合查询，它组合了两个或更多的独立查询或表的结果。所有在一个联合运算中的查询，都须请求相同数目的字段，但是字段不必大小相同或数据类型相同。

关系模型的完整性规则是对数据的约束。关系模型提供了 3 类完整性规则：实体完整性规则、参照完整性规则和用户定义的完整性规则。其中实体完整性规则和参照完整性规则是关系模型必须满足的完整性的约束条件，称为关系完整性规则。

● 实体完整性：指关系的主属性( 主键的组成部分) 不能是 NULL。 NULL 就是指不知道或是不能使用的值，它与数值 0 和空字符串的意义都不一样。

● 参照完整性：如果关系的外键 R1 与关系 R2 中的主键相符，那么外键的每个值必须在关系 R2 中主键的值中找到或者是空值。

● 用户定义完整性：是针对某一具体的实际数据库的约束条件。它由应用环境所决定，反映某一具体应用所涉及的数据必须满足的要求。关系模型提供定义和检验这类完整性的机制，以便用统一、系统的方法处理，而不必由应用程序承担这一功能。

3、关系型数据模型的存储结构

一张二维表就是一个关系，它由表名、行和列组成。表的每一行代表一个元组，每一列称为一个属性。

三、关系型数据模型中的数据依赖与范式

在关系数据库中的每个关系都需要进行规范化，使之达到一定的规范化程度。

1. 第一范式

第一范式是第二范式和第三范式的基础，是最基本的范式。第一范式包括下列指导原则。

⑴ 数据组的每个属性只可以包含一个值。

⑵ 关系中的每个数组必须包含相同数量的值。

⑶ 关系中的每个数组一定不能相同。

2. 第二范式

第二范式（ 2NF）规定关系必须在第一范式中，并且关系中的所有属性依赖于整个候选键。候选键是一个或多个唯一标识每个数据组的属性集合。

3.第三范式

第三范式（ 3NF）同 2NF 一样依赖于关系的候选键。为了遵循 3NF 的指导原则，关系必须在 2NF 中，非键属性相互之间必须无关，并且必须依赖于键。

四、常见的关系型数据库管理系统

常见的关系型数据库管理系统产品有 Oracle、 SQL Server、 Sybase、 DB2、 Access 等。

1. Oracle

2.SQL Server

3.Sybase

4.DB2

5.Access

五、MySQL数据库系统的体系结构

了解 MySQL 必须牢牢记住其体系结构图， MySQL 是由 SQL 接口、解析器、优化器、缓存、存储引擎组成的，如下图所示。

⑴ 支持接口：是指不同语言中与 SQL 的交互。

⑵ 管理服务和工具：系统管理和控制工具。

⑶ 连接池：管理缓冲用户连接、线程处理等需要缓存的需求。

⑷ SQL 接口：接受用户的 SQL 命令，并且返回用户需要查询的结果，如 select from 就是调用 SQL Interface。

⑸ 解析器： SQL 命令传递到解析器的时候会被解析器验证和解析，解析器是由 Lex 和 YACC 实现的，是一个很长的脚本，其主要功能如下。 ① 将 SQL 语句分解成数据结构，并将这个结构传递到后续步骤，以后 SQL 语句的传递和处理就是基于这个结构的。 ② 如果在分解构成中遇到错误，那么就说明这个 SQL 语句是不合理的。

⑹ 查询优化器： SQL 语句在查询之前会使用查询优化器对查询进行优化。它使用“ 选取 → 投影 → 连接” 策略进行查询。用一个例子就可以理解： select uid, name from user where gender = 1; 这个 select 查询先根据 where 语句进行选取，而不是先将表全部查询出来以后再进行 gender 过滤。

这个 select 查询先根据 uid 和 name 进行属性投影，而不是将属性全部取出以后再进行过滤。将这两个查询条件连接起来生成最终查询结果。

⑺ 缓存和缓冲池：查询缓存。如果查询缓存有命中的查询结果，查询语句就可以直接去查询缓存中取数据。这个缓存机制是由一系列小缓存组成的。比如表缓存、记录缓存、 Key 缓存、权限缓存等。

⑻ 存储引擎：存储引擎是 MySQL 中具体的与文件打交道的子系统。也是 MySQL 最具有特色的一个地方。从 MySQL 5. 5 之后， InnoDB 就是 MySQL 的默认事务引擎。

六、MySQL存储引擎

存储引擎是 MySQL 中一个重要的组成部分。 MySQL 提供了多个不同的存储引擎，包括处理事务安全表的引擎和处理非事务安全表的引擎。在 MySQL 中，不需要在整个服务器中使用同一种引擎，应该针对具体的要求，对每一个表使用不同的存储引擎。

MySQL 5. 6 支持的存储引擎有 InnoDB、 MyISAM、 Memory、 Merge、 Archive、 Federated、 CSV、 BLACKHOLE 等。其中 InnoDB 是支持事务型的存储引擎，从 MySQL 5. 5 之后， InnoDB 就是 MySQL 的默认事务引擎。 InnoDB 支持事务安全表（ ACID）, 也支持行锁定和外键。 InnoDB 为 MySQL 提供了具有事务( transaction)、回滚( rollback) 和崩溃修复能力( crash recovery capabilities)、多版本并发控制( multi- versioned concurrency control) 的事务安全( transaction- safe (ACID compliant)) 型表。

原文链接：https://blog.csdn.net/wangzhiwencsdn/article/details/100916892

你可能也喜欢