mysql高级-13-其他数据库日志

  • Post author:
  • Post category:mysql




前言

在数据库调优策略时讲到了慢查询日志,在数据库事务时讲到了 undo 和 redo 日志,这只是MySQL日志中的一部分,MySQL日志不仅能帮我们发现错误(如宕机),在数据复制、数据恢复、操作审计,以及确保数据的永久性和一致性等方面,都有着不可替代的作用。本篇将详细学习MySQL中的日志。文章课程链接:

MySQL数据库教程天花板,mysql安装到…



1、MySQL支持的日志

MySQL8.0 官网日志地址:

链接



1.1 日志类型

MySQL有不同类型的日志文件,用来存储不同类型的日志,分为 二进制日志、 错误日志、通用查询日志 和 慢查询日志,这也是常用的4种。MySQL 8又新增两种支持的日志:中继日志和 数据定义语句日志。使用这些日志文件,可以查看MySQL内部发生的事情。

这6类日志分别为:

  • 慢查询日志:记录所有执行时间超过long_query_time的所有查询,方便我们对查询进行优化
  • 通用查询日志:记录所有连接的起始时间和终止时间,以及连接发送给数据库服务器的所有指令,对我们复原操作的实际场景、发现问题,甚至是对数据库操作的审计都有很大的帮助
  • 错误日志:记录MySQL服务的启动、运行或停止时出现的问题,方便我们了解服务器的状态,从而对服务器进行维护。
  • 二进制日志:记录所有更改数据的语句,可以用于主从服务器之间的数据同步,以及服务器遇到故障时数据的无损失恢复。
  • 中继日志:用于主从服务器架构中,从服务器用来存放主服务器二进制日志内容的一个中间文件。从服务器通过读取中继日志的内容,来同步主服务器上的操作。
  • 数据定义语句日志: 记录数据定义语句执行的元数据操作

    除二进制日志外,其他日志都是 文本文件(可以通过vi、vim查看)。默认情况下,所有日志创建于 MySQL数据目录 中。



1.2 日志的弊端

  • 日志功能会 降低MySQL数据库的性能。例如,在查询非常频繁的MySQL数据库系统中,如果开启了通用查询日志和慢查询日志,MySQL数据库会花费很多时间记录日志。
  • 日志会 占用大量的磁盘空间。对于用户量非常大、操作非常频繁的数据库,日志文件需要的存储空间设置比数据库文件需要的存储空间还要大。



2、慢查询日志(slow query log)

在前面的性能分析工具中有讲到:

mysql高级-6-性能分析工具的使用



3、通用查询日志(general query log)

通用查询日志用来

记录用户的所有操作

,包括启动和关闭MySQL服务、所有用户的连接开始时间和截止时间、发给 MySQL 数据库服务器的所有 SQL 指令等。当我们的数据发生异常时,查看通用查询日志,还原操作时的具体场景,可以帮助我们准确定位问题。



3.1 查看当前状态

SHOW VARIABLES LIKE '%general%'

返回结果:

  • general_log:OFF 默认关闭,开启会消耗系统资源占用磁盘空间
  • general_log_file:/var/lib/mysql/xxx.log 通用查询日志的名称



3.2 启动日志

启动方式和前面讲到的很多配置是一样的,分为永久和临时

永久方式:通过修改 my.cnf 或 my.ini 配置文件来设置,然后重启MySQL服务,配置如下

genera1_log=ON
general_log_file=[path[filename]] #日志文件所在目录路径,filename为日志文件名,
#如果不指定,默认存储在MySQL数据目录中的 hostname(主机名).log 文件中

临时方式:

SET GLOBAL general_log=on; # 开启通用查询日志,关闭为 off
SET GLOBAL general_log_file='path/filename';# 设置日志文件保存位置

开启后,所有操作都会记录到设置的日志文件中,可以使用 vim、tail 等命令查看



3.3 删除\刷新日志

通用日志会记录所有操作,因此,日志文件在短时间内可能就很大,为此,我们要对其进行处理,可以选择先将旧的备份存储到其他服务器上,然后刷新,让日志在重新生成,如:

mv mysql.general.log mysql.general.log.old # 将旧的日志改名备份
mysqladmin -uroot -p flush-logs # 刷新重新生成日志



4、错误日志(error log)

错误日志记录了 MySQL 服务器启动、停止运行的时间,以及系统启动、运行和停止过程中的诊断信息,包括

错误、警告



提示

等。

错误日志是通过错误日志可以查看系统的运行状态,便于即时发现故障、修复故障。如果MySQL服务 出现异常,发现问题、解决故障的 首选。



4.1 启动日志

在MySQL数据库中,错误日志功能是

默认开启

的。而且,错误日志

无法被禁止

。默认情况下,错误日志存储在MySQL数据库的数据文件夹下,名称默认为 mysqld.log (Linux系统)或hostname.err (mac系统)。如果需要制定文件名,则需要在 my.cnf 或者 my.ini 中做如下配置:

log-error=[path/[filename]] #path为日志文件所在的目录路径,filename为日志文件名

修改配置项后,需要重启MySQL服务以生效



4.2 查看日志

MySQL错误日志是以文本文件形式存储的,可以使用文本编辑器直接查看。查询错误日志的存储路径

SHOW VARIABLES LIKE %log_err%;

可以看到,错误日志文件中记录了服务器启动的时间,以及存储引擎 InnoDB 启动和停止的时间等。我们在做初始化时候生成的数据库初始密码也是记录在error.log中。



4.3 删除\刷新日志

和通用日志一样,尽管错误日志会少很多,但久而久之,还是会占用一定的磁盘空间。对于很久以前的日志,对我们来讲是没有意义的,我们可以对其进行清理

可以选择删除或备份,使用 rm 或者 mv,处理过后,我们重建日志

mysqladmin -u root -p flush-logs # 可能会报错,通过MySQL官网查询,还需先执行以下命令,详细原因可观看原视频
install -omysql -gmysql -m0644 /dev/null /var/log/mysqld.log



4.4 MySQL8.0新特性

MySQL8.0里对错误日志的改进。MySQL8.0的错误日志可以理解为一个全新的日志,在这个版本里,接受了来自社区的广泛批评意见,在这些意见和建议的基础上生成了新的日志

下面这些是来自社区的意见:

  • 默认情况下内容过于冗长
  • 遗漏了有用的信息
  • 难以过滤某些信息
  • 没有标识错误信息的子系统源
  • 没有错误代码,解析消息需要识别错误
  • 引导消息可能会丢失

    。固定格式

    针对这些意见,MySQL做了如下改变
  • 采用组件架构,通过不同的组件执行日志的写入和过滤功能
  • 写入错误日志的全部信息都具有唯一的错误代码从10000开始
  • 增加了一个新的消息分类《system》用于在错误日志中始终可见的非错误但服务器状态更改事件的消息。增加了额外的附加信息,例如关机时的版本信息,谁发起的关机等等
  • 两种过滤方式,Internal和Dragnet
  • 三种写入形式:经典、JSON和syseventlog



5、二进制日志(bin log)

binlog可以说是MySQL中比较

重要

的日志了,在日常开发及运维过程中,经常会遇到。

binlog即binary log,二进制日志文件,也叫作变更日志 (update log) 。它记录了数据库所有执行的 DDL和DML等数据库更新事件的语句,但是

不包含

没有修改任何数据的语句 (如数据查询语句select、 show等)。

它以 事件形式 记录并保存在 二进制文件 中。通过这些信息,我们可以再现数据更新操作的全过程。

binlog主要应用场景:

  • 一是用于 数据恢复,如果MySQL数据库意外停止,可以通过二进制日志文件来查看用户执行了哪些操作,对数据库服务器文件做了哪些修改,然后根据二进制日志文件中的记录来恢复数据库服务器。
  • 二是用于 数据复制,由于日志的延续性和时效性,master把它的二进制日志传递给slaves来达到master-slave数据一致的目的。

可以说MySQL数据库的数据备份、主备、主主、主从都离不开binlog,需要依靠binlog来同步数据,保证数据一致性。



5.1 查看默认情况

show variables like  %log_bin%'; # 默认是开启的
# 可以cd到存储路径下查看 binlog

还包含以下信息:

log_bin_basename:是binlog日志的基本文件名,后面会追加标识来表示每一个文件

log_bin_index:是binlog文件的索引文件,这个文件管理了所有的binlog文件的目录

log_bin_trust_function_creatbrs:限制存储过程,前面我们已经讲过了,这是因为二进制日志的一个重要功能是用于主从复制,而存储函数有可能导致主从的数据不一致(如:时间函数 now())。所以当开启二进制日志后,需要限制存储函数的创建、修改、调用

log_bin_use_v1_row_events:此只读系统变量已弃用。ON表示使用版本1二进制日志行,OFF表示使用版本2进制日志行



5.2 日志参数设置

log-bin=xxx-bin # 修改基础名称,也可以是/home/mysql/xxx/xxx-bin,修改后生成的文件为 /xxx-bin000001.log ...
binlog_expire_logs_seconds=600 # 日志保留时长,单位 秒
max_binlog_size=100M # 单个二进制日志大小,超过进行切换(完成当前事务后,如果超过,就切换,并不是一超过就切换),最大和默认值都是 1GB

注意:新建的文件夹需要使用mysql用户,使用下面的命令即可。

chown -R -v mysql:mysql binlog;


提示:

数据库文件最好不要与日志文件放在同一个磁盘上!这样,当数据库文件所在的磁盘发生故障时,可以使用日志文件恢复数据,如果binlog也丢失了,数据无法恢复。



5.3 查看日志

MySQL服务 重新启动一次,以“.000001”为后缀的文件就会增加一个,并且后缀名按1递增。即日志文件的个数与MySQL服务启动的次数相同;如果日志长度超过了 max_binlog_size 的上限(默认是1GB),就会创建一个新的日志文件。

查看当前的二进制日志文件列表及大小。指令如下:

SHOW BINARY LOGS;

binlog是二进制文件,无法直接查看,想要更直观的展示,就得借助mysqlbinlog 命令工具了。

指令如下:

mysqlbinlog 'binlog文件名';
# 补充参数
# -v 以SQL形式展示
# --base64-output=DECODE-ROWS 过滤 binlog 形式的语句

上述方法读出的binlog日志内容较多,不容易分辨查看pos点(记事位:一个一个的增删改事件)信息,可以使用该命令查看:

show binlog events [IN 'log_name'] [FROM pos] [LIMIT [offset,] row_count];
  • IN ‘log_name’:指定要查询的binlog文件名(不指定就是第一个binlog文件)
  • FROM pos: 指定从哪个pos起始点开始查起(不指定就是从整个文件首个pos点开始算)
  • LIMIT [offset]:偏移量(不指定就是0)
  • row_count:查询总条数(不指定就是所有行)

上面我们讲了这么多都是基于binlog的默认格式,binlog格式查看

show variables like 'binlog_format';

除此之外,binlog还有2种格式,分别是Statement和Mixed

  • Statement

    每一条会修改数据的sql都会记录在binlog中。

    优点:不需要记录每一行的变化,减少了binlog日志量,节约了10,提高性能。
  • Row

    5.1.5版本的MySQL才开始支持row level 的复制,它不记录sql语句上下文相关信息,仅保存哪条记录被修改。优点: rowlevel 的日志内容会非常清楚的记下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题。
  • Mixed

    从5.1.8版本开始,MySQL提供了Mixed格式,实际上就是Statement与Row的结合



5.4 使用日志恢复数据

如果MySQL服务器启用了二进制日志,在数据库出现意外丢失数据时,可以使用MySQLbinlog工具从指定的时间点开始(例如,最后一次备份)直到现在或另一个指定的时间点的日志中恢复数据。

mysqlbinlog恢复数据的语法如下:

mysqlbinlog[option] filename | mysql -uuser -ppass;

使用mysqlbinlog命令来读取filename中的内容,然后使用mysql命令将这些数据恢复到数据库中,其中:filename是日志文件名,option为可选参数,比较重要的两对option参数是–start-date、 –stop-date 和–start-position、–stop-position,可以选择按时间节点恢复,也可以按位置恢复

–start-date 和 –stop-date:可以指定恢复数据库的起始时间点和结束时间点

–start-position和–stop-position:可以指定恢复数据的开始位置和结束位置(记事位)

**注意:**使用mysqlbinlog命令进行恢复操作时,必须是编号小的先恢复,例如atguigu-bin.000001必须在atguigu-bin.000002之前恢复,恢复数据是,可以使用命令 flush logs 重新生成一个 binlog,这个binlog记录的就是我们恢复的情况(恢复就是反向的增删改)

如按位置恢复:

/usr/bin/mysqlbinlog --start-position=464 --stop-position=1308 --database=xx1 /var/lib/mysql/binlog/xxx.008005 | /usr/bin/mysgl -uroot -pabc123 -v xx1

时间恢复也是一样,对于确认恢复数据的位置和时间,可以查阅相关文档,查看分析过程



5.5 删除二进制日志

MySQL的二进制文件可以配置自动删除,同时MySQL也提供了安全的手动删除二进制文件的方法。PURGE MASTER LOGS 只删除指定部分的二进制日志文件,RESET MASTER 删除所有的二进制日志文件。

  1. PURGE MASTER LOGS: 删除指定日志文件

    语法如下:

PURGE {MASTER | BINARY} LOGS TO ‘指定日志文件名’

PURGE {MASTER | BINARY} LOGS BEFORE ‘指定日期’

例子:删除创建时间比binlog.000005早的所有日志,在执行前,可以进行 flush logs,开启一个新的日志

SHOW BINARY LOGS;

PURGE MASTER LOGS TO “binlog.000005”;

显示二进制日志文件列表

SHOW BINARY OGS;

删除2020年10月25号前创建的所有日志文件

PURGE MASTER LOGS before ‘20220105’;

  1. RESET MASTER:删除所有二进制文件

    使用 RESET MASTER 语句,清空所有的binlog日志。MySQL会重新创建二进制文件,新的日志文件扩展名将重新从000001开始编号。慎用!

    删除所有日志:

RESET MASTER;

执行完该语句后,原来的所有二进制日志已经全部被删除



5.6 其它场景

二进制日志可以通过数据库的 全量备份 和二进制日志中保存的 增量信息,完成数据库的 无损失恢复。但是,如果遇到数据量大、数据库和数据表很多(比如分库分表的应用)的场景,用二进制日志进行数据恢复,是很有挑战性的,因为起止位置不容易管理。

在这种情况下,一个有效的解决办法是配置主从数据库服务器,甚至是 一主多从 的架构,把二进制日志文件的内容通过中继日志,同步到从数据库服务器中,这样就可以有效避免数据库故障导致的数据异常等问题。



5.7 写入机制

binlog 的写入机制和 redo log 的机制大致相同,事务执行过程中,先把日志写到 binlog cache,事务提交的时候,再把 binlog cache 写到 binlog 文件中。因为一个事务的binlog不能被拆开,无论这个事务多大,也要确保一次性写入,所以系统会给每个线程分配一个块内存作为binlog cache。

我们可以通过 binlog_cache_size 参数控制单个线程 binlog cache 大小,如果存储内容超过了这个参数,就要暂存到磁盘 (Swap)。流程如下

在这里插入图片描述

图中 write 和 fsync 的时机,可以由参数 sync_binlog 控制,默认是0。为0的时候,表示每次提交事务都只write,由操作系统决定什么时候执行 fsync。虽然性能得到提升,但如果机器宕机(mysql宕机不影响,已经交给操作系统的 page cache了),page cache里面的 binglog 会丢失(还未落盘)

因此,我们可以选择设置 sync_binlog 的值为 1,表示每次提交事务都会执行fsync,就如同redo log 刷盘流程一样。

最后还有一种折中方式,可以设置为N(N>1),表示每次提交事务都write,但累积N个事务后才fsync。



5.8 binlog与redolog对比

  • redo log 是物理日志,记录内容是“在某个数据页上做了什么修改”,属于 InnoDB 存储引擎层产生的。
  • 而 binlog 是 逻辑日志,记录内容是语句的原始逻辑,类似于“给ID=2 这一行的c字段加1”,属于MySQL Server 层

    虽然它们都属于持久化的保证,但是则重点不同

redo log让InnoDB存储引警拥有了崩溃恢复能力。

binlog 保证了MySQL集群架构的数据一致性



5.9 两阶段提交

在执行更新语句过程,会记录redo log与binlog两块日志,以基本的事务为单位,redo log在事务执行过程中可以不断写入,而binlog只有在提交事务时才写入,所以redo log与binlog的 写入时机不一样。


问:redo log与binlog两份日志之间的逻辑不一致,会出现什么问题?


以update语句为例,假设 id=2 的记录,字段c 值是0,把字段值更新成1,SQL语句为update T set c=1 where id=2。


假设执行过程中写完redo log日志后,binlog日志写期间发生了异常,会出现什么情况呢?

由于binlog没写完就异常,这时候binlog里面没有对应的修改记录。因此,之后用binlog日志恢复数据时(从机),就会少这一次更新,恢复出来的这一行c值是0,而原库(主)因为redo log日志恢复,这一行值是1,最终数据不一致。

为了解决这个问题,InnoDB 存储引擎使用 两阶段提交 方案,就是将 redo log 的写入拆成两个步骤,prepare 和 commit,如图

在这里插入图片描述

这样,当 binlog 发生异常时,也不影响。MySQL根据redo log日志恢复数据时,发现redolog还处于prepare阶段,并且没有对应binlog日志,就会回滚该事务。

另一个问题是,如果 redo log 设置 commit 阶段发生异常,那会不会回滚事务呢

答案是不会,虽然redo log是处于prepare阶段,但是能通过事务id找到对应的binlog日志,所以MySQL认为是完整的,就会提交事务恢复数据。



6、中继日志(relay log)



6.1 介绍

**中继日志只在主从服务器架构的从服务器上存在。**从服务器为了与主服务器保持一致,要从主服务器读取二进制日志的内容,并且把读取到的信息写入 本地的日志文件 中,这个从服务器本地的日志文件就叫 中继日志。然后从服务器读取中继日志,并根据中继日志的内容对从服务器的数据进行更新,完成主从服务器的 数据同步。

搭建好主从服务器之后,中继日志默认会保存在从服务器的数据目录下,文件名的格式是:从服务器名 -relay-bin.序号。中继日志还有一个索引文件: 从服务器名 -relay-bin.index,用来定位当前正在使用的中继日志。


简单理解

:先从主服务器复制一份 binlog 过来,然后在读取内容生成数据。这样看来中继日志就是 binlog 日志,只是意义(名称)不一样,因此,我们查看中继日志的方式也和 binlog 一样。



6.2 恢复的典型错误

如果从服务器宕机,有的时候为了系统恢复,要重装操作系统,这样就可能会导致你的 服务器名称 与之前 不同。而中继日志里是 包含从服务器名 的。在这种情况下,就可能导致你恢复从服务器的时候,无法从宕机前的中继日志里读取数据,以为是日志文件损坏了,其实是名称不对了。

解决的方法也很简单,把从服务器的名称改回之前的名称。



end…

如果总结的还行,就点个赞呗 @_@ 如有错误,欢迎指正!



版权声明:本文为weixin_44227063原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。