DM 源码阅读系列文章（五）Binlog replication 实现

reclay 发布于2019-06-25 19:16 / 3168人阅读

摘要：作者本文为源码阅读系列文章的第五篇。上篇文章介绍了和两个数据同步处理单元的设计实现，对核心实现数据导入并发模型数据导入暂停或中断的恢复进行了分析。根据库表路由规则对库表名进行转换，用于合库合表。遇到或者积累的数量超过配置的数量立即执行。

作者：lan

本文为 DM 源码阅读系列文章的第五篇。上篇文章介绍了 dump 和 load 两个数据同步处理单元的设计实现，对核心 interface 实现、数据导入并发模型、数据导入暂停或中断的恢复进行了分析。本篇文章将详细地介绍 DM 核心处理单元 Binlog replication，内容包含 binlog 读取、过滤、路由、转换，以及执行等逻辑。文内涉及到 shard merge 相关逻辑功能，如 column mapping、shard DDL 同步处理，会在 shard merge 篇多带带详细讲解，这里就不赘述了。

Binlog replication 处理流程

从上图可以大致了解到 Binlog replication 的逻辑处理流程，对应的逻辑入口代码。

从 relay log 或者 MySQL/MariaDB 读取 binlog events。

对 binlog events 进行处理转换（transformation），这里可以做三类操作：

操作	说明
Filter	根据库/表同步黑白名单对库/表进行过滤；根据 binlog event 类型过滤。
Routing	根据库/表路由规则对库/表名进行转换，用于合库合表。
Convert	将 binlog 转换为 job 对象，发送到 executor。

executor 对 job 进行冲突检测，然后根据固定规则分发给对应的 worker 执行。

定期保存 binlog position/gtid 到 checkpoint。

Binlog 读取

Binlog replication 支持两种方式读取 binlog events:

从远程的 MySQL/MariaDB

从 DM-worker 的本地 relay log

两种方式都提供了同样的读取方法，处理核心都是 go-mysql。该库主要提供了两个功能：

注册为 MySQL/MariaDB 的 slave server ，从 MySQL/MariaDB 顺序读取 raw binlog events。

解析 raw binlog events。

更多的处理细节会在下篇关于 relay log 的文章中进行介绍，迫不及待的小伙伴可以先翻阅一下相关代码实现。

Binlog 转换

处理程序拿到解析好的 binlog event 后，根据 binlog 的类型来对 binlog 进行分类处理。Binlog replication 主要关心以下类型的 binlog event ：

类型	说明
rotate event	消费完一个 binlog 文件，开始消费下一个 binlog 文件，用于更新 checkpoint 的 binlog position。
row event	包含 insert/update/delete DML 数据。
query event	包含 DDL 或者 statement DML 等数据。
xid event	代表一个 transaction 的 commit，经过 go-mysql 的处理后带有对应 transaction 结束位置的 binlog position 和 gtid ，可以用来保存 checkpoint。

Binlog replication 数据处理单元会对每一类 binlog event 进行以下的处理步骤，具体实现的处理顺序可能略有差异，以代码实现为准。

过滤

Binlog replication 会从两个维度对 binlog event 来进行过滤：

根据同步库/表黑白名单，过滤掉对应库/表的所有 binlog event。

根据 binlog event 过滤规则，过滤掉对应库/表指定的 binlog event。

row event 过滤处理和 query event 过滤处理的实现在逻辑上面存在一些差异：

row event 包含库名和表名信息；query event 需要通过 tidb parser 解析 event 里面包含的 query statement 来获取需要的库名，表名以及其他信息。

tidb parser 不是完全 100% 兼容 MySQL 语法，当遇到 parser 不支持的 query statement 时候，解析就会报错，从而无法获取到对应的库名和表名信息。Binlog replication 提供了一些内置的不支持的 query statement 正则表达式，配合使用 [schema-pattern: *, table-pattern: *] 的 binlog event 过滤规则，来跳过 parser 不支持的 query statement。

query event 里面也会包含 statement format binlog event，此时 Binlog replication 就可以利用 parser 解析出来具体的 statement 类型，对不支持的 statement format binlog event 作出相应的处理：对于需要同步的表，进行报错处理；不需要同步的表，忽略继续同步。

路由

binlog 过滤完成之后，对于需要同步的表就会根据过滤步骤获得的库名和表名，通过路由规则转换得到需要同步到的目标库名和表名，在接下来的转换步骤来使用目标库名和表名来转换出正确的 DML 和 DDL statement。

转换

row event 转换处理和 query event 转换处理的实现存在一些差异，这里分开来讲述。

row event 转换处理通过三个转换函数生成对应的 statements：

generate insert sqls ：将 write rows event 转换为 replace into statements。

generate update sqls：

safe mode = true，将 update rows event 转换为 delete + replace statements。

safe mode = false，将 update row event 转换为 update statements。

generate delete sqls：将 delete rows event 转换为 delete statements。

query event 转换处理：

因为 TiDB 目前不支持一条 DDL 语句包含多个 DDL 操作，query event 转换处理会首先尝试将 包含多个 DDL 变更操作的单条 DDL 语句 拆分成 只包含一个 DDL 操作的多条 DDL 语句（具体代码实现）。

使用 parser 将 DDL statement 对应的 ast 结构里面的库名和表名替换成对应的目标库名和表名（具体代码实现）。

通过转换处理之后，将不同的 binlog event 包装成不同的 job 发送到 executor 执行：

row event -> insert/update/delete job

query event -> ddl job

xid event -> xid job

Job 执行 冲突检测

binlog 顺序同步模型要求按照 binlog 顺序一个一个来同步 binlog event，这样的顺序同步势必不能满足高 QPS 低同步延迟的同步需求，并且不是所有的 binlog 涉及到的操作都存在冲突。Binlog replication 采用冲突检测机制，鉴别出来需要顺序执行的 jobs，在确保这些 jobs 的顺序执行的基础上，最大程度地保持其他 job 的并发执行来满足性能方面的要求。

冲突检测流程如下：

遇到 DDL job，等待前面已经分发出来的所有 DML jobs 执行完成后，然后多带带执行该 DDL job，执行完成之后保存 checkpoint 信息。

遇到 DML job，会先检测并且尝试解决冲突。如果检测到冲突（即存在两个 executor 的 worker 的 jobs 都需要与当前的 job 保持顺序执行），会发送一个 flush job 来等待已经分发的所有 DML jobs 执行完成，然后再将 job 分发到对应的 worker，并且记录该分发信息到内存。在没有冲突的情况下，如果不需要与已经分发出去的 job 保持顺序的话，发送 job 到任意 worker 上；如果需要保持顺序的话，那么根据内存储存的历史分发信息，发送 job 到对应的 worker 上。

冲突检测实现比较简单，根据转换步骤获得每条 statement 对应的 primary/unique key 信息，来进行交集检测，如果存在交集那么认定是需要顺序的执行两条 statement，请参考具体实现代码。

执行

job 分发到对应的 worker 后，worker 根据一定的规则来批量执行这些 job，如下：

遇到 DDL 立即执行。

遇到 flush 或者积累的 job 数量超过配置的 batch 数量立即执行。

没有新的 job 分发进来，清空当前已经积累的 jobs 或者 sleep 10 ms。

根据上面三个规则可以很快地将已经分发的 jobs 应用到下游 TiDB。

小结

本篇文章详细地介绍 DM 核心处理单元 Binlog replication，内容包含 binlog 读取、过滤、路由、转换，以及执行等逻辑。下一篇我们会对 relay log 数据处理单元的设计进行详细的讲解。

GPU云服务器云服务器这篇文章手把手带你阅读Netty源码【附文章阅读叙事文章阅读源码阅读

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/18015.html

DM 源码阅读系列文章（三）数据同步处理单元介绍

摘要：实际上中的数据同步处理单元分为两类全局共享单例。独享数据同步处理单元使用逻辑相关代码在。数据同步处理单元运行状态监控。后续会分三篇文章详细地介绍数据同步处理单元的实现，包括全量同步实现增量同步实现实现作者：lan 本文为 DM 源码阅读系列文章的第三篇，上篇文章介绍了 DM 的整体架构，DM 组件 DM-master 和 DM-worker 的入口代码，以及两者之间的数据交互模型。...

Forelax 2019-06-25 19:13 评论0 收藏0

发表评论

登陆后可评论

0条评论

reclay

男|高级讲师

我要关注我要私信

TA的文章

tensorflow和opencv

阅读 1981·2023-04-25 23:43
软件测试中的《性能测试》

阅读 1061·2021-11-24 09:39
BREW SDK 九大功能之显示和用户界面

阅读 812·2021-11-22 15:25
PowerDotNet平台化软件架构设计与实现系列（04）：服务治理平台

阅读 1809·2021-11-22 12:08
Spring Cloud Gateway实战之五：内置filter

阅读 1197·2021-11-18 10:07
微软 GitHub 竞争对手 GitLab 宣布计划在纳斯达克上市

阅读 2219·2021-09-23 11:22
云主机是什么意思-云主机是什么意思?为什么？

阅读 3455·2021-09-22 15:23
VirtualBox免费虚拟机软件安装教程支持跨平台且中文版

阅读 2799·2021-09-13 10:32

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

DM 源码阅读系列文章（五）Binlog replication 实现

相关文章

DM 源码阅读系列文章（三）数据同步处理单元介绍

发表评论

0条评论

reclay

男|高级讲师

TA的文章

tensorflow和opencv

软件测试中的《性能测试》

BREW SDK 九大功能之显示和用户界面

PowerDotNet平台化软件架构设计与实现系列（04）：服务治理平台

Spring Cloud Gateway实战之五：内置filter

微软 GitHub 竞争对手 GitLab 宣布计划在纳斯达克上市

云主机是什么意思-云主机是什么意思?为什么？

VirtualBox免费虚拟机软件安装教程支持跨平台且中文版

最新活动