Pulsar集成Debezium监听MySQL日志

2024-03-18 15:28

本文主要是介绍Pulsar集成Debezium监听MySQL日志,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

此处为docker部署方式

一.准备镜像和插件

pulsar镜像:这里使用最新版本apachepulsar/pulsar:latest,这里最新版是3.2.1,自己拉
插件:pulsar-io-debezium-mysql-3.2.1.nar,这里使用3.2.1版本的,也是最新版本的,保持一直。

pulsar-io-debezium-xxx-xxx.nar,这个是在Apache pulsar离线下载包里面找到,具体为:https://archive.apache.org/dist/pulsar/pulsar-3.2.1/connectors/,此处是pulsar与debezium集成的插件,具体的数据库找对应的。

二.准备文件

1.MySQL开启binlog(MySQL如果docker启动不用开启,不知道为啥)

subo vim /etc/my.cnf[mysqld]  // 添加下面三行
server_id=1
log-bin=mysql-bin
binlog_format=row

2.配置source-config.yaml(文件名可自定义)

示例:

tenant: "public" # 租户,可自定义
namespace: "default" # 命名空间,可自定义
name: "debezium-mysql-source" # source名,可自定义
topicName: "debezium-mysql-topic" # topic名,可自定义
archive: "data/pulsar-io-debezium-mysql-2.9.1.nar" # 上传的nar文件的存放位置,data目录,名字可自定义,位置在plusar目录下第一层,与bin目录平齐parallelism: 1 # 不用改configs:database.hostname: "118.195.***.***" # 数据库ipdatabase.port: "3306" # 数据库portdatabase.serverTimezone: "GMT+8" # # 数据库市区,可以没有这一条database.user: "root" # 数据库用户名database.password: "123456" # 数据库密码database.server.id: "1" # 唯一值,可自定义database.server.name: "dbserver1" # 服务名,可自定义,对应查询topic的第一截database.include.list:"demo_esb" # 需要访问的数据库## database.exclude.list: "demo_dap" # 不需要访问的数据库,可以没有这一条table.include.list:"demo_esb.ack_sample,demo_esb.aac_sample" # 需要访问的数据表,可以没有这一条## table.exclude.list:"demo_esb.ack sample_test" # 不需要访问的数据表,可以没有这一条column.include.list:"demo_esb.ack_sample.s_ID,demo_esb.ack_sample.s_coDE" # 需要访问的列,可以没有这一条##column.exclude.list:"demo_esb.ack_sample.s TEsri # 不需要访问的列,可以没有这一条## include.schema.changes:true" # 包含schema的改变,可以没有这一条database.history: "org.apache.pulsar.io.debezium.PulsarDatabaseHistory" # 不用改database.history.pulsar.topic: "my-history-topic" # topic名,可自定义database.history.pulsar.service.url: "pulsar://118.195.***.***:6651,118.195.***.***:6652,118.195.***.***:6653" # pulsar集群服务地址,自己修改key.converter: "org.apache.kafka.connect.json.JsonConverter" # 不用改value.converter: "org.apache.kafka.connect.json.JsonConverter" # 不用改pulsar.service.url: "pulsar://118.195.***.***:6651,118.195.***.***:6652,118.195.***.***:6653" # pulsar集群服务地址,自己修改,同上offset.storage.topic: "offset-topic" # topic名,可自定义

实际使用:

tenant: "public"
namespace: "default"
name: "debezium-mysql-source"
topicName: "debezium-mysql-topic"
archive: "data/pulsar-io-debezium-mysql-3.2.1.nar" # 上传的nar文件的存放位置parallelism: 1configs:database.hostname: "192.168.8.112"database.port: "3306"database.serverTimezone: "GMT+8"database.user: "root"database.password: "root"database.server.id: "2"database.server.name: "b"database.include.list: "a"database.history: "org.apache.pulsar.io.debezium.PulsarDatabaseHistory"database.history.pulsar.topic: "my-history-topic"database.history.pulsar.service.url: "pulsar://localhost:6650"key.converter: "org.apache.kafka.connect.json.JsonConverter"value.converter: "org.apache.kafka.connect.json.JsonConverter"pulsar.service.url: "pulsar://localhost:6650"offset.storage.topic: "offset-mysql-topic"

source运行之后,监控的topic,共由三截构成:
第一截:database.server.name的值
第二截:database.include.list的值,即数据库名
第三截:该数据库中表名
即:topicserver_name.database_name.table_name

三、启动

1.MySQL启动

docker run --name mysql -d -p 3306:3306 -e MYSQL_ROOT_PASSWORD=root mysql:8.0.36

此处docker启动,数据卷自己挂载。外部服务(开启binlog)的话,自己启动即可。

2.pulsar启动

docker run --name pulsar -d -p 6650:6650 -p 8080:8080 apachepulsar/pulsar:latest bin/pulsar standalone

此处单机版启动,集群启动,自己配置。

3.debezium插件启动

a.pulsar-io-debezium文件放在data下(其他目录下也可以)

docker cp ./pulsar-io-debezium-mysql-3.2.1.nar 981c770b0f87:/pulsar/data/pulsar-io-debezium-mysql-3.2.1.nar

需要用数据卷挂载方式,自己整

b.source-config.yaml文件放在conf下(其他目录下也可以)

docker cp ./source-config.yaml 981c770b0f87:/pulsar/conf/source-config.yaml

需要用数据卷挂载方式,自己整

c.启动连接器

进入pulsar目录下

./bin/pulsar-admin source localrun --source-config-file conf/source-config.yaml

四、测试

1.查看 pulsar topic

./bin/pulsar-admin topics list public/default

2.消费设置的topic消息

./bin/pulsar-client consume -s "first-subscription" persistent://public/default/b.a.t_user -n 0

3.MySQL中增改删数据,观察消费输出

这篇关于Pulsar集成Debezium监听MySQL日志的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/822784

相关文章

MySQL 中的 JSON 查询案例详解

《MySQL中的JSON查询案例详解》:本文主要介绍MySQL的JSON查询的相关知识,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录mysql 的 jsON 路径格式基本结构路径组件详解特殊语法元素实际示例简单路径复杂路径简写操作符注意MySQL 的 J

Windows 上如果忘记了 MySQL 密码 重置密码的两种方法

《Windows上如果忘记了MySQL密码重置密码的两种方法》:本文主要介绍Windows上如果忘记了MySQL密码重置密码的两种方法,本文通过两种方法结合实例代码给大家介绍的非常详细,感... 目录方法 1:以跳过权限验证模式启动 mysql 并重置密码方法 2:使用 my.ini 文件的临时配置在 Wi

MySQL重复数据处理的七种高效方法

《MySQL重复数据处理的七种高效方法》你是不是也曾遇到过这样的烦恼:明明系统测试时一切正常,上线后却频频出现重复数据,大批量导数据时,总有那么几条不听话的记录导致整个事务莫名回滚,今天,我就跟大家分... 目录1. 重复数据插入问题分析1.1 问题本质1.2 常见场景图2. 基础解决方案:使用异常捕获3.

SQL中redo log 刷⼊磁盘的常见方法

《SQL中redolog刷⼊磁盘的常见方法》本文主要介绍了SQL中redolog刷⼊磁盘的常见方法,将redolog刷入磁盘的方法确保了数据的持久性和一致性,下面就来具体介绍一下,感兴趣的可以了解... 目录Redo Log 刷入磁盘的方法Redo Log 刷入磁盘的过程代码示例(伪代码)在数据库系统中,r

mysql中的group by高级用法

《mysql中的groupby高级用法》MySQL中的GROUPBY是数据聚合分析的核心功能,主要用于将结果集按指定列分组,并结合聚合函数进行统计计算,下面给大家介绍mysql中的groupby用法... 目录一、基本语法与核心功能二、基础用法示例1. 单列分组统计2. 多列组合分组3. 与WHERE结合使

Mysql用户授权(GRANT)语法及示例解读

《Mysql用户授权(GRANT)语法及示例解读》:本文主要介绍Mysql用户授权(GRANT)语法及示例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mysql用户授权(GRANT)语法授予用户权限语法GRANT语句中的<权限类型>的使用WITH GRANT

Mysql如何解决死锁问题

《Mysql如何解决死锁问题》:本文主要介绍Mysql如何解决死锁问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录【一】mysql中锁分类和加锁情况【1】按锁的粒度分类全局锁表级锁行级锁【2】按锁的模式分类【二】加锁方式的影响因素【三】Mysql的死锁情况【1

SQL BETWEEN 的常见用法小结

《SQLBETWEEN的常见用法小结》BETWEEN操作符是SQL中非常有用的工具,它允许你快速选取某个范围内的值,本文给大家介绍SQLBETWEEN的常见用法,感兴趣的朋友一起看看吧... 在SQL中,BETWEEN是一个操作符,用于选取介于两个值之间的数据。它包含这两个边界值。BETWEEN操作符常用

MySQL索引的优化之LIKE模糊查询功能实现

《MySQL索引的优化之LIKE模糊查询功能实现》:本文主要介绍MySQL索引的优化之LIKE模糊查询功能实现,本文通过示例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧... 目录一、前缀匹配优化二、后缀匹配优化三、中间匹配优化四、覆盖索引优化五、减少查询范围六、避免通配符开头七、使用外部搜索引擎八、分

Java程序进程起来了但是不打印日志的原因分析

《Java程序进程起来了但是不打印日志的原因分析》:本文主要介绍Java程序进程起来了但是不打印日志的原因分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java程序进程起来了但是不打印日志的原因1、日志配置问题2、日志文件权限问题3、日志文件路径问题4、程序