Pulsar集成Debezium监听MySQL日志

2024-03-18 15:28

本文主要是介绍Pulsar集成Debezium监听MySQL日志,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

此处为docker部署方式

一.准备镜像和插件

pulsar镜像:这里使用最新版本apachepulsar/pulsar:latest,这里最新版是3.2.1,自己拉
插件:pulsar-io-debezium-mysql-3.2.1.nar,这里使用3.2.1版本的,也是最新版本的,保持一直。

pulsar-io-debezium-xxx-xxx.nar,这个是在Apache pulsar离线下载包里面找到,具体为:https://archive.apache.org/dist/pulsar/pulsar-3.2.1/connectors/,此处是pulsar与debezium集成的插件,具体的数据库找对应的。

二.准备文件

1.MySQL开启binlog(MySQL如果docker启动不用开启,不知道为啥)

subo vim /etc/my.cnf[mysqld]  // 添加下面三行
server_id=1
log-bin=mysql-bin
binlog_format=row

2.配置source-config.yaml(文件名可自定义)

示例:

tenant: "public" # 租户,可自定义
namespace: "default" # 命名空间,可自定义
name: "debezium-mysql-source" # source名,可自定义
topicName: "debezium-mysql-topic" # topic名,可自定义
archive: "data/pulsar-io-debezium-mysql-2.9.1.nar" # 上传的nar文件的存放位置,data目录,名字可自定义,位置在plusar目录下第一层,与bin目录平齐parallelism: 1 # 不用改configs:database.hostname: "118.195.***.***" # 数据库ipdatabase.port: "3306" # 数据库portdatabase.serverTimezone: "GMT+8" # # 数据库市区,可以没有这一条database.user: "root" # 数据库用户名database.password: "123456" # 数据库密码database.server.id: "1" # 唯一值,可自定义database.server.name: "dbserver1" # 服务名,可自定义,对应查询topic的第一截database.include.list:"demo_esb" # 需要访问的数据库## database.exclude.list: "demo_dap" # 不需要访问的数据库,可以没有这一条table.include.list:"demo_esb.ack_sample,demo_esb.aac_sample" # 需要访问的数据表,可以没有这一条## table.exclude.list:"demo_esb.ack sample_test" # 不需要访问的数据表,可以没有这一条column.include.list:"demo_esb.ack_sample.s_ID,demo_esb.ack_sample.s_coDE" # 需要访问的列,可以没有这一条##column.exclude.list:"demo_esb.ack_sample.s TEsri # 不需要访问的列,可以没有这一条## include.schema.changes:true" # 包含schema的改变,可以没有这一条database.history: "org.apache.pulsar.io.debezium.PulsarDatabaseHistory" # 不用改database.history.pulsar.topic: "my-history-topic" # topic名,可自定义database.history.pulsar.service.url: "pulsar://118.195.***.***:6651,118.195.***.***:6652,118.195.***.***:6653" # pulsar集群服务地址,自己修改key.converter: "org.apache.kafka.connect.json.JsonConverter" # 不用改value.converter: "org.apache.kafka.connect.json.JsonConverter" # 不用改pulsar.service.url: "pulsar://118.195.***.***:6651,118.195.***.***:6652,118.195.***.***:6653" # pulsar集群服务地址,自己修改,同上offset.storage.topic: "offset-topic" # topic名,可自定义

实际使用:

tenant: "public"
namespace: "default"
name: "debezium-mysql-source"
topicName: "debezium-mysql-topic"
archive: "data/pulsar-io-debezium-mysql-3.2.1.nar" # 上传的nar文件的存放位置parallelism: 1configs:database.hostname: "192.168.8.112"database.port: "3306"database.serverTimezone: "GMT+8"database.user: "root"database.password: "root"database.server.id: "2"database.server.name: "b"database.include.list: "a"database.history: "org.apache.pulsar.io.debezium.PulsarDatabaseHistory"database.history.pulsar.topic: "my-history-topic"database.history.pulsar.service.url: "pulsar://localhost:6650"key.converter: "org.apache.kafka.connect.json.JsonConverter"value.converter: "org.apache.kafka.connect.json.JsonConverter"pulsar.service.url: "pulsar://localhost:6650"offset.storage.topic: "offset-mysql-topic"

source运行之后,监控的topic,共由三截构成:
第一截:database.server.name的值
第二截:database.include.list的值,即数据库名
第三截:该数据库中表名
即:topicserver_name.database_name.table_name

三、启动

1.MySQL启动

docker run --name mysql -d -p 3306:3306 -e MYSQL_ROOT_PASSWORD=root mysql:8.0.36

此处docker启动,数据卷自己挂载。外部服务(开启binlog)的话,自己启动即可。

2.pulsar启动

docker run --name pulsar -d -p 6650:6650 -p 8080:8080 apachepulsar/pulsar:latest bin/pulsar standalone

此处单机版启动,集群启动,自己配置。

3.debezium插件启动

a.pulsar-io-debezium文件放在data下(其他目录下也可以)

docker cp ./pulsar-io-debezium-mysql-3.2.1.nar 981c770b0f87:/pulsar/data/pulsar-io-debezium-mysql-3.2.1.nar

需要用数据卷挂载方式,自己整

b.source-config.yaml文件放在conf下(其他目录下也可以)

docker cp ./source-config.yaml 981c770b0f87:/pulsar/conf/source-config.yaml

需要用数据卷挂载方式,自己整

c.启动连接器

进入pulsar目录下

./bin/pulsar-admin source localrun --source-config-file conf/source-config.yaml

四、测试

1.查看 pulsar topic

./bin/pulsar-admin topics list public/default

2.消费设置的topic消息

./bin/pulsar-client consume -s "first-subscription" persistent://public/default/b.a.t_user -n 0

3.MySQL中增改删数据,观察消费输出

这篇关于Pulsar集成Debezium监听MySQL日志的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/822784

相关文章

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

mysql数据库分区的使用

《mysql数据库分区的使用》MySQL分区技术通过将大表分割成多个较小片段,提高查询性能、管理效率和数据存储效率,本文就来介绍一下mysql数据库分区的使用,感兴趣的可以了解一下... 目录【一】分区的基本概念【1】物理存储与逻辑分割【2】查询性能提升【3】数据管理与维护【4】扩展性与并行处理【二】分区的

MySQL中时区参数time_zone解读

《MySQL中时区参数time_zone解读》MySQL时区参数time_zone用于控制系统函数和字段的DEFAULTCURRENT_TIMESTAMP属性,修改时区可能会影响timestamp类型... 目录前言1.时区参数影响2.如何设置3.字段类型选择总结前言mysql 时区参数 time_zon

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

C++中实现调试日志输出

《C++中实现调试日志输出》在C++编程中,调试日志对于定位问题和优化代码至关重要,本文将介绍几种常用的调试日志输出方法,并教你如何在日志中添加时间戳,希望对大家有所帮助... 目录1. 使用 #ifdef _DEBUG 宏2. 加入时间戳:精确到毫秒3.Windows 和 MFC 中的调试日志方法MFC

SpringBoot如何使用TraceId日志链路追踪

《SpringBoot如何使用TraceId日志链路追踪》文章介绍了如何使用TraceId进行日志链路追踪,通过在日志中添加TraceId关键字,可以将同一次业务调用链上的日志串起来,本文通过实例代码... 目录项目场景:实现步骤1、pom.XML 依赖2、整合logback,打印日志,logback-sp

Mysql DATETIME 毫秒坑的解决

《MysqlDATETIME毫秒坑的解决》本文主要介绍了MysqlDATETIME毫秒坑的解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 今天写代码突发一个诡异的 bug,代码逻辑大概如下。1. 新增退款单记录boolean save = s

mysql-8.0.30压缩包版安装和配置MySQL环境过程

《mysql-8.0.30压缩包版安装和配置MySQL环境过程》该文章介绍了如何在Windows系统中下载、安装和配置MySQL数据库,包括下载地址、解压文件、创建和配置my.ini文件、设置环境变量... 目录压缩包安装配置下载配置环境变量下载和初始化总结压缩包安装配置下载下载地址:https://d

MySQL中的锁和MVCC机制解读

《MySQL中的锁和MVCC机制解读》MySQL事务、锁和MVCC机制是确保数据库操作原子性、一致性和隔离性的关键,事务必须遵循ACID原则,锁的类型包括表级锁、行级锁和意向锁,MVCC通过非锁定读和... 目录mysql的锁和MVCC机制事务的概念与ACID特性锁的类型及其工作机制锁的粒度与性能影响多版本