streamsets专题

StreamSets MySQL Binlog解析配置

MySQLbinlog日志作为用于MySQL主从复制的途径。 MySQL复制允许通过binlog维护多个将数据从主服务器复制到从属服务器的副本。 StreamSets可以从MySQL主数据库捕获更改,然后将更改的数据传递到Data Collector管道。 GTID是MySQL数据库事务的全局唯一ID,在MySQL中无论GTID是否打开都可以通过StreamSets处理MySQL binglog。

Streamsets-JDBC模式使用更新时间字段数据同步

StreamSets的开源地址:https://github.com/streamsets/datacollector-oss Streamsets官网地址:https://streamsets.com/ Streamsets文档地址:https://docs.streamsets.com/portal/datacollector/3.16.x/help/index.html 我又来写Strea

Streamsets Postgresql 实时同步到Kudu

Streamsets提供两种方式同步Postgresql,一种是JDBC、query,另一种是CDC方式,实时同步需要两者结合来首次同步。 首先需要全表同步,采用JDBC方式比较好: 这个比同步Mysql方便,可以写多个模式多个表同时同步。 这个是完成一次同步就触发,不至于没有数据进来报错。下一次事务继续同步。 这个一定要配置,不然_int  json 格式就会报错。