DataX-json模板(hdfsToMysql、hdfsToOracle、mysqlToHdfs、oracleToDoris)【全】

本文主要是介绍DataX-json模板(hdfsToMysql、hdfsToOracle、mysqlToHdfs、oracleToDoris)【全】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
    • 1. HDFS 到 MySQL (hdfsToMysql)
    • 2. HDFS 到 Oracle (hdfsToOracle)
    • 3. MySQL 到 HDFS (mysqlToHdfs)
    • 4. Oracle 到 Doris (oracleToDoris)
  • 总结

前言

DataX 是一款由阿里巴巴开源的数据同步工具,它提供了丰富的数据源插件,支持包括但不限于 MySQL、Oracle、HDFS 等多种数据源的同步。以下是几种常见同步场景的 JSON 模板示例。


1. HDFS 到 MySQL (hdfsToMysql)

  • 当您需要将数据从 HDFS 同步到 MySQL 时,可以使用如下的 JSON 模板:
{"job": {"content": [{"reader": {"name": "hdfsreader","parameter": {"path": "/user/hive/warehouse/ads.db/ads_zhy_site_stat_di/date=${dt1}","defaultFS": "hdfs://dn22:8020","fileType": "parquet","skipHeader": false,"column": [{"index":"0","type":"string"},{"index":"1","type":"string"},{"index":"2","type":"int"},{"index":"3","type":"int"},{ "name": "date", "type": "string","value":"${dt1}"}]}},"writer": {"name": "mysqlwriter","parameter": {"writeMode": "insert","username": "cnooc_fuse","password": "root","column": ["`site_id`","`fuel_type`","`vehicle_num`","`through_vehicle_num`","`date`"],"connection": [{"table": ["t_site_flow_stat_day"],"jdbcUrl": "jdbc:mysql://172.0.0.1:8086/cnooc_fuse?useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertToNull&tinyInt1isBit=false&dontTrackOpenResources=true"}]}}}]
,"setting": {"speed": {"channel": "2"}}}
}

2. HDFS 到 Oracle (hdfsToOracle)

  • 将数据从 HDFS 同步到 Oracle 的 JSON 模板如下:
{"job": {"content": [{"reader": {"name": "hdfsreader","parameter": {"path": "/user/hive/warehouse/mid.db/hky_veh_run_time/dt=${dt}","defaultFS": "hdfs://nn01:8020","fileType": "parquet","skipHeader": false,"column": [{"index":"0","type":"long"},{"index":"1","type":"int"},{"index":"2","type":"int"},{ "name": "dt", "type": "long","value":"${dt}"}]}},"writer": {"name": "oraclewriter","parameter": {"username": "root","password": "root","column": ["TRANS","AD_CODE","RUN_TIME","DT"],"connection": [{"table": ["HKY_VEH_RUN_TIME"],"jdbcUrl": "jdbc:oracle:thin:@172.0.0.1:1521:rdt1"}]}}}],"setting": {"speed": {"channel": "2"}}}
}

3. MySQL 到 HDFS (mysqlToHdfs)

  • 从 MySQL 同步数据到 HDFS 的 JSON 模板示例:
{"job": {"content": [{"reader": {"name": "mysqlreader","parameter": {"username": "cnooc_fuse","password": "root","connection": [{"querySql": ["SELECT id,site_name,area_type,province,city,site_type,company_name,tel,lon,lat,is_cnooc,address, section_code,road_type,road_name,site_state,
recommend_type, manage_type, remark, note, create_user,create_time, update_user, update_time, is_deletedFROM t_site_new "],"jdbcUrl": ["jdbc:mysql://172.0.0.1:8086/cnooc_fuse?allowLoadLocalInfile=false&autoDeserialize=false&allowLocalInfile=false&allowUrlInLocalInfile=false"]}]}},"writer": {"name": "hdfswriter","parameter": {"column": [{"name": "id","type": "int"},{"name": "site_name","type": "string"},{"name": "area_type","type": "int"},{"name": "province","type": "int"},{"name": "city","type": "int"},{"name": "site_type","type": "int"},{"name": "company_name","type": "string"},{"name": "tel","type": "string"},{"name": "lon","type": "double"},{"name": "lat","type": "double"},{"name": "is_cnooc","type": "int"},{"name": "address","type": "string"},{"name": "section_code","type": "string"},{"name": "road_type","type": "string"},{"name": "road_name","type": "string"},{"name": "site_state","type": "string"},{"name": "recommend_type","type": "string"},{"name": "manage_type","type": "string"},{"name": "remark","type": "string"},{"name": "note","type": "string"},{"name": "create_user","type": "string"},{"name": "update_user","type": "string"},{"name": "create_time","type": "string"},{"name": "update_time","type": "string"},{"name": "is_deleted","type": "int"}],"compress": "snappy","defaultFS": "hdfs://nn01:8020","fieldDelimiter":",","fileName": "datax","fileType": "parquet","path": "/user/hive/warehouse/ods.db/ods_tran_logistics_site/","writeMode": "truncate"}}}],"setting": {"speed": {"channel": "2"}}}
}

4. Oracle 到 Doris (oracleToDoris)

  • 将数据从 Oracle 同步到 Doris 的 JSON 模板:
{"job": {"setting": {"speed": {"channel": 1},"errorLimit": {"record": 0,"percentage": 0}},"content": [{"reader": {"name": "oraclereader","parameter": {"column": [
"SERIAL_ID",
"CYCLE",
"REGION_CODE",
"TYPE",
"SRC_REGION",
"DST_REGION",
"SRC_TIME",
"HB_TIME",
"STATUS",
"CREATE_TIME"],"connection": [{"jdbcUrl": ["jdbc:oracle:thin:@//172.0.0.1:32021/s_tsshprod"],"table": ["HEART_BEAT_INFO"]}],"password": "root","splitPk": "","username": "tssh","where": "1=1 and CREATE_TIME >= TO_DATE('${dt}', 'YYYY-MM-DD HH24:MI:SS') - INTERVAL '1:10' HOUR TO MINUTE"}},"writer": {"name": "doriswriter","parameter": {"loadUrl": ["172.0.0.1:8030"],"loadProps": {"format": "json","strip_outer_array": true},"column": [
"serial_id",
"cycle",
"region_code",
"type",
"src_region",
"dst_region",
"src_time",
"hb_time",
"status",
"create_time"],"username": "yunwei","password": "root","postSql": [],"preSql": [],"flushInterval": 30000,"connection": [{"jdbcUrl": "jdbc:mysql://172.0.0.1:9030/collect","selectedDatabase": "collect","table": ["dl_01_heart_beat_info"]}]}}}]}
}

总结

如果此篇文章有帮助到您, 希望打大佬们能关注点赞收藏评论支持一波,非常感谢大家!
如果有不对的地方请指正!!!

这篇关于DataX-json模板(hdfsToMysql、hdfsToOracle、mysqlToHdfs、oracleToDoris)【全】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/935769

相关文章

IDEA如何将String类型转json格式

《IDEA如何将String类型转json格式》在Java中,字符串字面量中的转义字符会被自动转换,但通过网络获取的字符串可能不会自动转换,为了解决IDEA无法识别JSON字符串的问题,可以在本地对字... 目录问题描述问题原因解决方案总结问题描述最近做项目需要使用Ai生成json,可生成String类型

Python中json文件和jsonl文件的区别小结

《Python中json文件和jsonl文件的区别小结》本文主要介绍了JSON和JSONL两种文件格式的区别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下... 众所周知,jsON 文件是使用php JSON(JavaScripythonpt Object No

基于Java实现模板填充Word

《基于Java实现模板填充Word》这篇文章主要为大家详细介绍了如何用Java实现按产品经理提供的Word模板填充数据,并以word或pdf形式导出,有需要的小伙伴可以参考一下... Java实现按模板填充wor编程d本文讲解的需求是:我们需要把数据库中的某些数据按照 产品经理提供的 word模板,把数据

使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)

《使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)》在现代软件开发中,处理JSON数据是一项非常常见的任务,无论是从API接口获取数据,还是将数据存储为JSON格式,解析... 目录1. 背景介绍1.1 jsON简介1.2 实际案例2. 准备工作2.1 环境搭建2.1.1 添加

Java解析JSON的六种方案

《Java解析JSON的六种方案》这篇文章介绍了6种JSON解析方案,包括Jackson、Gson、FastJSON、JsonPath、、手动解析,分别阐述了它们的功能特点、代码示例、高级功能、优缺点... 目录前言1. 使用 Jackson:业界标配功能特点代码示例高级功能优缺点2. 使用 Gson:轻量

python中json.dumps和json.dump区别

《python中json.dumps和json.dump区别》json.dumps将Python对象序列化为JSON字符串,json.dump直接将Python对象序列化写入文件,本文就来介绍一下两个... 目录1、json.dumps和json.dump的区别2、使用 json.dumps() 然后写入文

Java中JSON字符串反序列化(动态泛型)

《Java中JSON字符串反序列化(动态泛型)》文章讨论了在定时任务中使用反射调用目标对象时处理动态参数的问题,通过将方法参数存储为JSON字符串并进行反序列化,可以实现动态调用,然而,这种方式容易导... 需求:定时任务扫描,反射调用目标对象,但是,方法的传参不是固定的。方案一:将方法参数存成jsON字

poj3468(线段树成段更新模板题)

题意:包括两个操作:1、将[a.b]上的数字加上v;2、查询区间[a,b]上的和 下面的介绍是下解题思路: 首先介绍  lazy-tag思想:用一个变量记录每一个线段树节点的变化值,当这部分线段的一致性被破坏我们就将这个变化值传递给子区间,大大增加了线段树的效率。 比如现在需要对[a,b]区间值进行加c操作,那么就从根节点[1,n]开始调用update函数进行操作,如果刚好执行到一个子节点,

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n