X2Doris使用指南:界面化数据迁移工具 - 轻松实现整库迁移至Doris

本文主要是介绍X2Doris使用指南:界面化数据迁移工具 - 轻松实现整库迁移至Doris,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

什么是X2Doris

X2Doris 是 SelectDB 团队开发的,专门用于将各种离线数据迁移到 Apache Doris 中的核心工具,该工具集 自动建 Doris 表数据迁移 为一体,目前支持了 Apache Doris/Hive/Kudu/StarRocks 数据库往 Doris 或 SelectDB Cloud 迁移的工作,整个过程可视化的平台操作,非常简单易用。

安装部署

参考官网文档:https://docs.selectdb.com/docs/ecosystem/x2doris/x2doris-deployment-guide

使用指南

参考官网文档:https://docs.selectdb.com/docs/ecosystem/x2doris/x2doris-use-guide

常见问题

推荐使用最新版本的X2Doris,目前仅支持jdk8
使用文档参考:https://docs.selectdb.com/docs/ecosystem/x2doris/x2doris-use-guide

1.0.4版本的X2Doris支持Doris、Hive、StarRocks、Kudu导入Doris/Selectdb/Cloud

目前Doris 2 Doris 不支持bitmap类型,1.2系列版本不支持DATETIMEV2、DATEV2,2.1.2版本及之后读DATETIMEV2、DATEV2也有问题,后续考虑支持

1、首先确认源端和目标端的fe 8030/9030 be 9060/8040是否通的,源端有读取权限,目标端都有建表,写入的权限

2、使用Hive 的时候要确认下基础环境

验证方法,在安装x2doris 的机器上执行hive的命令,看是否能连上hive,然后执行show databases;看下
获取 Hive 元数据方式,目前支持三种:JDBC,阿里云 DLF,Metastore,直接在conf里面的hive修改即可

3、Hive的jdbc的连接形式在lib下面放连接的jar包
hive_jdbc.jar
hive_service.jar
报错截图
[图片]

4、hive2doris的时候建表能够成功,但是启动任务的时候,报错找不到库

确保spark的conf目录下有hive-site.xml
然后提交任务的时候加上 spark.sql.catalogImplementation=hive
报错截图

5、 get_next failed: out of sequence response: expected 4 but got 620757195
这是某个字段的值很大造成的,这个在205的版本后修了,新加了一个变量 max_msg_size_of_result_receiver 来控制返回结果的行数

6、前端报错提示:The number of parameters exceeded the maximum of 1000
在conf的application.yml里面 undertow: buffer-size: 1024的下面加一个这个max-parameters: 2000 重启下

7、ERROR BackendClient: Connect Doris BE{host='...**', port=9060} failed. **

使用telnet 确认 be的9060端口是否能够连通

8、Doris server Doris BE{host='...', port=9060} internal failed, status code [NOT_FOUND] error message is null

not found 这个就是读取的时候发现读取的tablet在这个be上面找不到副本了,副本迁移导致的问题。迁移过程不要有导入任务

9、The status of open scanner result from Doris BE{host=‘127.1.1.1’, port=9060} is ‘INVALID_ARGUMENT’, error message is:[(127.1.1.1)[INVALID_ARGUMENT]Unknown primitive type(17)]

Doris 不支持 thrift 读取 bitmap类型,暂时无解

10、如果导入少数据,yarn模式下可以设置下面的saprk参数(根据自己的情况来)

可以设置spark.executor.heartbeatInterval=300s
spark.network.timeout=320s
spark.driver.memory=4g
spark.executor.memory=6g

11、查询hive报错 Invalid method name: ‘get_table_req’

spark与hive的版本不兼容造成的,可能是由于hive的版本较低,启动任务的时候可指定下面两个参数(以2.1.1为例)
spark.sql.hive.metastore.version=2.1.1
spark.sql.hive.metastore.jars=/path/hive/lib/* (指定路径)
或者把这两个配置写到 spark/conf/spark-defaults.conf 文件里

12、X2Doris提交任务后,Spark报错数据库不存在: NoSuchDatabaseException: Database ‘dw_srclog’ not found

hive里conf的下hive-site.xml文件 拷贝到spark的conf

也可能是其他版本集成版本的hive版本没有匹配,比如星环的,华为云的等等

这篇关于X2Doris使用指南:界面化数据迁移工具 - 轻松实现整库迁移至Doris的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1006133

相关文章

openCV中KNN算法的实现

《openCV中KNN算法的实现》KNN算法是一种简单且常用的分类算法,本文主要介绍了openCV中KNN算法的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录KNN算法流程使用OpenCV实现KNNOpenCV 是一个开源的跨平台计算机视觉库,它提供了各

OpenCV图像形态学的实现

《OpenCV图像形态学的实现》本文主要介绍了OpenCV图像形态学的实现,包括腐蚀、膨胀、开运算、闭运算、梯度运算、顶帽运算和黑帽运算,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起... 目录一、图像形态学简介二、腐蚀(Erosion)1. 原理2. OpenCV 实现三、膨胀China编程(

通过Spring层面进行事务回滚的实现

《通过Spring层面进行事务回滚的实现》本文主要介绍了通过Spring层面进行事务回滚的实现,包括声明式事务和编程式事务,具有一定的参考价值,感兴趣的可以了解一下... 目录声明式事务回滚:1. 基础注解配置2. 指定回滚异常类型3. ​不回滚特殊场景编程式事务回滚:1. ​使用 TransactionT

Android实现打开本地pdf文件的两种方式

《Android实现打开本地pdf文件的两种方式》在现代应用中,PDF格式因其跨平台、稳定性好、展示内容一致等特点,在Android平台上,如何高效地打开本地PDF文件,不仅关系到用户体验,也直接影响... 目录一、项目概述二、相关知识2.1 PDF文件基本概述2.2 android 文件访问与存储权限2.

MySQL 中查询 VARCHAR 类型 JSON 数据的问题记录

《MySQL中查询VARCHAR类型JSON数据的问题记录》在数据库设计中,有时我们会将JSON数据存储在VARCHAR或TEXT类型字段中,本文将详细介绍如何在MySQL中有效查询存储为V... 目录一、问题背景二、mysql jsON 函数2.1 常用 JSON 函数三、查询示例3.1 基本查询3.2

使用Python实现全能手机虚拟键盘的示例代码

《使用Python实现全能手机虚拟键盘的示例代码》在数字化办公时代,你是否遇到过这样的场景:会议室投影电脑突然键盘失灵、躺在沙发上想远程控制书房电脑、或者需要给长辈远程协助操作?今天我要分享的Pyth... 目录一、项目概述:不止于键盘的远程控制方案1.1 创新价值1.2 技术栈全景二、需求实现步骤一、需求

Spring Shell 命令行实现交互式Shell应用开发

《SpringShell命令行实现交互式Shell应用开发》本文主要介绍了SpringShell命令行实现交互式Shell应用开发,能够帮助开发者快速构建功能丰富的命令行应用程序,具有一定的参考价... 目录引言一、Spring Shell概述二、创建命令类三、命令参数处理四、命令分组与帮助系统五、自定义S

SpringBatch数据写入实现

《SpringBatch数据写入实现》SpringBatch通过ItemWriter接口及其丰富的实现,提供了强大的数据写入能力,本文主要介绍了SpringBatch数据写入实现,具有一定的参考价值,... 目录python引言一、ItemWriter核心概念二、数据库写入实现三、文件写入实现四、多目标写入

Android Studio 配置国内镜像源的实现步骤

《AndroidStudio配置国内镜像源的实现步骤》本文主要介绍了AndroidStudio配置国内镜像源的实现步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录一、修改 hosts,解决 SDK 下载失败的问题二、修改 gradle 地址,解决 gradle

SpringSecurity JWT基于令牌的无状态认证实现

《SpringSecurityJWT基于令牌的无状态认证实现》SpringSecurity中实现基于JWT的无状态认证是一种常见的做法,本文就来介绍一下SpringSecurityJWT基于令牌的无... 目录引言一、JWT基本原理与结构二、Spring Security JWT依赖配置三、JWT令牌生成与