return code 1 from org.apache.hadoop.hive.ql.ddl.DDLTask

2024-03-21 15:04

本文主要是介绍return code 1 from org.apache.hadoop.hive.ql.ddl.DDLTask,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

Bug信息

Error: Error while compiling statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.ddl.DDLTask (state=08S01,code=1)

Bug产生的代码

修复hive表分区:

msck repair table xxx

Bug原因排查

  1. 分区数量过大
    这个是网上查看的说如果一次性修复大量的分区可能会报这样的错误,但是我仅仅有一百多个分目录,因此直接排除该原因。
  2. 分区数据缺失
    如果表的分区有两个字段,但是hdfs上对应只有一个分区字段,这种情况就会报上面的错。因此我对各个分区进行了检测,发现果然有个分区目录少了数据

Bug解决方法

  1. 删除掉没有数据的分区
    这种适合于能明确知道为什么当天分区数据缺失,如果经常出现这种情况,显然不可能每天都手动删除。
  2. set hive.msck.path.validation=ignore
    hive.msck.path.validation=ignore 是 Apache Hive 中的一个配置参数,与 MSCK REPAIR TABLE 命令相关。M

这篇关于return code 1 from org.apache.hadoop.hive.ql.ddl.DDLTask的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/832981

相关文章

BD错误集锦9——查询hive表格时出错:Wrong FS: hdfs://s233/user/../warehouse expected: hdfs://mycluster

集群环境描述:HDFS集群处于HA模式下,同时启动了YARN\JN\KAFKA\ZK。 现象: FAILED: SemanticException Unable to determine if hdfs://s233/user/hive/warehouse/mydb.db/ext_calllogs_in_hbase is encrypted: java.lang.IllegalArgument

BD错误集锦1——[Hive]ERROR StatusLogger No log4j2 configuration file found. Using default configuration:

错误描述:在使用IDEA进行jdbc方式连接到hive数据仓库时,出现以下错误:                ERROR StatusLogger No log4j2 configuration file found. 问题原因:缺少log4j2.xml文件   <?xml version="1.0" encoding="UTF-8"?><Configuration><Appender

修改wamp的apache默认端口80以及www目录

转自:http://blog.csdn.net/daydreamingboy/article/details/6247592 修改wamp的apache默认端口80以及www目录 以修改为8088端口和D:/workphp目录为例。 1. 修改为8088端口 左键托盘图标,在“Apache”里可以直接打开httpd.conf,查找到“Listen 80”,可以改成其他端口,我选用808

JavaWeb——MySQL:DDL操作库

目录 1.DDL:查询数据库; 1.1 查询数据库 1.2 创建数据库 1.DDL:查询数据库; 具体操作:增 删 查 用 ; 1.1 查询数据库 SQL语句:show databases; 由于我创建过一些数据库,我查询的结果有9个数据库; 其中 information_schema ,mysql  ,performance_schema,sys   是自带的

VS Code SSH 远程连接服务器及坑点解决

背景 Linux服务器重装了一下,IP没有变化,结果VS Code再重连的时候就各种问题,导致把整个流程全部走了一遍,留个经验帖以备查看 SSH 首先确保Windows安装了ssh,通过cmd下ssh命令查看是否安装了。 没安装,跳转安装Windows下的ssh 对应的,也需要Linux安装ssh,本文是Ubuntu系统,使用以下命令安装: sudo apt updatesudo

Google Code Jam 2014(附官方题解)

2014年Google编程挑战赛 Problem A. Magic Trick Confused? Read the quick-start guide. Small input 6 points You have solved this input set. Note: To advance to the next rounds, you will need to s

Hive笔记-2

第 3 章 DDL (Data Definition Language) 数据定义 DDL数据定义语言 DML数据操作语言 3.1 数据库 (database) 3.1.1 创建数据库 1) 语法 CREATE DATABASE [IF NOT EXISTS] database_name[COMMENT database_comment][LOCATION hdfs_pat

Ubuntu 服务器上安装和配置 Apache Web 服务器详细的步骤

在 Ubuntu 服务器上安装和配置 Apache Web 服务器。下面是详细的步骤: 安装 Apache 首先,确保你的包列表是最新的,然后安装 Apache: sudo apt updatesudo apt install apache2 启动和检查 Apache 服务 安装完成后,启动 Apache 服务并检查其状态: sudo systemctl start apache2s

加载org.Hs.eg.db为什么出现error: $ operator is invalid for atomic vectors报错和解决方法

在Bioconductor上已经有人提了问题,并且有了回答(地址:https://support.bioconductor.org/p/9136329/) 简单的说,就是Rstduio出来背锅,最新的RSQLite(v2.2.6)和Rstudio存在冲突,以后要么是RSQLite迁就RStduio,要么就是Rstudio迁就RQLite。 不过目前也不是不能用,以下是解决方法 方法1 手动设

Hadoop简介_Hadoop集群_Hadoop安装配置

Hadoop集群(第5期)_Hadoop安装配置   1、集群部署介绍   1.1 Hadoop简介     Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透