本文主要是介绍hive建外表时默认分隔符错误导致行数增加和数据错误,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
hive根据hdfs建立外表时,一般使用这种格式规范: ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
这种方式识别的默认行分隔符其实并不只是行分隔符'\n',还包括'\r','\r\n','\u0001','\u0002','\u0003'
因此有如果字段中存在'\r',可能会导致外表行数与预期不一致的增加
这种处理应该是为了兼容windows
相关的一个jira https://issues.apache.org/jira/browse/HIVE-3810
根据实践,hive 0.12依然存在这个问题
这篇关于hive建外表时默认分隔符错误导致行数增加和数据错误的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!