本文主要是介绍Hive自定义分隔符InputFormat,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Hive默认创建的表字段分隔符为:\001(ctrl-A),也可以通过 ROW FORMAT DELIMITED FIELDS TERMINATED BY
指定其他字符,但是该语法只支持单个字符,如果你的分隔符是多个字符,则需要你自定义InputFormat来实现,本文就以简单的示例演示多个字符作为分隔符的实现。
[一]、开发环境
- Hadoop 2.2.0
- Hive 0.12.0
- Java1.6+
- Mac OSX 10.9.1
[二]、示例
详见:http://www.micmiu.com/opensource/hadoop/hive-inputformat-string/
这篇关于Hive自定义分隔符InputFormat的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!