本文主要是介绍Hive扩展功能(一)--Parquet,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
软件环境:
linux系统: CentOS6.7
Hadoop版本: 2.6.5
zookeeper版本: 3.4.8
主机配置:
一共m1, m2, m3这三部机, 每部主机的用户名都为centos
192.168.179.201: m1
192.168.179.202: m2
192.168.179.203: m3 m1: Zookeeper, Namenode, DataNode, ResourceManager, NodeManager, Master, Worker
m2: Zookeeper, Namenode, DataNode, ResourceManager, NodeManager, Worker
m3: Zookeeper, DataNode, NodeManager, Worker
资料:
官方资料:https://cwiki.apache.org/confluence/display/Hive/Parquet
注意:
Hive扩展Parquet有以下两种方案:(hive自0.13版本以后已自带paruqet功能, 不必再扩展parquet功能)
1.方案一:
(1) 下载Parquet扩展包
通过yum下载parquet资源包 (此方案大多数情况下无法找到parquet, 原
这篇关于Hive扩展功能(一)--Parquet的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!