本文主要是介绍走近大数据之Hive进阶(二、Hive的数据查询),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
目录
一、简单查询和fetch task
二、在查询中使用过滤
三、在查询中使用排序
一、简单查询和fetch task
1、Hive查询的基本语法
语法跟sql语法基本相似
SELECT * FROM user 与 SELECT name, gender FROM user的区别?
SELECT *全表扫描不会开启MapReduce作业,SELECT name, gender 会开启MapReduce作业查询想要的数据。(下面会介绍怎样不开启MapReduce作业)
nvl(A,B)函数:当A为空时取B
2、简单查询的Fetch Task功能
前面两种只能在本次连接中生效,要永久生效需要修改配置文件,修改如下图
二、在查询中使用过滤
1、where条件语法跟sql类似,如果需要查询含下划线_的记录,需要转义字符
2、使用explain查询sql的执行计划,阅读顺序:从下往上,从右往左
三、在查询中使用排序
1、order by语句进行排序:排序属于高级操作,一定开启mapreduce作业(及前面的Fetch Task功能设置对order by是无效的)
2、order by 后面可以跟: 列名, 列的表达式, 列的别名, 序号
设置排序编号:set hive.groupby.orderby.position.alias=true //默认为false
这篇关于走近大数据之Hive进阶(二、Hive的数据查询)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!