走近大数据之Hive进阶(三、Hive的内置函数)

2024-06-16 00:18

本文主要是介绍走近大数据之Hive进阶(三、Hive的内置函数),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一、Hive数学函数

二、Hive字符函数

三、Hive收集函数和转换函数

四、Hive日期函数

五、Hive条件函数

六、Hive聚合函数和表生成函数


一、Hive数学函数

round 四舍五入 前面是小数,后面是取整位数

ceil 向上取整

floor 向下取整

二、Hive字符函数

字符串转换成小写:lower

字符串转换成大写:upper

>select lower('Hello World'), upper('Hello Hive'); 

字符串长度(字符数):length

>select length('Hello World'), length('你好'); //'你好'的字符数为2,字节数为4

拼接字符串:concat

>select concat('Hello', ' World');

求字符串的子串:substr

//substr(a, b)从a中第b位开始取,取右边所有字符

>select substr('Hello World', 3);

//substr(a, b, c) 从a中,第b位开始取,取c个字符

>select substr('Hello World', 3, 4);

去掉字符串前后的空格:trim

左填充:lpad

右填充:rpad

>select lpad('abcd', 10, '*'); //表示用*左填充'abcd'到10位

>select rpad('abcd', 10, '*'); //表示用*右填充'abcd'到10位

运行结果:

三、Hive收集函数和转换函数

收集函数 size 统计数据类型的长度

转换函数 cast 数据类型的转换

四、Hive日期函数

to_date 返回标准日期

year 返回日期中的年

month 返回日期中的月

day 返回日期中的天

weekofyear 返回该日期在一年中的第几周

datediff 返回两个日期的相差的天数

date_add 在当前日期的基础上,加上天数,并返回

date_sub 在当前日期的基础上,减去天数,并返回

五、Hive条件函数

从左到右返回第一个不为null的值:coalesce

条件表达式:case...when...

CASE a WHEN b THEN c [WHEN d THEN e]* [ELSE f] END

//如果a的值等于b时返回c,如果等于d返回e,等等等等,最后如果都不是返回f

六、Hive聚合函数和表生成函数

1、聚合函数

count 求总数

sum 求和

min 求最小值

max 求最大值

avg 求平均值

select count(*), sum(sal), max(sal), min(sal), avg(sal) ;

2、表生成函数

表生成函数 -explode 将每个key-value数据都转换成一行 

select explode(map(1,'tom',2,'mary',3,'mike'));

Result: ----------- 

1 Tom 

2 Mary 

3 Mike

这篇关于走近大数据之Hive进阶(三、Hive的内置函数)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1064994

相关文章

Spring Boot + MyBatis Plus 高效开发实战从入门到进阶优化(推荐)

《SpringBoot+MyBatisPlus高效开发实战从入门到进阶优化(推荐)》本文将详细介绍SpringBoot+MyBatisPlus的完整开发流程,并深入剖析分页查询、批量操作、动... 目录Spring Boot + MyBATis Plus 高效开发实战:从入门到进阶优化1. MyBatis

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Android Kotlin 高阶函数详解及其在协程中的应用小结

《AndroidKotlin高阶函数详解及其在协程中的应用小结》高阶函数是Kotlin中的一个重要特性,它能够将函数作为一等公民(First-ClassCitizen),使得代码更加简洁、灵活和可... 目录1. 引言2. 什么是高阶函数?3. 高阶函数的基础用法3.1 传递函数作为参数3.2 Lambda

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

C++中::SHCreateDirectoryEx函数使用方法

《C++中::SHCreateDirectoryEx函数使用方法》::SHCreateDirectoryEx用于创建多级目录,类似于mkdir-p命令,本文主要介绍了C++中::SHCreateDir... 目录1. 函数原型与依赖项2. 基本使用示例示例 1:创建单层目录示例 2:创建多级目录3. 关键注

SpringBoot整合jasypt实现重要数据加密

《SpringBoot整合jasypt实现重要数据加密》Jasypt是一个专注于简化Java加密操作的开源工具,:本文主要介绍详细介绍了如何使用jasypt实现重要数据加密,感兴趣的小伙伴可... 目录jasypt简介 jasypt的优点SpringBoot使用jasypt创建mapper接口配置文件加密