第一个Hive UDAF函数

2024-01-27 09:18

文章标签 函数第一个 hive udaf

本文主要是介绍第一个Hive UDAF函数，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

hive提供了org.apache.hadoop.hive.ql.exec.UDF类和org.apache.hadoop.hive.ql.exec.UDAF类，我们可以通过继承这个类来实现不同功能的函数，在脚本中很方便的调用它。

第一步，在eclipse中创建一个java项目，命名为ConnectGroup

第二步，导入UDAF需要的jar包，hive-exec-???.jar（或者用find / -name hive-exec-*查找机器上hive对应的包，例如hive-exec-0.9.0.jar）

第三步，建一个新类，命名为ConnectGroup，源代码：http://blog.csdn.net/sptoor/article/details/10172757

第四步，将这个java文件打包成java jar，eclipse中选择该文件点击右键选择"export"，选择好jar包的保存路径。注意，不要选“runnable jar file”。

第五步，将打好的jar包上传到hive机器上。

此时自定义UDF函数就完成了，下面需要把它加入到hive的环境中去

第六步，进入自己的hive环境，输入命令add jar ConnectGroup.jar
hive> add jar /root/test_hive/ConnectGroup.jar;

第七步，创建一个临时函数，名称自定义（给自定义的UDF取个名），as后面是jar包保存的类的名称
hive>create temporary function ConnectGroup as 'ConnectGroup';

第八步，使用这个函数
hive> select ConnectGroup(name) from text_table;

另：如果要删除这个函数：drop temporary function ConnectGroup;

这篇关于第一个Hive UDAF函数的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/649776。 23002807@qq.com

相关文章

pandas使用apply函数给表格同时添加多列

pandas使用apply函数给表格同时添加多列

《pandas使用apply函数给表格同时添加多列》本文介绍了利用Pandas的apply函数在DataFrame中同时添加多列,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习... 目录一、Pandas使用apply函数给表格同时添加多列二、应用示例一、Pandas使用apply函

阅读更多...

Python中Namespace()函数详解

Python中Namespace()函数详解

《Python中Namespace()函数详解》Namespace是argparse模块提供的一个类,用于创建命名空间对象,它允许通过点操作符访问数据,比字典更易读,在深度学习项目中常用于加载配置、命... 目录1. 为什么使用 Namespace？2. Namespace 的本质是什么？3. Namesp

阅读更多...

MySQL中如何求平均值常见实例(AVG函数详解)

MySQL中如何求平均值常见实例(AVG函数详解)

《MySQL中如何求平均值常见实例(AVG函数详解)》MySQLavg()是一个聚合函数,用于返回各种记录中表达式的平均值,：本文主要介绍MySQL中用AVG函数如何求平均值的相关资料,文中通过代... 目录前言一、基本语法二、示例讲解1. 计算全表平均分2. 计算某门课程的平均分（例如：Math）三、结合

阅读更多...

Python函数作用域与闭包举例深度解析

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,：本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1：访问全局变量示例2：访问外层函数变量2. 闭包基础示例3：简单闭包示例4

阅读更多...

Python中isinstance()函数原理解释及详细用法示例

Python中isinstance()函数原理解释及详细用法示例

《Python中isinstance()函数原理解释及详细用法示例》isinstance()是Python内置的一个非常有用的函数,用于检查一个对象是否属于指定的类型或类型元组中的某一个类型,它是Py... 目录python中isinstance()函数原理解释及详细用法指南一、isinstance()函数

阅读更多...

python中的高阶函数示例详解

python中的高阶函数示例详解

《python中的高阶函数示例详解》在Python中,高阶函数是指接受函数作为参数或返回函数作为结果的函数,下面：本文主要介绍python中高阶函数的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录1.定义2.map函数3.filter函数4.reduce函数5.sorted函数6.自定义高阶函数

阅读更多...

Python中的sort方法、sorted函数与lambda表达式及用法详解

Python中的sort方法、sorted函数与lambda表达式及用法详解

《Python中的sort方法、sorted函数与lambda表达式及用法详解》文章对比了Python中list.sort()与sorted()函数的区别,指出sort()原地排序返回None,sor... 目录1. sort()方法1.1 sort()方法1.2 基本语法和参数A. reverse参数B.

阅读更多...

Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧

Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧

《Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧》本文将通过实际代码示例,深入讲解Python函数的基本用法、返回值特性、全局变量修改以及异常处理技巧,感兴趣的朋友跟随小编一起看看... 目录一、python函数定义与调用1.1 基本函数定义1.2 函数调用二、函数返回值详解2.1 有返

阅读更多...

Python Excel 通用筛选函数的实现

Python Excel 通用筛选函数的实现

《PythonExcel通用筛选函数的实现》本文主要介绍了PythonExcel通用筛选函数的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录案例目的示例数据假定数据来源是字典优化：通用CSV数据处理函数使用说明使用示例注意事项案例目的第一

阅读更多...

C++统计函数执行时间的最佳实践

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

阅读更多...