本文主要是介绍Hive UDF使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
UDF:用户自定义函数,在java中写函数,打成jar,在hive中添加jar,在hql中使用该函数,
UDF函数开发
标准函数(UDF):以一行数据中的一列或者多列数据作为参数然后返回解雇欧式一个值的函数,同样也可以返回一个复杂的对象,例如array,map,struct。
聚合函数(UDAF):接受从零行到多行的零个到多个列,然后返回单一值。例如sum函数。
生成函数(UDTF):接受零个或者多个输入,然后产生多列或者多行输出。
udf函数开发
当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数,用户自定义函数(user defined function),针对单条记录。编写一个UDF,需要继承UDF类,并定义evaluate()函数。在查询执行过程中,查询中对应的每个应用到这个函数的地方都会对这个类进行实例化。对于每行输入都会调用到evaluate()函数。而evaluate()函数处理的值会返回给Hive。(evaluate方法是自己定义的,不是重载的UDF的方法,UDF类中没这个方法,更不是实现,因为UDF是类不是接口)
一:
package com;import org.apache.hadoop.hive.ql.exec.UDF;/*** <p>Title: </p>* <p&g
这篇关于Hive UDF使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!