基于UDAF执行的转换的不同在不同階段的返回值类型也可能是不同的。
在写UDAF的时候一定要注意内存使用的问题通过配置参数mapred.child.java.opts可以调整执行过程的内存需求量,但是这种方式并非总是奏效:
接下来我们创建数据集文件afile.txt
函数concat_ws()的第1个参数是个分隔符其他的参数可以是字符串或者字符串数组,返回值按照指定分隔苻将所有字符串拼接在一起后的字符
例如:我们使用逗号将一组字符串拼接成一个字符串:
注意:create function语句中的temporary关键字当前会话中声明的函數只会在当前会话有效。因此用户需要在每个会话中都增加Jar然后创建函数不过,如果用户频繁的使用同一个Jar文件和函数的话可以将相關的语句增加到$HOME/.hiverc文件中。