//6.创建一个数据集可以是pojo也可以是map,推荐使用map
//6.创建一个数据集可以是pojo也可以是map,推荐使用map
按照printf风格格式输出字苻串 |
抽取字符串subject中符合正则表达式pattern的第index个部分的子字符串注意些预定义字符的使用,如第二个参数如果使用’\s’将被匹配到s,’\\s’才是匹配空格 |
* 实现按分组中元素的出现次数降序排序并将每个元素的在分组中的出现次数也一起返回,格式为:[data1, num1, data2, num2, ...]
操作一个数据行产生多个数據行一个表作为输出。
示例: 将字符串(key1:20;key2:30;key3:40)按照分好拆分行按照冒号拆分列进行展示 * 2. UDTF首先会调用initialize方法,此方法返回UDTF的返回行的信息(返回个数类型)。 * 3. 初始化完成后会调用process方法,真正的处理过程在process函数中,在process中每一次forward()调用产生一行; * 如果产生多列可以将多个列的值放在一个数组中,然后将该数组传入到forward()函数 * 4. 最后close()方法调用,对需要清理的方法进行清理 * 5. 代码实例,实现的功能比较简单将字符串(key1:20;key2:30;key3:40)按照分好拆分行按照冒号拆分列进行展示。 * 返回UDTF的返回行的信息(返回个数类型) * 每一次forward()调用产生一行;如果产生多列可以将多个列嘚值放在一个数组中,然后将该数组传入到forward()函数9.6.5 添加自定义函数的jar文件
|