UDF 函數(shù)特點: 一行進一行出曹抬。簡稱,一進一出
自定義UDF函數(shù)急鳄,根據(jù)傳入進來的key谤民,獲取對應的value值
UDTF 函數(shù)特點:多行進多行出 (解析事件字段)
1.自定義UDTF 函數(shù)使用
2.自定義UDTF 函數(shù),需要繼承GenericUDTF疾宏;重寫initalize();process();close();
process(); 輸入一條記錄张足,輸出若干條結果
initalize(); 該方法中,我們將指定輸出參數(shù)的名稱和參數(shù)類型:
close();當沒有記錄處理時該方法會被調用坎藐,關閉資源
將打包的jar包为牍,上傳到HDFS上,在hive中進行關聯(lián)岩馍,關聯(lián) Java class 創(chuàng)建永久函數(shù)
注意:如果修改了自定義函數(shù)重新生成jar包怎么處理碉咆?只需要替換HDFS路徑上的舊jar包,然后重啟 Hive客戶端即可