Hive函數(shù)大全–完整版
現(xiàn)在雖然有很多SQL ON Hadoop的解決方案,像Spark SQL炸卑、Impala盖文、Presto等等,但就目前來看浑槽,在基于Hadoop的大數(shù)據(jù)分析平臺(tái)桐玻、數(shù)據(jù)倉庫中荆萤,Hive仍然是不可替代的角色链韭。盡管它的相應(yīng)延遲大,盡管它啟動(dòng)MapReduce的時(shí)間相當(dāng)長踊谋,但是它太方便殖蚕、功能太強(qiáng)大了沉迹,做離線批量計(jì)算、ad-hoc查詢甚至是實(shí)現(xiàn)數(shù)據(jù)挖掘算法蛤育,而且瓦糕,和HBase进宝、Spark都能整合使用党晋。
如果你是做大數(shù)據(jù)分析平臺(tái)和數(shù)據(jù)倉庫相關(guān)的未玻,就目前來說扳剿,我建議,Hive是必須的锡搜。
很早之前整理過Hive的函數(shù)耕餐,不過是基于0.7版本的辟狈,這兩天抽時(shí)間更新了下,基于Hive0.13明未,比之前的完整了許多趟妥。
整理成文檔煮纵,希望能給Hive初學(xué)者和Hive使用者有所幫助偏螺。Hive自帶的UDF函數(shù)非常多,整理出來有40多頁酿联。下載地址在文章最后面贞让。
如果該文檔對(duì)你的學(xué)習(xí)和工作有所幫助喳张,那么請(qǐng)多多支持我的博客美澳。
Hive函數(shù)大全 目錄:
一摸航、關(guān)系運(yùn)算:
- 等值比較: =
- 等值比較:<=>
- 不等值比較: <>和!=
- 小于比較: <
- 小于等于比較: <=
- 大于比較: >
- 大于等于比較: >=
- 區(qū)間比較
- 空值判斷: IS NULL
- 非空判斷: IS NOT NULL
- LIKE比較: LIKE
- JAVA的LIKE操作: RLIKE
- REGEXP操作: REGEXP
二酱虎、數(shù)學(xué)運(yùn)算: - 加法操作: +
- 減法操作: –
- 乘法操作: *
- 除法操作: /
- 取余操作: %
- 位與操作: &
- 位或操作: |
- 位異或操作: ^
9.位取反操作: ~
三读串、邏輯運(yùn)算: - 邏輯與操作: AND 恢暖、&&
- 邏輯或操作: OR 杰捂、||
- 邏輯非操作: NOT挟阻、!
四附鸽、復(fù)合類型構(gòu)造函數(shù) - map結(jié)構(gòu)
- struct結(jié)構(gòu)
- named_struct結(jié)構(gòu)
- array結(jié)構(gòu)
- create_union
五、復(fù)合類型操作符 - 獲取array中的元素
- 獲取map中的元素
- 獲取struct中的元素
六熄浓、數(shù)值計(jì)算函數(shù) - 取整函數(shù): round
- 指定精度取整函數(shù): round
- 向下取整函數(shù): floor
- 向上取整函數(shù): ceil
- 向上取整函數(shù): ceiling
- 取隨機(jī)數(shù)函數(shù): rand
- 自然指數(shù)函數(shù): exp
- 以10為底對(duì)數(shù)函數(shù): log10
- 以2為底對(duì)數(shù)函數(shù): log2
- 對(duì)數(shù)函數(shù): log
- 冪運(yùn)算函數(shù): pow
- 冪運(yùn)算函數(shù): power
- 開平方函數(shù): sqrt
- 二進(jìn)制函數(shù): bin
- 十六進(jìn)制函數(shù): hex
- 反轉(zhuǎn)十六進(jìn)制函數(shù): unhex
- 進(jìn)制轉(zhuǎn)換函數(shù): conv
- 絕對(duì)值函數(shù): abs
- 正取余函數(shù): pmod
- 正弦函數(shù): sin
- 反正弦函數(shù): asin
- 余弦函數(shù): cos
- 反余弦函數(shù): acos
- positive函數(shù): positive
- negative函數(shù): negative
七赌蔑、集合操作函數(shù) - map類型大型薰摺:size
- array類型大兄呵场:size
- 判斷元素?cái)?shù)組是否包含元素:array_contains
- 獲取map中所有value集合
- 獲取map中所有key集合
- 數(shù)組排序
八皿哨、類型轉(zhuǎn)換函數(shù) - 二進(jìn)制轉(zhuǎn)換:binary
- 基礎(chǔ)類型之間強(qiáng)制轉(zhuǎn)換:cast
九纽谒、日期函數(shù) - UNIX時(shí)間戳轉(zhuǎn)日期函數(shù): from_unixtime
- 獲取當(dāng)前UNIX時(shí)間戳函數(shù): unix_timestamp
- 日期轉(zhuǎn)UNIX時(shí)間戳函數(shù): unix_timestamp
- 指定格式日期轉(zhuǎn)UNIX時(shí)間戳函數(shù): unix_timestamp
- 日期時(shí)間轉(zhuǎn)日期函數(shù): to_date
- 日期轉(zhuǎn)年函數(shù): year
- 日期轉(zhuǎn)月函數(shù): month
- 日期轉(zhuǎn)天函數(shù): day
- 日期轉(zhuǎn)小時(shí)函數(shù): hour
- 日期轉(zhuǎn)分鐘函數(shù): minute
- 日期轉(zhuǎn)秒函數(shù): second
- 日期轉(zhuǎn)周函數(shù): weekofyear
- 日期比較函數(shù): datediff
- 日期增加函數(shù): date_add
- 日期減少函數(shù): date_sub
十鼓黔、條件函數(shù) - If函數(shù): if
- 非空查找函數(shù): COALESCE
- 條件判斷函數(shù):CASE
- 條件判斷函數(shù):CASE
十一、字符串函數(shù) - 字符ascii碼函數(shù):ascii
- base64字符串
- 字符串連接函數(shù):concat
- 帶分隔符字符串連接函數(shù):concat_ws
- 數(shù)組轉(zhuǎn)換成字符串的函數(shù):concat_ws
- 小數(shù)位格式化成字符串函數(shù):format_number
- 字符串截取函數(shù):substr,substring
- 字符串截取函數(shù):substr,substring
- 字符串查找函數(shù):instr
- 字符串長度函數(shù):length
- 字符串查找函數(shù):locate
- 字符串格式化函數(shù):printf
- 字符串轉(zhuǎn)換成map函數(shù):str_to_map
- base64解碼函數(shù):unbase64(string str)
- 字符串轉(zhuǎn)大寫函數(shù):upper,ucase
- 字符串轉(zhuǎn)小寫函數(shù):lower,lcase
- 去空格函數(shù):trim
- 左邊去空格函數(shù):ltrim
- 右邊去空格函數(shù):rtrim
- 正則表達(dá)式替換函數(shù):regexp_replace
- 正則表達(dá)式解析函數(shù):regexp_extract
- URL解析函數(shù):parse_url
- json解析函數(shù):get_json_object
- 空格字符串函數(shù):space
- 重復(fù)字符串函數(shù):repeat
- 左補(bǔ)足函數(shù):lpad
- 右補(bǔ)足函數(shù):rpad
- 分割字符串函數(shù): split
- 集合查找函數(shù): find_in_set
- 分詞函數(shù):sentences
- 分詞后統(tǒng)計(jì)一起出現(xiàn)頻次最高的TOP-K
- 分詞后統(tǒng)計(jì)與指定單詞一起出現(xiàn)頻次最高的TOP-K
十二脖祈、混合函數(shù) - 調(diào)用Java函數(shù):java_method
- 調(diào)用Java函數(shù):reflect
- 字符串的hash值:hash
十三刷晋、XPath解析XML函數(shù) - xpath
- xpath_string
- xpath_boolean
- xpath_short, xpath_int, xpath_long
- xpath_float, xpath_double, xpath_number
十四眼虱、匯總統(tǒng)計(jì)函數(shù)(UDAF) - 個(gè)數(shù)統(tǒng)計(jì)函數(shù): count
- 總和統(tǒng)計(jì)函數(shù): sum
- 平均值統(tǒng)計(jì)函數(shù): avg
- 最小值統(tǒng)計(jì)函數(shù): min
- 最大值統(tǒng)計(jì)函數(shù): max
- 非空集合總體變量函數(shù): var_pop
- 非空集合樣本變量函數(shù): var_samp
- 總體標(biāo)準(zhǔn)偏離函數(shù): stddev_pop
- 樣本標(biāo)準(zhǔn)偏離函數(shù): stddev_samp
10.中位數(shù)函數(shù): percentile - 中位數(shù)函數(shù): percentile
- 近似中位數(shù)函數(shù): percentile_approx
- 近似中位數(shù)函數(shù): percentile_approx
- 直方圖: histogram_numeric
- 集合去重?cái)?shù):collect_set
- 集合不去重函數(shù):collect_list
十五捏悬、表格生成函數(shù)Table-Generating Functions (UDTF) - 數(shù)組拆分成多行:explode
- Map拆分成多行:explode
下載地址:
鏈接: https://pan.baidu.com/s/1i6n0xGL
密碼: 48s7