ClickHouse 高階函數(shù)

先來一個完整的例子翎嫡,該示例根據(jù)行為日志計算用戶訪問的top路徑
select data, count(1) cn from (
with maxIf( c_t , cat='page_view'and act='頁面瀏覽') as max_time, -- 目標事件時間
arraySort(
e -> e.1,
arrayFilter(x->x.1<=toUInt64OrZero(max_time),groupArray((toUInt64OrZero(c_t), (cat,act) )))
) as sorted_array,
-- 按時間排序后的數(shù)據(jù)
-- arrayPushFront( sorted_array, sorted_array[1] ) as e_arr,
arrayFilter(
(i, e,z) -> z.1 < toUInt64OrZero(max_time)
and (e > 1800000 or (z.2.1='page_view' and z.2.2='頁面
瀏覽')),
arrayEnumerate(sorted_array), arrayDifference( sorted_array.1 ),sorted_array
) as arr_indx, -- 過濾目標事件、時間差后的數(shù)據(jù)
arrayReduce('max',arr_indx) +1 as smIndx,
arrayFilter(
(e,i) -> i>=smIndx and e.1<=toUInt64OrZero(max_time) ,
sorted_array, arrayEnumerate(sorted_array)
) as data_
select u_i,
arrayFilter((x,y,i)-> i=1 or i>1 and y<>0 ,data_.2,arrayDifference(arrayEnumerateDense(data_.2)),arrayEnumerate(data_)) as data__,
arraySlice(data__,-7,7 ) as data,
-- arrayStringConcat(data,'->') as path,
hasAll(data, [ ('page_view','頁面_瀏覽') ]) as has_way_point --路徑中必須經(jīng)過的點
from app.scene_tracker where c_p='PC' and length(u_i)>20
group by u_i having length(data)>1
) tab
where has_way_point=1 group by data order by cn desc limit 100

根據(jù)經(jīng)驗,大家如處理復(fù)雜業(yè)務(wù),這些函數(shù)會經(jīng)常用到

neighbor

  • 獲取某一列前后相鄰的數(shù)據(jù)欢搜,第二個參數(shù)控制前后相鄰的距離

  • 示例1:

SELECT a, neighbor( a,-1 ) from (SELECT arrayJoin( [1,2,3,6,34,3,11] ) as a,'u' as  b)  

arrayJoin

  • 行變列善已,對數(shù)組進行展開操作

  • 示例2:

# 還是上面的例子
SELECT a, neighbor( a,-1 ) from (SELECT arrayJoin( [1,2,3,6,34,3,11] ) as a,'u' as  b)  

arraySort

  • 對數(shù)組進行排序鹏氧,降序的話用這個 arrayReverseSort

  • 示例3:

# 還是上面的例子 略作修改,可對比示例1和示例3的結(jié)果區(qū)別
SELECT a, neighbor( a,-1 ) from (SELECT arrayJoin( arraySort([1,2,3,6,34,3,11]) ) as a,'u' as  b)  

arrayFilter

  • 過濾出數(shù)組中滿足條件的數(shù)據(jù)

  • 示例4:

# 我們只獲取數(shù)組中的偶數(shù)部分
SELECT a, neighbor( a,-1 ) from (SELECT arrayJoin( arraySort(arrayFilter(x->x%2=0, [1,2,3,6,34,3,11])) ) as a,'u' as  b)  

arrayEnumerate

  • 返回數(shù)組下標

  • 示例5:

SELECT arrayEnumerate( [1,2,3,6,34,3,11] )

arrayDifference

  • 計算數(shù)組中前后兩個值的差值部分

  • 示例6:

SELECT arrayDifference( [1,2,3,6,34,3,11] )

arrayReduce

  • 對數(shù)組進行聚合操作片吊,min 绽昏、max、avg 等

  • 示例7:

SELECT arrayReduce('avg', [1,2,3,6,34,3,11] )

arrayEnumerateDense

  • 標記出數(shù)組中相同的元素

  • 示例8:

SELECT arrayEnumerateDense( [1,2,3,6,34,3,11] )

arraySlice

  • 對數(shù)組進行切割 俏脊,后面兩個參數(shù)分別是切割的offset和切割長度
  • 示例9:
SELECT arraySlice( [1,2,3,6,34,3,11] , -3, 2)
# 返回:34 3

hasAny

  • 判斷數(shù)組中是否包含某些值全谤,包含其一返回1 ,否則0 爷贫;如果判斷全部包含 用hasAll
  • 示例10:
SELECT hasAny( [1,2,3,6,34,3,11] , [3,1])

arrayStringConcat

  • 將數(shù)組元素按照給定分隔符進行拼接啼县,返回拼接后的字符串
  • 示例11:
SELECT arrayStringConcat( [1,2,3,6,34,3,11] , '-') 

arrayPushFront

  • 向數(shù)組首位置最加value ;同理向數(shù)組末尾最加為arrayPushBack
  • 示例12:
SELECT arrayPushFront( [1,2,3,6,34,3,11] , 8)

arrayPopFront

  • 移除數(shù)組下標為1的值沸久;同理季眷,移除數(shù)組最后一個值用arrayPopBack
  • 示例13:
SELECT arrayPopFront( [1,2,3,6,34,3,11] ) 

arrayWithConstant

  • 生成一個指定長度的數(shù)組
  • 示例14:
#生成長度為3 的數(shù)組
SELECT arrayWithConstant( 3, 'a')
#范圍值為['a','a','a']

arrayUniq

  • 計算數(shù)組中有多少個不重復(fù)的值;如進行數(shù)組去重操作 用arrayDistinct
  • 示例15:
SELECT arrayUniq( [1,2,3,6,34,3,11]) 

runningDifference

  • 計算某一列前后數(shù)值的差值
  • 示例16:
select a,runningDifference(a)  from (SELECT arrayJoin( [1,2,3,6,34,3,11] ) as a,'u' as  b)

arrayCompact

  • 對數(shù)組內(nèi)數(shù)據(jù)實現(xiàn)相鄰去重
  • 示例17:
SELECT arrayCompact([1, 2, 2, 3, 2, 3, 3])
#返回值為 [1,2,3,2,3]        

arrayDistinct

  • 對數(shù)組去重
  • 示例18:
SELECT arrayDistinct(arrayConcat([1, 2], [3, 4], [4, 6]) ) AS res 
#返回值為 [1,2,3,4,6]  

開篇示例語句運行結(jié)果如下圖

image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末卷胯,一起剝皮案震驚了整個濱河市子刮,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌窑睁,老刑警劉巖挺峡,帶你破解...
    沈念sama閱讀 210,914評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異担钮,居然都是意外死亡橱赠,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,935評論 2 383
  • 文/潘曉璐 我一進店門箫津,熙熙樓的掌柜王于貴愁眉苦臉地迎上來狭姨,“玉大人,你說我怎么就攤上這事苏遥”模” “怎么了?”我有些...
    開封第一講書人閱讀 156,531評論 0 345
  • 文/不壞的土叔 我叫張陵田炭,是天一觀的道長师抄。 經(jīng)常有香客問我,道長教硫,這世上最難降的妖魔是什么叨吮? 我笑而不...
    開封第一講書人閱讀 56,309評論 1 282
  • 正文 為了忘掉前任辆布,我火速辦了婚禮,結(jié)果婚禮上茶鉴,老公的妹妹穿的比我還像新娘锋玲。我一直安慰自己,他們只是感情好蛤铜,可當我...
    茶點故事閱讀 65,381評論 5 384
  • 文/花漫 我一把揭開白布嫩絮。 她就那樣靜靜地躺著,像睡著了一般围肥。 火紅的嫁衣襯著肌膚如雪剿干。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,730評論 1 289
  • 那天穆刻,我揣著相機與錄音置尔,去河邊找鬼。 笑死氢伟,一個胖子當著我的面吹牛榜轿,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播朵锣,決...
    沈念sama閱讀 38,882評論 3 404
  • 文/蒼蘭香墨 我猛地睜開眼谬盐,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了诚些?” 一聲冷哼從身側(cè)響起飞傀,我...
    開封第一講書人閱讀 37,643評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎诬烹,沒想到半個月后砸烦,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,095評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡绞吁,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,448評論 2 325
  • 正文 我和宋清朗相戀三年幢痘,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片家破。...
    茶點故事閱讀 38,566評論 1 339
  • 序言:一個原本活蹦亂跳的男人離奇死亡颜说,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出员舵,到底是詐尸還是另有隱情脑沿,我是刑警寧澤,帶...
    沈念sama閱讀 34,253評論 4 328
  • 正文 年R本政府宣布马僻,位于F島的核電站,受9級特大地震影響注服,放射性物質(zhì)發(fā)生泄漏韭邓。R本人自食惡果不足惜措近,卻給世界環(huán)境...
    茶點故事閱讀 39,829評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望女淑。 院中可真熱鬧瞭郑,春花似錦、人聲如沸鸭你。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,715評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽袱巨。三九已至阁谆,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間愉老,已是汗流浹背场绿。 一陣腳步聲響...
    開封第一講書人閱讀 31,945評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留嫉入,地道東北人焰盗。 一個月前我還...
    沈念sama閱讀 46,248評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像咒林,于是被迫代替她去往敵國和親熬拒。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,440評論 2 348