貓幣黑市第二期——技術(shù)流程、特征工程

原創(chuàng)作品蛹磺,轉(zhuǎn)載請(qǐng)注明出處粟瞬。
關(guān)注公眾號(hào)「熱薯?xiàng)l」獲取更多精彩文章。

前言

上一期我們講到了萤捆,透過初步數(shù)據(jù)洞悉裙品,我們猜測(cè)可能存在這么一群人,構(gòu)成貓幣黑市并進(jìn)行交易俗或。那么接著最關(guān)鍵的問題就是市怎,我們?cè)撊绾瓮高^歷史行為數(shù)據(jù)精準(zhǔn)地找到這些黑產(chǎn)并將他們跟正常用戶區(qū)分開來(lái)呢?

這一期主要我們想介紹辛慰,如何利用原始數(shù)據(jù)区匠,經(jīng)過數(shù)據(jù)處理、特征工程后得到有用的特征帅腌,并且如何施加對(duì)業(yè)務(wù)上的理解和公式到特征中驰弄,得到最終總權(quán)重來(lái)為圖計(jì)算做準(zhǔn)備蝠筑。

流程

流程圖

技術(shù)流程圖

大數(shù)據(jù)和人工智能的核心就是數(shù)據(jù),有了數(shù)據(jù)我們才能深入挖掘每個(gè)用戶的行為特征揩懒,并進(jìn)行歸類。這里我們使用的歷史數(shù)據(jù)包含環(huán)境數(shù)據(jù)挽封、用戶行為數(shù)據(jù)以及用戶生產(chǎn)數(shù)據(jù)已球,基于口令紅包和車隊(duì)紅包等數(shù)據(jù)我們建構(gòu)一張基本的圖,接著使用用戶設(shè)備信息辅愿、IP信息智亮、昵稱相似度、彈幕相似度点待、搶紅包行為等進(jìn)行加權(quán)阔蛉,調(diào)整用戶之間聯(lián)系的強(qiáng)弱,最終得到一張完整的圖癞埠。

基于這些數(shù)據(jù)状原,通過數(shù)據(jù)計(jì)算平臺(tái)數(shù)據(jù)清洗、數(shù)據(jù)整理苗踪、特征提取颠区,通過圖計(jì)算平臺(tái)進(jìn)行社群挖掘算法實(shí)現(xiàn),就能夠找出不同用戶之間的相關(guān)性通铲,并提取重點(diǎn)群體進(jìn)行深入觀察毕莱、研究。

數(shù)據(jù)預(yù)處理

我們的目標(biāo)是盡可能得從原始數(shù)據(jù)上獲取有用的信息颅夺,一些原始數(shù)據(jù)本身往往不能直接作為模型的變量朋截。

在此對(duì)一些我們遇到的數(shù)據(jù)預(yù)處理工作進(jìn)行舉例。

從cookie中提取關(guān)鍵信息

由于后面需要用到用戶 pdft(設(shè)備號(hào))吧黄,rid(用戶)等相關(guān)信息部服,我們需要對(duì)cookie中的信息進(jìn)行提取:

cookie = 'R=r%3D14***********D,pdft=20180********************b,__guid=9*****.1*****.1***.****,pdftv1=****

使用正則表達(dá)式即可提取出關(guān)鍵信息:用戶 pdft稚字,rid

rid = 14******
pdft = 20180*******b

特征工程 (Feature Engineering)

數(shù)據(jù)和特征決定了上限饲宿,而一個(gè)好的模型只是逼近那個(gè)上限而已。

其他用戶之間的關(guān)系的維度

用戶忠誠(chéng)度參數(shù)

總權(quán)重

這樣加入到全局當(dāng)中胆描,即可求得所有用戶的總權(quán)重瘫想。

以上公式、模型中的權(quán)重昌讲、細(xì)節(jié)等只作為舉例指出国夜,實(shí)際操作中的公式由反復(fù)調(diào)參、迭代后得到短绸。

下期前瞻

得到權(quán)重后车吹,當(dāng)然就是畫出連通圖尋找社群關(guān)系了筹裕。下一期我們將重點(diǎn)介紹如何進(jìn)行繪圖,從連通圖中進(jìn)行社區(qū)發(fā)現(xiàn) (community detection)窄驹,社區(qū)發(fā)現(xiàn)不同算法的介紹朝卒,以及是如何運(yùn)用到我們的模型上找出紅包黑產(chǎn)的。

更多精彩推薦:

貓幣黑市第一期——通過大數(shù)據(jù)乐埠,機(jī)器學(xué)習(xí)揭露互聯(lián)網(wǎng)直播行業(yè)黑產(chǎn)

貓幣黑市第三期——圖計(jì)算抗斤、社區(qū)發(fā)現(xiàn)

貓幣黑市第四期——使用箱形圖判斷異常值

貓幣黑市第五期——貓幣黑市規(guī)模、甄別手段評(píng)估

原創(chuàng)作品丈咐,轉(zhuǎn)載請(qǐng)注明出處瑞眼。
關(guān)注公眾號(hào)「熱薯?xiàng)l」獲取更多精彩文章。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末棵逊,一起剝皮案震驚了整個(gè)濱河市伤疙,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌辆影,老刑警劉巖徒像,帶你破解...
    沈念sama閱讀 219,366評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異蛙讥,居然都是意外死亡厨姚,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門键菱,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)谬墙,“玉大人,你說我怎么就攤上這事经备∈锰В” “怎么了?”我有些...
    開封第一講書人閱讀 165,689評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵侵蒙,是天一觀的道長(zhǎng)造虎。 經(jīng)常有香客問我,道長(zhǎng)纷闺,這世上最難降的妖魔是什么算凿? 我笑而不...
    開封第一講書人閱讀 58,925評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮犁功,結(jié)果婚禮上氓轰,老公的妹妹穿的比我還像新娘。我一直安慰自己浸卦,他們只是感情好署鸡,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般靴庆。 火紅的嫁衣襯著肌膚如雪时捌。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,727評(píng)論 1 305
  • 那天炉抒,我揣著相機(jī)與錄音奢讨,去河邊找鬼。 笑死焰薄,一個(gè)胖子當(dāng)著我的面吹牛禽笑,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蛤奥,決...
    沈念sama閱讀 40,447評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼僚稿!你這毒婦竟也來(lái)了凡桥?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,349評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤蚀同,失蹤者是張志新(化名)和其女友劉穎缅刽,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蠢络,經(jīng)...
    沈念sama閱讀 45,820評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡衰猛,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了刹孔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片啡省。...
    茶點(diǎn)故事閱讀 40,127評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖髓霞,靈堂內(nèi)的尸體忽然破棺而出卦睹,到底是詐尸還是另有隱情,我是刑警寧澤方库,帶...
    沈念sama閱讀 35,812評(píng)論 5 346
  • 正文 年R本政府宣布结序,位于F島的核電站,受9級(jí)特大地震影響纵潦,放射性物質(zhì)發(fā)生泄漏徐鹤。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評(píng)論 3 331
  • 文/蒙蒙 一邀层、第九天 我趴在偏房一處隱蔽的房頂上張望返敬。 院中可真熱鬧,春花似錦寥院、人聲如沸救赐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)经磅。三九已至泌绣,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間预厌,已是汗流浹背阿迈。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留轧叽,地道東北人苗沧。 一個(gè)月前我還...
    沈念sama閱讀 48,388評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像炭晒,于是被迫代替她去往敵國(guó)和親待逞。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容