數(shù)據(jù)挖掘(異常檢測(cè))——統(tǒng)計(jì)學(xué)方法之HBOS

DataWhale 組隊(duì)學(xué)習(xí) 2021.05 組隊(duì)學(xué)習(xí)系列筆記二

先上整體大綱

異常檢測(cè)--統(tǒng)計(jì)學(xué)方法大綱

HBOS流程:

  1. 為每個(gè)數(shù)據(jù)維度做出數(shù)據(jù)直方圖。對(duì)分類數(shù)據(jù)統(tǒng)計(jì)每個(gè)值的頻數(shù)并計(jì)算相對(duì)頻率。
  2. 對(duì)每個(gè)維度都計(jì)算一個(gè)獨(dú)立直方圖入挣,其中每個(gè)箱子的高度表示密度的估計(jì)。然后對(duì)直方圖進(jìn)行歸一化處理硝拧,使得每個(gè)箱子的最大高度為1径筏,確保每個(gè)特征的異常值得分的權(quán)重相等。

基本假設(shè)是數(shù)據(jù)集的各維度相互獨(dú)立障陶,對(duì)每個(gè)維度進(jìn)行區(qū)間劃分滋恬,計(jì)算區(qū)間密度,密度越高抱究,評(píng)分越低恢氯。

常用兩種作圖方式:1.固定的柱寬度。2.柱個(gè)數(shù)大致相同鼓寺,但導(dǎo)致不同的柱寬度勋拟。 當(dāng)有大量離群值的時(shí)候,第二種方法更強(qiáng)固妈候。

代碼示例:

from pyod.models import hbos
from pyod.utils.example import visualize 

clf = hbos.HBOS()    # 初始化HBOS模型敢靡,生成一個(gè)HBOS檢測(cè)器
clf.fit(X_train)    # 用fit()方法擬合數(shù)據(jù)
y_train_pred = clf.labels_    # 針對(duì)訓(xùn)練樣本預(yù)測(cè)其異常情況
y_train_socres = clf.decision_scores_    # 異常分?jǐn)?shù)
y_test_pred = clf.predict(X_test)  # 返回未知數(shù)據(jù)上的分類標(biāo)簽 (0: 正常值, 1: 異常值)
y_test_scores = clf.decision_function(X_test)  #  返回未知數(shù)據(jù)上的異常值 (分值越大越異常)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市苦银,隨后出現(xiàn)的幾起案子啸胧,更是在濱河造成了極大的恐慌,老刑警劉巖幔虏,帶你破解...
    沈念sama閱讀 217,185評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件纺念,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡想括,警方通過(guò)查閱死者的電腦和手機(jī)柠辞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)主胧,“玉大人叭首,你說(shuō)我怎么就攤上這事∽俣埃” “怎么了焙格?”我有些...
    開封第一講書人閱讀 163,524評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)夷都。 經(jīng)常有香客問(wèn)我眷唉,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,339評(píng)論 1 293
  • 正文 為了忘掉前任冬阳,我火速辦了婚禮蛤虐,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘肝陪。我一直安慰自己驳庭,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,387評(píng)論 6 391
  • 文/花漫 我一把揭開白布氯窍。 她就那樣靜靜地躺著饲常,像睡著了一般。 火紅的嫁衣襯著肌膚如雪狼讨。 梳的紋絲不亂的頭發(fā)上贝淤,一...
    開封第一講書人閱讀 51,287評(píng)論 1 301
  • 那天,我揣著相機(jī)與錄音政供,去河邊找鬼播聪。 笑死,一個(gè)胖子當(dāng)著我的面吹牛布隔,可吹牛的內(nèi)容都是我干的离陶。 我是一名探鬼主播,決...
    沈念sama閱讀 40,130評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼执泰,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼枕磁!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起术吝,我...
    開封第一講書人閱讀 38,985評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤计济,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后排苍,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體沦寂,經(jīng)...
    沈念sama閱讀 45,420評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,617評(píng)論 3 334
  • 正文 我和宋清朗相戀三年淘衙,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了传藏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,779評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡彤守,死狀恐怖毯侦,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情具垫,我是刑警寧澤侈离,帶...
    沈念sama閱讀 35,477評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站筝蚕,受9級(jí)特大地震影響卦碾,放射性物質(zhì)發(fā)生泄漏铺坞。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,088評(píng)論 3 328
  • 文/蒙蒙 一洲胖、第九天 我趴在偏房一處隱蔽的房頂上張望济榨。 院中可真熱鬧,春花似錦绿映、人聲如沸擒滑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)橘忱。三九已至赴魁,卻和暖如春卸奉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背颖御。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工榄棵, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人潘拱。 一個(gè)月前我還...
    沈念sama閱讀 47,876評(píng)論 2 370
  • 正文 我出身青樓疹鳄,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親芦岂。 傳聞我的和親對(duì)象是個(gè)殘疾皇子瘪弓,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,700評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容