論文- Revenue Debugging in Advertising Systems

1-概述

該篇論文主題是廣告系統(tǒng)中針對廣告收入異常波動根本原因分析解阅;

提出的Adtributor算法主要是基于指標(biāo)期望值和實際值的分布悲立,計算其js散度询兴,找到影響指標(biāo)最大的維度及其維值集合苗傅。

此外谣蠢,論文也針對衍生指標(biāo)的根因分析方法做了討論(這塊沒有深入看)

2-問題&引入

針對一組維度(每個維度多個維值)下指標(biāo)滑潘,如數(shù)據(jù)中心垢乙、廣告商、終端設(shè)備這三個維度下的廣告收入语卤,如果某天廣告收入劇降50%(期望100追逮,實際收入50)酪刀,那么需要定位到到底是哪個維度下哪些維值導(dǎo)致的廣告收入的劇降---簡單理解為找到對廣告收入波動影響最大的因素(維度->維值);

如何找到引發(fā)廣告收入波動的主要因素钮孵,作者引入下面輔助概念/方法:

Boolean表達(dá)式

? ? ? 作者用一個boolean表達(dá)式量化表示出廣告收入的波動影響骂倘,針對上面三個分維度的廣告收入波動情況表中,可以表示為:

稻草人方法(strawman approach)

? ? ? 根因分析如何找到最優(yōu)解: 作者提出了一個稻草人方法(strawman approach):找出維度和該維度下一組元素巴席,其收入下降至少是總收入下降的閾值分?jǐn)?shù)TEP历涝,并且最簡潔。

explanatory power (EP)-解釋力

? ? ? 作者定義explanatory power (EP)-解釋力量化為它解釋度量變化的分?jǐn)?shù)漾唉。 我們將一組元素的簡潔性(P)量化為表達(dá)式中元素的總數(shù)荧库。 因此,稻草人將找到具有至少TEP的解釋力的表達(dá)式毡证,并且使用最少數(shù)量的元素。

由上面三個定義蔫仙,如果使用Occam剃刀原則-簡單有效原理--只要在一定誤差范圍下料睛,最簡潔的就是最好的解釋。針對上面三個boolean表達(dá)式摇邦,設(shè)置TEP閾值為90%恤煞,那僅數(shù)據(jù)中心下維值X就可以解釋總下降的94%;但是這種方法在存在多個維度時具有導(dǎo)致根的缺陷施籍,雖然數(shù)據(jù)中心X的收入下降占總收入下降的94%居扒,但預(yù)測和實際收入在兩個數(shù)據(jù)中心X和Y之間平均分配。數(shù)據(jù)中心X提供了94%的預(yù)測收入(94美元中的 100美元)和94%實際收入(50美元中的47美元)丑慎。 數(shù)據(jù)中心Y在兩個價值中貢獻(xiàn)了6%喜喂。 相比之下,在設(shè)備類型維度中竿裂,設(shè)備類型PC占預(yù)測收入的50%(100美元中的50美元)玉吁,但實際收入的98%(50美元中的49美元)。 移動和平板電腦類型的貢獻(xiàn)也有很大差異腻异,從預(yù)測收入的25%到實際收入的0%进副。 貢獻(xiàn)因廣告尺寸而異,但不如設(shè)備類型尺寸那么多悔常。

作者提出影斑,針對廣告收入根因分析可以拆解三塊:

對于維度,找到至少解釋度量變化的閾值分?jǐn)?shù)TEP的所有元素集(具有高解釋力)机打。

在每個維度的所有此類集合中矫户,找到該維度中最簡潔的集合。

對于所有維度的所有此類集合残邀,找到在貢獻(xiàn)變化方面最令人驚訝的集合吏垮。

3-算法核心

3-1 基礎(chǔ)定義和核心概念:

符號定義

Explanatory power

? ? ? EP:該維度i的維值j的實際波動占總體波動貢獻(xiàn)

EPij = (Aij(m) ? Fij )/(A(m) ? F (m))

Surprise

? ? ? 先計算每個維度的元素預(yù)期指標(biāo)占比分布和實際指標(biāo)占比分布:

獲取這兩個占比后障涯,一般是使用K-L散度來衡量兩個分布的差異,但是由于K-L散度非對稱且可能無界膳汪,所以使用JS散度來表示:

針對每個元素唯蝶,其surprise Sij這樣計算:

3-2 算法流程

其偽碼計算流程如圖:

算法使用了以下貪婪的啟發(fā)式算法,而不是枚舉具有至少TEP解釋力的各種最小基數(shù)子集遗嗽。在每個維度中粘我,在計算所有元素的surprise(第1-5行)之后,它首先按照surprise的順序?qū)υ剡M(jìn)行排序(第8行)痹换。然后征字,只要該元素至少解釋了總異常變化的TEEP(第12-15行),它就會將每個元素添加到候選集中娇豫。參數(shù)TEEP有助于控制集合的基數(shù)(奧卡姆剃刀)匙姜。例如,如果TEEP為10%且TEP為67%冯痢,我們最多可以有7個元素來解釋異常變化氮昧。此外,通過將suprise倒序排列浦楣,貪婪地尋求最大化候選集的suprise袖肥。 該算法每個維度最多添加一個候選集(第16-19行),只要該集合能夠解釋異常變化(解釋力)的大多數(shù)(TEP)振劳。 最后椎组,該算法按照其驚喜值對各種候選集進(jìn)行排序,并將前三個最令人滿意的候選集作為潛在的根本原因候選者返回(第21-22行)历恐。

算法最終輸出是Suprise的top3的元素集合(每個維度有一個Suprise)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末寸癌,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子弱贼,更是在濱河造成了極大的恐慌灵份,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,607評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件哮洽,死亡現(xiàn)場離奇詭異填渠,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)鸟辅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評論 3 395
  • 文/潘曉璐 我一進(jìn)店門氛什,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人匪凉,你說我怎么就攤上這事枪眉。” “怎么了再层?”我有些...
    開封第一講書人閱讀 164,960評論 0 355
  • 文/不壞的土叔 我叫張陵贸铜,是天一觀的道長堡纬。 經(jīng)常有香客問我,道長蒿秦,這世上最難降的妖魔是什么烤镐? 我笑而不...
    開封第一講書人閱讀 58,750評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮棍鳖,結(jié)果婚禮上炮叶,老公的妹妹穿的比我還像新娘。我一直安慰自己渡处,他們只是感情好镜悉,可當(dāng)我...
    茶點故事閱讀 67,764評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著医瘫,像睡著了一般侣肄。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上醇份,一...
    開封第一講書人閱讀 51,604評論 1 305
  • 那天稼锅,我揣著相機(jī)與錄音,去河邊找鬼被芳。 笑死缰贝,一個胖子當(dāng)著我的面吹牛馍悟,可吹牛的內(nèi)容都是我干的畔濒。 我是一名探鬼主播,決...
    沈念sama閱讀 40,347評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼锣咒,長吁一口氣:“原來是場噩夢啊……” “哼侵状!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起毅整,我...
    開封第一講書人閱讀 39,253評論 0 276
  • 序言:老撾萬榮一對情侶失蹤趣兄,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后悼嫉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體艇潭,經(jīng)...
    沈念sama閱讀 45,702評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,893評論 3 336
  • 正文 我和宋清朗相戀三年戏蔑,在試婚紗的時候發(fā)現(xiàn)自己被綠了蹋凝。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,015評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡总棵,死狀恐怖鳍寂,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情情龄,我是刑警寧澤迄汛,帶...
    沈念sama閱讀 35,734評論 5 346
  • 正文 年R本政府宣布捍壤,位于F島的核電站,受9級特大地震影響鞍爱,放射性物質(zhì)發(fā)生泄漏鹃觉。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,352評論 3 330
  • 文/蒙蒙 一硬霍、第九天 我趴在偏房一處隱蔽的房頂上張望帜慢。 院中可真熱鬧,春花似錦唯卖、人聲如沸粱玲。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,934評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽抽减。三九已至,卻和暖如春橄碾,著一層夾襖步出監(jiān)牢的瞬間卵沉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,052評論 1 270
  • 我被黑心中介騙來泰國打工法牲, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留史汗,地道東北人。 一個月前我還...
    沈念sama閱讀 48,216評論 3 371
  • 正文 我出身青樓拒垃,卻偏偏與公主長得像停撞,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子悼瓮,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,969評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 說真的 我喜歡你 心底認(rèn)真不服輸 潮汐懷念約定 多希望祝福 還在這里 該為右耳重新驕傲 受點悲歡離合 好讓每個呼吸...
    朵鹿閱讀 87評論 0 0
  • 黑夜戈毒,她一個人走在路上,沒有什么明確要去的地方横堡。路上大部分是出來遛彎兒的人埋市。在這個小城市,吃過晚飯命贴,基本上就沒有什...
    70e9b1e7db18閱讀 293評論 0 2
  • 自白 從前有一只小蝸牛胸蛛,它爬得很慢很慢污茵,它喜歡東張西望,喜歡停下來聽風(fēng)的聲音胚泌,喜歡吃果子省咨。它常常羨慕蝴蝶有美麗的翅...
    美少女曉露閱讀 394評論 2 7