2015_ICSE_Online Defect Prediction on Imbanlanced Data

首先,我覺得我要吐槽下怔蚌,我覺得這篇文章有灌水嫌疑旁赊,先來看看文章中的新貢獻(xiàn):

1)首次使用了一個商業(yè)軟件 ,based on Cisco project终畅。并發(fā)現(xiàn)其他6個open source project的prediction performance更低,原因作者說是buggy rate too low芒炼,這就是imbalanced data的一個很好的點(diǎn)了术徊。

2)另一個創(chuàng)新是change-leve classification,這里說change leve是code committed to a single file子寓,我就有點(diǎn)疑問笋除,難道一次commit不會可能涉及到多個files么斜友?

3)驗(yàn)證了下垃它,cross-validation是會有higher false precision的,因?yàn)槠錄]有考慮到time sensitive的問題洛史,即我們不能用future knowledge來預(yù)測過去的change是否buggy酱吝。

4)對于imbalanced data,提出一個解決方案用resampling或者updatable來處理忆嗜,當(dāng)然最后結(jié)果也不是太好,我想知道捆毫,這個好像只是對dataset進(jìn)行擾動的過程,具體的分類方法用的啥來著响谓?沒仔細(xì)看省艳,沒發(fā)現(xiàn)作者說的。

5)最后跋炕,作者們搞出了幾個lessons learned律适,其中有一些,可能讓我覺得這不是是個人都覺得是根本不用在文中寫出來的么的結(jié)論纠修。幾個lessons就是:

classification的results需要actionable厂僧,讓developer convinced后然后去use它。然后一些模型的輸出結(jié)果颜屠,往往explanation的能力太差,即對結(jié)果進(jìn)行解釋密浑,有的完全沒有說服力粗井,比如這個code commit是Friday提交的所以是buggy的,這個雖然是model訓(xùn)練中重要的影響因素浇衬,但對developer理解相信結(jié)果毫無用處。最后就是要有新的技術(shù)來提高model prediction的precision無論是對balanced還是imbalanced痴脾。梳星。

好吧滚朵。有的東西還是有點(diǎn)用前域,不過我還是覺得它有點(diǎn)灌水的嫌疑。匿垄。。

以上漏峰!

zou @ NanChang

2015-07-16

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末届榄,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子靖苇,更是在濱河造成了極大的恐慌班缰,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,635評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件脾拆,死亡現(xiàn)場離奇詭異给梅,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)动羽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評論 3 399
  • 文/潘曉璐 我一進(jìn)店門运吓,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人拘哨,你說我怎么就攤上這事∥痛玻” “怎么了?”我有些...
    開封第一講書人閱讀 168,083評論 0 360
  • 文/不壞的土叔 我叫張陵踢步,是天一觀的道長丑掺。 經(jīng)常有香客問我,道長街州,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,640評論 1 296
  • 正文 為了忘掉前任鳍征,我火速辦了婚禮面徽,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘斗忌。我一直安慰自己旺聚,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,640評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著碱璃,像睡著了一般。 火紅的嫁衣襯著肌膚如雪肛真。 梳的紋絲不亂的頭發(fā)上爽航,一...
    開封第一講書人閱讀 52,262評論 1 308
  • 那天,我揣著相機(jī)與錄音讥珍,去河邊找鬼。 笑死趟卸,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的锄列。 我是一名探鬼主播,決...
    沈念sama閱讀 40,833評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼琼稻,長吁一口氣:“原來是場噩夢啊……” “哼饶囚!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起嘀掸,我...
    開封第一講書人閱讀 39,736評論 0 276
  • 序言:老撾萬榮一對情侶失蹤规惰,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后揩晴,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體贪磺,經(jīng)...
    沈念sama閱讀 46,280評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,369評論 3 340
  • 正文 我和宋清朗相戀三年劫映,在試婚紗的時候發(fā)現(xiàn)自己被綠了刹前。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,503評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡祖今,死狀恐怖轧飞,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情大渤,我是刑警寧澤,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布耕捞,位于F島的核電站,受9級特大地震影響俺抽,放射性物質(zhì)發(fā)生泄漏较曼。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,870評論 3 333
  • 文/蒙蒙 一弛饭、第九天 我趴在偏房一處隱蔽的房頂上張望萍歉。 院中可真熱鬧,春花似錦枪孩、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,340評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至蜕窿,卻和暖如春呆馁,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背浙滤。 一陣腳步聲響...
    開封第一講書人閱讀 33,460評論 1 272
  • 我被黑心中介騙來泰國打工纺腊, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留畔咧,地道東北人揖膜。 一個月前我還...
    沈念sama閱讀 48,909評論 3 376
  • 正文 我出身青樓壹粟,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子垦页,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,512評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 被貓痊焊、狗抓傷或咬傷后,要立即處理傷口薄啥。首先在傷口上方扎止血帶(可用手帕、繩索等代用)炭菌,防止或減少病毒隨血液流入全身...
    一米陽光l閱讀 208評論 0 0
  • 中秋本是季節(jié)定罪佳, 明月有幸受此榮。 陰晴圓缺賴天時黑低, 悲歡離合由心生赘艳。 共良霄,古今同克握, 醉與嬋娟舞酩酊蕾管。 笑看月...
    曹煥甫閱讀 248評論 4 2