Automatically learning semantic features for defect prediction

背景

  • 出處:2016 IEEE/ACM 38th IEEE International Conference on Software Engineering
  • 作者:Song Wang,Taiyue Liu and Lin Tan

概述

論文主要觀點

解析程序源代碼中的抽象語法樹(AST)院峡,利用深度置信網(wǎng)絡(luò)(DBN)從中抽取特征兴使,形成“語義特征”,利用這些特征進行軟件缺陷檢測照激。

成果

利用DBN從AST中抽取的語義特征在within-project和cross-project中均表現(xiàn)良好发魄。

方法模型#

相關(guān)工作圖

主要步驟

  1. 將源碼轉(zhuǎn)換成AST;
  2. 從AST中識別聲明節(jié)點俩垃、控制流節(jié)點等励幼,將其轉(zhuǎn)換成向量;
  3. 將向量中的元素映射成數(shù)字口柳,形成數(shù)字向量苹粟;
  4. 將向量送入DBN中進行特征提取(降維)跃闹,產(chǎn)生最終的“語義特征”嵌削;
  5. 如此形成帶標記的訓(xùn)練數(shù)據(jù),在訓(xùn)練數(shù)據(jù)上利用經(jīng)典分類器訓(xùn)練望艺。

實驗

  1. 為DBN選擇三個參數(shù):通過改變參數(shù)值不斷實驗得到最優(yōu)值苛秕;
  2. within-project:選擇同一個項目的兩個連續(xù)的版本,前一個作為訓(xùn)練數(shù)據(jù)找默,后一個作為測試數(shù)據(jù)艇劫。對比另外兩個特征;
  3. 對比不同的分類器惩激,均為經(jīng)典分類器店煞,樸素貝葉斯,邏輯回歸等咧欣;
  4. cross-project:兩個不同的項目浅缸,第一個用來訓(xùn)練,第二個用來測試魄咕。對比ACT+算法(使用經(jīng)典特征)衩椒;
  5. 測試算法的時間空間復(fù)雜度。

創(chuàng)新點

所謂的“語義特征”,用DBN處理AST毛萌,對raw數(shù)據(jù)進行了壓縮提純苟弛。

總結(jié)

優(yōu)點

“語義特征”的效果似乎非常好。

不足

對比的TCA+是作者自己實現(xiàn)的阁将,其效果不一定有原始的好膏秫,數(shù)據(jù)來源不太可靠。

我的想法

可否在分類器上再做些更好的選擇做盅?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末缤削,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子吹榴,更是在濱河造成了極大的恐慌亭敢,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,591評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件图筹,死亡現(xiàn)場離奇詭異帅刀,居然都是意外死亡,警方通過查閱死者的電腦和手機远剩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評論 3 392
  • 文/潘曉璐 我一進店門扣溺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人瓜晤,你說我怎么就攤上這事锥余。” “怎么了活鹰?”我有些...
    開封第一講書人閱讀 162,823評論 0 353
  • 文/不壞的土叔 我叫張陵哈恰,是天一觀的道長。 經(jīng)常有香客問我志群,道長,這世上最難降的妖魔是什么蛔钙? 我笑而不...
    開封第一講書人閱讀 58,204評論 1 292
  • 正文 為了忘掉前任锌云,我火速辦了婚禮,結(jié)果婚禮上吁脱,老公的妹妹穿的比我還像新娘桑涎。我一直安慰自己,他們只是感情好兼贡,可當我...
    茶點故事閱讀 67,228評論 6 388
  • 文/花漫 我一把揭開白布攻冷。 她就那樣靜靜地躺著,像睡著了一般遍希。 火紅的嫁衣襯著肌膚如雪等曼。 梳的紋絲不亂的頭發(fā)上颗搂,一...
    開封第一講書人閱讀 51,190評論 1 299
  • 那天特幔,我揣著相機與錄音,去河邊找鬼。 笑死比驻,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的捕捂。 我是一名探鬼主播窟勃,決...
    沈念sama閱讀 40,078評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼遥皂!你這毒婦竟也來了力喷?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,923評論 0 274
  • 序言:老撾萬榮一對情侶失蹤演训,失蹤者是張志新(化名)和其女友劉穎冗懦,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體仇祭,經(jīng)...
    沈念sama閱讀 45,334評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡披蕉,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,550評論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了乌奇。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片没讲。...
    茶點故事閱讀 39,727評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖礁苗,靈堂內(nèi)的尸體忽然破棺而出爬凑,到底是詐尸還是另有隱情,我是刑警寧澤试伙,帶...
    沈念sama閱讀 35,428評論 5 343
  • 正文 年R本政府宣布嘁信,位于F島的核電站,受9級特大地震影響疏叨,放射性物質(zhì)發(fā)生泄漏潘靖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,022評論 3 326
  • 文/蒙蒙 一蚤蔓、第九天 我趴在偏房一處隱蔽的房頂上張望卦溢。 院中可真熱鬧,春花似錦秀又、人聲如沸单寂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,672評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽宣决。三九已至,卻和暖如春昏苏,著一層夾襖步出監(jiān)牢的瞬間尊沸,已是汗流浹背威沫。 一陣腳步聲響...
    開封第一講書人閱讀 32,826評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留椒丧,地道東北人壹甥。 一個月前我還...
    沈念sama閱讀 47,734評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像壶熏,于是被迫代替她去往敵國和親句柠。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,619評論 2 354

推薦閱讀更多精彩內(nèi)容