怎么說呢狈究,看到這個(gè)題目,能想到比較明顯的是又是挖SE中的數(shù)據(jù)建立開發(fā)者網(wǎng)絡(luò)了,然后題目中一個(gè)比較關(guān)鍵的也算是比較重要的詞就是verified。即這個(gè)research的結(jié)果是得到了現(xiàn)實(shí)世界的驗(yàn)證的秉馏。這個(gè)最起碼可靠性是很好的。很多研究得到的結(jié)論往往由于驗(yàn)證困難或者代價(jià)大都沒有verify這一塊脱羡。另外萝究,看本文的小標(biāo)題,F(xiàn)ine-Grained锉罐,那意思就是大方向的工作已經(jīng)有人做了帆竹,我的特色是什么呢,就是比你做的還細(xì)氓鄙,即更細(xì)粒度。文章也確實(shí)如此业舍,由原來的基于file-level的developer collaboration network(contrite to a common file)變成了function-level的network的挖掘抖拦。那你fine-grained有什么用呢,優(yōu)勢(shì)在哪兒舷暮,就肯定少不了對(duì)比态罪。
回到community的挖掘,即network創(chuàng)建出來后下面,就是用community detect 算法來發(fā)現(xiàn)其中的community了喲复颈。作者這里好像沒用傳統(tǒng)的方法,用的是OSLOM沥割,因?yàn)槠涮幚淼氖怯邢蚣訖?quán)圖耗啦。作者說沒人在這個(gè)有向加權(quán)圖上搞凿菩,這個(gè)是真的么?還搞了一大堆數(shù)學(xué)符號(hào)即一些概念用到的metrics等帜讲。這個(gè)就沒看了衅谷。花了很多篇幅來跟file-level做對(duì)比似将,最后得到的結(jié)論就是呀获黔,自己的function-level發(fā)現(xiàn)的community更好呀,也通過online survey那些發(fā)現(xiàn)的communities中的developer來驗(yàn)證其發(fā)現(xiàn)的額community確實(shí)就符號(hào)現(xiàn)實(shí)的community在验。好吧玷氏。你贏了。不過腋舌,也確實(shí)可能丟掉一些file-level的developer collaboration盏触。
話說,guthub侦厚,git用的也真是太火了耻陕。看的好幾篇文章都是直接從上面把大量數(shù)據(jù)搞下來刨沦。以后是不是也要努力從里面搞數(shù)據(jù)啊诗宣。
以上!
zou@Home
2015-07-19