關于sample

2019年12月16日:

之前只是知道有一個算sample size的calculator(https://www.surveysystem.com/sscalc.htm#one

后面,看到了<Determining sample size for research activities>文章的時候石挂,才知道這個calculator計算的方式就是來自這篇論文拯腮。也算是有依據(jù)了琼懊。直接給了個table做ref削祈,不容易褪猛。再大的population size笑旺,也基本會在380+上收斂乌妙。是一個喜人的發(fā)現(xiàn)。只是盯荤,這個文章中的公示灼卢,怎么得來的(所引論文沒有下載到),想要知道特幔。


ICSE 2019:Software Documentation Issues Unveiled

這個里面sample的數(shù)量跟這個對上了遭赂,https://www.surveysystem.com/sscalc.htm

然后逆粹,第一次知道confidence level和confidence interval不是要加起來等于100?

想怎么sample就怎么sample么。瓮下。

需要check下迷捧。

原文如下:

2) Manual Classification of Documentation Issues: Once we collected the candidate artifacts, we manually analyzed a statistically significant sample ensuring a 99% confidence level ± 5%. This resulted in the selection of 665 artifacts for our manual analysis, out of the 805,939 artifacts collected from the four sources.?

Since the number of collected artifacts is substantially different between the four sources (Table II), we decided to randomly select the 665 artifacts by considering these proportions. A simple proportional selection would basically discard SO and mailing lists from our study, since issues and pull requests account for over 90% of our dataset. Indeed, this would result in the selection of 311 pull requests, 326 issues, 24 SO discussions and 6 mailing list threads.?

For this reason, we adopted the following sampling procedure: for SO and mailing lists, we targeted the analysis of 96 artifacts each, ensuring a 95% confidence level ± 10% within those two sources. For issues and pull requests, we adopted the proportional selection as explained above. This resulted in 829 artifacts to be manually analyzed (99% confidence ± 4.5%).

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末中符,一起剝皮案震驚了整個濱河市档插,隨后出現(xiàn)的幾起案子则剃,更是在濱河造成了極大的恐慌,老刑警劉巖窖剑,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件鹅颊,死亡現(xiàn)場離奇詭異涮俄,居然都是意外死亡苞尝,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門聊浅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事绞呈。” “怎么了圾亏?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵弄跌,是天一觀的道長。 經常有香客問我非竿,道長,這世上最難降的妖魔是什么韧骗? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任习蓬,我火速辦了婚禮浪规,結果婚禮上或听,老公的妹妹穿的比我還像新娘。我一直安慰自己笋婿,他們只是感情好誉裆,可當我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著缸濒,像睡著了一般足丢。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上庇配,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天斩跌,我揣著相機與錄音,去河邊找鬼捞慌。 笑死耀鸦,一個胖子當著我的面吹牛,可吹牛的內容都是我干的啸澡。 我是一名探鬼主播袖订,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼嗅虏!你這毒婦竟也來了著角?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤旋恼,失蹤者是張志新(化名)和其女友劉穎吏口,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體冰更,經...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡产徊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了蜀细。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片舟铜。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖奠衔,靈堂內的尸體忽然破棺而出谆刨,到底是詐尸還是另有隱情塘娶,我是刑警寧澤,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布痊夭,位于F島的核電站刁岸,受9級特大地震影響,放射性物質發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一滑凉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧酝碳,春花似錦、人聲如沸恨狈。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽禾怠。三九已至返奉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間刃宵,已是汗流浹背衡瓶。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留牲证,地道東北人哮针。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像坦袍,于是被迫代替她去往敵國和親十厢。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內容