復(fù)雜網(wǎng)絡(luò)的研究很多都離不開數(shù)據(jù)集,下面這些是個人在做科研的過程中在互聯(lián)網(wǎng)上搜集到的一些數(shù)據(jù)集網(wǎng)站筛婉,列舉出來也方便同行們?nèi)ナ褂谩#?018年12月14日更)
1入蛆、http://vladowiki.fmf.uni-lj.si/doku.php?id=pajek:data:urls:index
數(shù)據(jù)集網(wǎng)站集合。這個網(wǎng)站中列出來很多數(shù)據(jù)集網(wǎng)站枫甲,非常全扼褪,其中的很多網(wǎng)站數(shù)據(jù)描述詳細(xì),而且數(shù)據(jù)可以直接下載,大家可以從中選出一些網(wǎng)站收藏起來凳枝。
2隐砸、http://snap.stanford.edu/data/
這個是斯坦福大學(xué)的大型網(wǎng)絡(luò)數(shù)據(jù)集網(wǎng)站沸枯,大家應(yīng)該比較熟悉了橄教。
3刻伊、http://konect.uni-koblenz.de/
這個網(wǎng)站是我個人最喜歡也是最常用的網(wǎng)站,里面數(shù)據(jù)集有上百種捶箱,數(shù)據(jù)的分類和描述真的是特別詳細(xì)丁屎,而且還給出了數(shù)據(jù)集的可視化圖以及一些基本統(tǒng)計特性,所有數(shù)據(jù)均可以直接下載晨川。
4、http://networkrepository.com/index.php
這是另一個個人特別喜歡也是很常用的網(wǎng)站共虑,和上面一樣數(shù)據(jù)分類也是相當(dāng)?shù)脑敿?xì),而且數(shù)據(jù)都可以在線可視化叫搁,大家應(yīng)該能找到自己想要的數(shù)據(jù)。
5疾党、http://gdm.fudan.edu.cn/GDMWiki/Wiki.jsp?page=Network%20DataSet
這是復(fù)旦大學(xué)建立的網(wǎng)絡(luò)數(shù)據(jù)集網(wǎng)站惨奕,里面有一些常用數(shù)據(jù)集以及一些相關(guān)資源網(wǎng)站。
6雹洗、https://www.aminer.cn/data-sna#Twitter-Dynamic-Net
搞數(shù)據(jù)挖掘應(yīng)該都或多或少知道Aminer和唐杰时肿,這是Aminer上的一些社交網(wǎng)絡(luò)數(shù)據(jù)集港粱。
7、https://toreopsahl.com/datasets/
這個網(wǎng)站里面有十幾個數(shù)據(jù)集寸宏,包含社交網(wǎng)絡(luò)偿曙、交通網(wǎng)絡(luò)望忆、合作網(wǎng)絡(luò)等常用數(shù)據(jù)集。
8炭臭、http://netwiki.amath.unc.edu/SharedData/SharedData
這個網(wǎng)站列出了一些數(shù)據(jù)集以及一些復(fù)雜網(wǎng)絡(luò)大牛的個人數(shù)據(jù)網(wǎng)站鞋仍,大家可以去看看威创。
9、http://vlado.fmf.uni-lj.si/pub/networks/data/
這個是Pajek網(wǎng)站提供的數(shù)據(jù)集溃斋,里面的數(shù)據(jù)都很經(jīng)典吸申,復(fù)雜網(wǎng)絡(luò)早期研究中很多數(shù)據(jù)集都是源于這里。
10梳侨、http://socialcomputing.asu.edu/pages/datasets
社交網(wǎng)絡(luò)數(shù)據(jù)集走哺,里面包含國內(nèi)外一些常用在線社區(qū)網(wǎng)站的數(shù)據(jù)集,中型到大型的數(shù)據(jù)規(guī)模择示,搞社會計算的同行可能用的比較多晒旅。
11、http://www.sociopatterns.org/datasets/
另一個社交網(wǎng)絡(luò)數(shù)據(jù)集剪菱,這里面的數(shù)據(jù)集更多傾向于實體網(wǎng)絡(luò),比如聯(lián)系網(wǎng)旗们、高校朋友網(wǎng)、疾病傳播網(wǎng)岸梨。
12曹阔、http://www-personal.umich.edu/~mejn/netdata/
大牛Newman教授的個人數(shù)據(jù)網(wǎng)站隔披,里面的數(shù)據(jù)集特別是科學(xué)家合作網(wǎng)絡(luò)奢米,用到特別多鬓长。
以上是一些個人用到比較多的復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)網(wǎng)站,鑒于自己的了解有限涉波,可能對這些數(shù)據(jù)集網(wǎng)站給出的描述還不夠詳細(xì)炭序,而且很多單位都沒有列出來惭聂,敬請諒解。當(dāng)然了如果想用里面的數(shù)據(jù)集易遣,一定要記得引用數(shù)據(jù)集作者們的信息彼妻,他們收集數(shù)據(jù)并公開方便大家使用也是很不容易的。如果轉(zhuǎn)載本文豆茫,也請注明出處^_^.
補(bǔ)充說明:如果具備以下兩個技能侨歉,構(gòu)造復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)集將會變得簡單:
(1) 文本處理(尤其是正則表達(dá)式)。因為很多原始數(shù)據(jù)包含很多冗余信息揩魂,可以運(yùn)用文本處理來提取自己想要的關(guān)鍵信息幽邓,并在此基礎(chǔ)上構(gòu)造節(jié)點和連邊關(guān)系。
(2) 網(wǎng)絡(luò)爬蟲火脉。有時候從網(wǎng)絡(luò)上根本找不到想要的現(xiàn)成數(shù)據(jù)牵舵,這時可以運(yùn)用網(wǎng)絡(luò)爬蟲去爬取數(shù)據(jù)來構(gòu)造復(fù)雜網(wǎng)絡(luò)。
如果有補(bǔ)充信息也可以聯(lián)系我:hdevin@outlook.com