各領(lǐng)域公開數(shù)據(jù)集下載

轉(zhuǎn)自:https://zhuanlan.zhihu.com/p/25138563
金融
美國勞工部統(tǒng)計局官方發(fā)布數(shù)據(jù)
上證A股日線數(shù)據(jù),1999.12.09 至 2016.06.08田炭,前復權(quán)师抄,1095支股票
深證A股日線數(shù)據(jù)漓柑,1999.12.09 至 2016.06.08教硫,前復權(quán),1766支股票
深證創(chuàng)業(yè)板日線數(shù)據(jù)辆布,1999.12.09 至 2016.06.08瞬矩,前復權(quán),510支股票
MT4平臺外匯交易歷史數(shù)據(jù)
Forex平臺外匯交易歷史數(shù)據(jù)
幾組外匯交易逐筆(Ticks)數(shù)據(jù)
美國股票新聞數(shù)據(jù)【Kaggle數(shù)據(jù)
美國醫(yī)療保險市場數(shù)據(jù)【Kaggle數(shù)據(jù)
美國金融客戶投訴數(shù)據(jù)【Kaggle數(shù)據(jù)】
Lending Club 網(wǎng)貸違約數(shù)據(jù)【Kaggle數(shù)據(jù)】
信用卡欺詐數(shù)據(jù)【Kaggle 數(shù)據(jù)】
某個金融產(chǎn)品實時交易數(shù)據(jù)【Kaggle數(shù)據(jù)】
美國股票數(shù)據(jù)XBRL【Kaggle數(shù)據(jù)】
紐約股票交易所數(shù)據(jù)【Kaggle數(shù)據(jù)】

交通
2013年紐約出租車行駛數(shù)據(jù)
Udacity自動駕駛數(shù)據(jù)
紐約 Uber 接客數(shù)據(jù) 【Kaggle數(shù)據(jù)
英國車禍數(shù)據(jù)(2005-2015)【Kaagle數(shù)據(jù)】
芝加哥汽車超速數(shù)據(jù)【Kaggle數(shù)據(jù)】
KITTI 自動駕駛?cè)蝿諗?shù)據(jù)【數(shù)據(jù)太大僅有一部分】
Cityscapes 場景標注數(shù)據(jù)【數(shù)據(jù)太大僅有介紹】

商業(yè)
Amazon 食品評論數(shù)據(jù)【Kaggle數(shù)據(jù)】
Amazon 無鎖手機評論數(shù)據(jù)【Kaggle數(shù)據(jù)】
美國視頻游戲銷售和評價數(shù)據(jù)【Kaggle數(shù)據(jù)】
Kaggle 各項競賽情況數(shù)據(jù)【Kaggle數(shù)據(jù)】
Airbnb 開放的民宿信息和住客評論數(shù)據(jù)

推薦系統(tǒng)
Netflix 電影評價數(shù)據(jù)
MovieLens 20m 電影推薦數(shù)據(jù)集
WikiLens
Jester
HetRec2011
Book Crossing
Large Movie Review
Retailrocket 商品評論和推薦數(shù)據(jù)

醫(yī)療健康
人識別物體時大腦核磁共振影像數(shù)據(jù)
人理解單詞時大腦核磁共振影像數(shù)據(jù)
心臟病心房圖像及標注數(shù)據(jù)
細胞病理識別
FIRE 視網(wǎng)膜眼底病變圖像數(shù)據(jù)
食物營養(yǎng)成分數(shù)據(jù) 【Kaggle數(shù)據(jù)】
EGG 大腦電波形狀數(shù)據(jù)【Kaggle數(shù)據(jù)】
某人基因序列數(shù)據(jù)【Kaggle數(shù)據(jù)】
癌癥CT影像數(shù)據(jù)【Kaggle數(shù)據(jù)】
軟組織肉瘤CT圖像數(shù)據(jù)【Kaggle數(shù)據(jù)】
美國國家健康與服務部-國家癌癥研究所發(fā)起的癌癥數(shù)據(jù)倉庫介紹【僅有介紹】
Data Science Bowl 2017 肺癌識別競賽數(shù)據(jù)【數(shù)據(jù)太大僅有介紹】
TCGA-LUAD 肺癌CT圖像數(shù)據(jù)
RAID 肺癌CT圖像數(shù)據(jù)

圖像數(shù)據(jù)
綜合圖像
Visual Genome 圖像數(shù)據(jù)
Visual7w 圖像數(shù)據(jù)
COCO 圖像數(shù)據(jù)
SUFR 圖像數(shù)據(jù)
ILSVRC 2014 訓練數(shù)據(jù)(ImageNet的一部分)
PASCAL Visual Object Classes 2012 圖像數(shù)據(jù)
PASCAL Visual Object Classes 2011 圖像數(shù)據(jù)
PASCAL Visual Object Classes 2010 圖像數(shù)據(jù)
80 Million Tiny Image 圖像數(shù)據(jù)【數(shù)據(jù)太大僅有介紹】
ImageNet【數(shù)據(jù)太大僅有介紹】
Google Open Images【數(shù)據(jù)太大僅有介紹】

場景圖像
Street Scences 圖像數(shù)據(jù)
Places2 場景圖像數(shù)據(jù)
UCF Google Street View 圖像數(shù)據(jù)
SUN 場景圖像數(shù)據(jù)
The Celebrity in Places 圖像數(shù)據(jù)

Web標簽圖像
HARRISON 社交標簽圖像
NUS-WIDE 標簽圖像
Visual Synset 標簽圖像
Animals With Attributes 標簽圖像

人形輪廓圖像
MPII Human Shape人體輪廓數(shù)據(jù)
Biwi Kinect Head Pose 頭部姿勢數(shù)據(jù)
上半身人像數(shù)據(jù)
INRIA Person 數(shù)據(jù)集

視覺文字識別圖像
Street View House Number 門牌號圖像數(shù)據(jù)
MNIST 手寫數(shù)字識別圖像數(shù)據(jù)
3D MNIST 數(shù)字識別圖像數(shù)據(jù)【Kaggle數(shù)據(jù)】
MediaTeam Document 文檔影印和內(nèi)容數(shù)據(jù)
Text Recognition 文字圖像數(shù)據(jù)
NIST Handprinted Forms and Characters 手寫英文字符數(shù)據(jù)
NIST Structured Forms Reference Set of Binary Images (SFRS) 圖像數(shù)據(jù)
NIST Structured Forms Reference Set of Binary Images (SFRS) II 圖像數(shù)據(jù)

特定一類事物圖像
著名的貓圖像標注數(shù)據(jù)
Caltech-UCSD Birds200 鳥類圖像數(shù)據(jù)
Stanford Car 汽車圖像數(shù)據(jù)
Cars 汽車圖像數(shù)據(jù)
MIT Cars 汽車圖像數(shù)據(jù)
Stanford Cars 汽車圖像數(shù)據(jù)
Food-101 美食圖像數(shù)據(jù)
17_Category_Flower 圖像數(shù)據(jù)
102_Category_Flower 圖像數(shù)據(jù)
UCI Folio Leaf 圖像數(shù)據(jù)
Labeled Fishes in the Wild 魚類圖像
美國 Yelp 點評網(wǎng)站酒店照片
CMU-Oxford Sculpture 塑像雕像圖像
Oxford-IIIT Pet 寵物圖像數(shù)據(jù)
Nature Conservancy Fisheries Monitoring 過度捕撈監(jiān)控圖像數(shù)據(jù)【Kaggle數(shù)據(jù)】

材質(zhì)紋理圖像
CURET 紋理材質(zhì)圖像數(shù)據(jù)
ETHZ Synthesizability 紋理圖像數(shù)據(jù)
KTH-TIPS 紋理材質(zhì)圖像數(shù)據(jù)
Describable Textures 紋理圖像數(shù)據(jù)

物體分類圖像
COIL-20 圖像數(shù)據(jù)
COIL-100 圖像數(shù)據(jù)
Caltech-101 圖像數(shù)據(jù)
Caltech-256 圖像數(shù)據(jù)
CIFAR-10 圖像數(shù)據(jù)
CIFAR-100 圖像數(shù)據(jù)
STL-10 圖像數(shù)據(jù)
LabelMe_12_50k圖像數(shù)據(jù)
NORB v1.0 圖像數(shù)據(jù)
NEC Toy Animal 圖像數(shù)據(jù)
iCubWorld 圖像分類數(shù)據(jù)
Multi-class 圖像分類數(shù)據(jù)
GRAZ 圖像分類數(shù)據(jù)

人臉圖像
IMDB-WIKI 500k+ 人臉圖像锋玲、年齡性別數(shù)據(jù)
Labeled Faces in the Wild 人臉數(shù)據(jù)
Extended Yale Face Database B 人臉數(shù)據(jù)
Bao Face 人臉數(shù)據(jù)
DC-IGN 論文人臉數(shù)據(jù)
300 Face in Wild 圖像數(shù)據(jù)
BioID Face 人臉數(shù)據(jù)
CMU Frontal Face Images
FDDB_Face Detection Data Set and Benchmark
NIST Mugshot Identification Database
Faces in the Wild 人臉數(shù)據(jù)
CelebA 名人人臉圖像數(shù)據(jù)
VGG Face 人臉圖像數(shù)據(jù)
Caltech 10k Web Faces 人臉圖像數(shù)據(jù)

姿勢動作圖像
HMDB_a large human motion database
Human Actions and Scenes Dataset
Buffy Stickmen V3 人體輪廓識別圖像數(shù)據(jù)
Human Pose Evaluator 人體輪廓識別圖像數(shù)據(jù)
Buffy pose 人類姿勢圖像數(shù)據(jù)
VGG Human Pose Estimation 姿勢圖像標注數(shù)據(jù)

指紋識別
NIST FIGS 指紋識別數(shù)據(jù)
NIST Supplemental Fingerprint Card Data (SFCD) 指紋識別數(shù)據(jù)
NIST Plain and Rolled Images from Paired Fingerprint Cards in 500 pixels per inch 指紋識別數(shù)據(jù)
NIST Plain and Rolled Images from Paired Fingerprint Cards 1000 pixels per inch 指紋識別數(shù)據(jù)

其它圖像數(shù)據(jù)
Visual Question Answering V1.0 圖像數(shù)據(jù)
Visual Question Answering V2.0 圖像數(shù)據(jù)

視頻數(shù)據(jù)
綜合視頻
DAVIS_Densely Annotated Video Segmentation 數(shù)據(jù)
YouTube-8M 視頻數(shù)據(jù)集【數(shù)據(jù)太大僅有介紹】
YouTube 網(wǎng)站視頻備份【數(shù)據(jù)太大僅有介紹】

人類動作視頻
Microsoft Research Action 人類動作視頻數(shù)據(jù)
UCF50 Action Recognition 動作識別數(shù)據(jù)
UCF101 Action Recognition 動作識別數(shù)據(jù)
UT-Interaction 人類動作視頻數(shù)據(jù)
UCF iPhone 運動中傳感器數(shù)據(jù)
UCF YouTube 人類動作視頻數(shù)據(jù)
UCF Sport 人類動作視頻數(shù)據(jù)
UCF-ARG 人類動作視頻數(shù)據(jù)
HMDB 人類動作視頻
HOLLYWOOD2 人類行為動作視頻數(shù)據(jù)
Recognition of human actions 動作視頻數(shù)據(jù)
Motion Capture 動作捕捉視頻數(shù)據(jù)
SBU Kinect Interaction 肢體動作視頻數(shù)據(jù)

目標檢測視頻
UCSD Pedestrian 行人視頻數(shù)據(jù)
Caltech Pedestrian 行人視頻數(shù)據(jù)
ETH 行人視頻數(shù)據(jù)
INRIA 行人視頻數(shù)據(jù)
TudBrussels 行人視頻數(shù)據(jù)
Daimler 行人視頻數(shù)據(jù)
ALOV++ 物體追蹤視頻數(shù)據(jù)

密集人群視頻
Crowd Counting 高密度人群圖像
Crowd Segmentation 高密度人群視頻數(shù)據(jù)
Tracking in High Density Crowds 高密度人群視頻

其它視頻
Fire Detection 視頻數(shù)據(jù)

音頻數(shù)據(jù)
綜合音頻
Google Audioset 音頻數(shù)據(jù)【數(shù)據(jù)太大僅有介紹】

語音識別
Sinhala TTS 英語語音識別
TIMIT 美式英語語音識別數(shù)據(jù)
LibriSpeech ASR corpus 語音數(shù)據(jù)
Room Impulse Response and Noise 語音數(shù)據(jù)
ALFFA 非洲語音數(shù)據(jù)
THUYG-20 維吾爾語語音數(shù)據(jù)
AMI Corpus 語音識別

自然語言處理
RCV1英語新聞數(shù)據(jù)
20news 英語新聞數(shù)據(jù)
First Quora Release Question Pairs 問答數(shù)據(jù)
JRC Names各國語言專有實體名稱
Multi-Domain Sentiment V2.0
LETOR 信息檢索數(shù)據(jù)
Yale Youtube Vedio Text
斯坦福問答數(shù)據(jù)【Kaggle數(shù)據(jù)】
美國假新聞數(shù)據(jù)【Kaggle數(shù)據(jù)】
NIPS會議文章信息數(shù)據(jù)(1987-2016)【Kaggle數(shù)據(jù)】
2016年美國總統(tǒng)選舉辯論數(shù)據(jù)【Kaggle數(shù)據(jù)】
WikiLinks 跨文檔指代語料
European Parliament Proceedings Parallel Corpus 機器翻譯數(shù)據(jù)
WikiText 英語語義詞庫數(shù)據(jù)
WMT 2011 News Crawl 機器翻譯數(shù)據(jù)
Stanford Sentiment Treebank 詞匯數(shù)據(jù)

社會數(shù)據(jù)
希拉里郵件門泄露郵件
波士頓 Airbnb 公開數(shù)據(jù)【Kaggle數(shù)據(jù)】
世界各國經(jīng)濟發(fā)展數(shù)據(jù)【Kaagle數(shù)據(jù)】
世界大學排名芝加哥犯罪數(shù)據(jù)(2001-2017)【Kaagle數(shù)據(jù)】
世界范圍顯著地震數(shù)據(jù)(1965-2016)【Kaagle數(shù)據(jù)】
美國嬰兒姓名數(shù)據(jù)【Kaagle數(shù)據(jù)】
全世界鯊魚襲擊人類數(shù)據(jù)【Kaagle數(shù)據(jù)】
1908年以來空難數(shù)據(jù)【Kaagle數(shù)據(jù)】
2016年美國總統(tǒng)大選數(shù)據(jù)【Kaagle數(shù)據(jù)】
2013年美國社區(qū)統(tǒng)計數(shù)據(jù)【Kaagle數(shù)據(jù)】
2014年美國社區(qū)統(tǒng)計數(shù)據(jù)【Kaagle數(shù)據(jù)】
2015年美國社區(qū)統(tǒng)計數(shù)據(jù)【Kaagle數(shù)據(jù)】
歐洲足球運動員賽事表現(xiàn)數(shù)據(jù)【Kaagle數(shù)據(jù)】
美國環(huán)境污染數(shù)據(jù)【Kaagle數(shù)據(jù)】
美國H1-B簽證申請數(shù)據(jù)Kaggle數(shù)據(jù)】
IMDB五千部電影數(shù)據(jù)【Kaggle數(shù)據(jù)】
2015年航班延誤和取消數(shù)據(jù)【Kaggle數(shù)據(jù)】
兇殺案報告數(shù)據(jù)【Kaggle數(shù)據(jù)】
人力資源分析數(shù)據(jù)【Kaggle數(shù)據(jù)】
美國費城犯罪數(shù)據(jù)【Kaggle數(shù)據(jù)】
安然公司郵件數(shù)據(jù)【Kaggle數(shù)據(jù)】
歷史棒球數(shù)據(jù)【Kaggle數(shù)據(jù)】
美聯(lián)航 Twitter 用戶評論數(shù)據(jù)【Kaggle數(shù)據(jù)】
波士頓 Airbnb 公開數(shù)據(jù)【Kaggle數(shù)據(jù)】

處理后的科研和競賽數(shù)據(jù)
NIPS 2003 屬性選擇競賽數(shù)據(jù)
臺灣大學林智仁教授處理為 LibSVM 格式的分類建模數(shù)據(jù)
Large-scale 分類建模數(shù)據(jù)
幾個UCI 中 large-scale 分類建模數(shù)據(jù)
Social Computing Data Repository 社交網(wǎng)絡數(shù)據(jù)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市耗美,隨后出現(xiàn)的幾起案子商架,更是在濱河造成了極大的恐慌蛇摸,老刑警劉巖皇型,帶你破解...
    沈念sama閱讀 222,104評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件弃鸦,死亡現(xiàn)場離奇詭異唬格,居然都是意外死亡汰聋,警方通過查閱死者的電腦和手機烹困,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評論 3 399
  • 文/潘曉璐 我一進店門髓梅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來枯饿,“玉大人奢方,你說我怎么就攤上這事蟋字∪到保” “怎么了嫉入?”我有些...
    開封第一講書人閱讀 168,697評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長垫竞。 經(jīng)常有香客問我欢瞪,道長遣鼓,這世上最難降的妖魔是什么骑祟? 我笑而不...
    開封第一講書人閱讀 59,836評論 1 298
  • 正文 為了忘掉前任次企,我火速辦了婚禮缸棵,結(jié)果婚禮上堵第,老公的妹妹穿的比我還像新娘。我一直安慰自己型诚,他們只是感情好鸳劳,可當我...
    茶點故事閱讀 68,851評論 6 397
  • 文/花漫 我一把揭開白布涵紊。 她就那樣靜靜地躺著摸柄,像睡著了一般驱负。 火紅的嫁衣襯著肌膚如雪跃脊。 梳的紋絲不亂的頭發(fā)上酪术,一...
    開封第一講書人閱讀 52,441評論 1 310
  • 那天绘雁,我揣著相機與錄音庐舟,去河邊找鬼挪略。 笑死,一個胖子當著我的面吹牛抹缕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播睹簇,決...
    沈念sama閱讀 40,992評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼磨淌,長吁一口氣:“原來是場噩夢啊……” “哼梁只!你這毒婦竟也來了搪锣?” 一聲冷哼從身側(cè)響起构舟,我...
    開封第一講書人閱讀 39,899評論 0 276
  • 序言:老撾萬榮一對情侶失蹤狗超,失蹤者是張志新(化名)和其女友劉穎努咐,沒想到半個月后麦撵,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體免胃,經(jīng)...
    沈念sama閱讀 46,457評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,529評論 3 341
  • 正文 我和宋清朗相戀三年扼雏,在試婚紗的時候發(fā)現(xiàn)自己被綠了诗充。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蝴蜓。...
    茶點故事閱讀 40,664評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡茎匠,死狀恐怖凯肋,靈堂內(nèi)的尸體忽然破棺而出汽馋,到底是詐尸還是另有隱情惭蟋,我是刑警寧澤告组,帶...
    沈念sama閱讀 36,346評論 5 350
  • 正文 年R本政府宣布木缝,位于F島的核電站我碟,受9級特大地震影響矫俺,放射性物質(zhì)發(fā)生泄漏厘托。R本人自食惡果不足惜铅匹,卻給世界環(huán)境...
    茶點故事閱讀 42,025評論 3 334
  • 文/蒙蒙 一流礁、第九天 我趴在偏房一處隱蔽的房頂上張望神帅。 院中可真熱鬧枕稀,春花似錦、人聲如沸哆档。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽雇寇。三九已至锨侯,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間囚痴,已是汗流浹背审葬。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評論 1 272
  • 我被黑心中介騙來泰國打工深滚, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人涣觉。 一個月前我還...
    沈念sama閱讀 49,081評論 3 377
  • 正文 我出身青樓痴荐,卻偏偏與公主長得像,于是被迫代替她去往敵國和親旨枯。 傳聞我的和親對象是個殘疾皇子蹬昌,可洞房花燭夜當晚...
    茶點故事閱讀 45,675評論 2 359

推薦閱讀更多精彩內(nèi)容