SKLearn數(shù)據(jù)集API(一)

數(shù)據(jù)集一覽

類型 獲取方式
自帶的小數(shù)據(jù)集 sklearn.datasets.load_<name>
在線下載的數(shù)據(jù)集 sklearn.datasets.fetch_<name>
計(jì)算機(jī)生成的數(shù)據(jù)集 sklearn.datasets.make_<name>
svmlight/libsvm格式的數(shù)據(jù)集 sklearn.datasets.load_svmlight_file(...)
mldata.org在線下載數(shù)據(jù)集 sklearn.datasets.fetch_mldata(...)

自帶的小數(shù)據(jù)集

返回的是bunch對(duì)象,是字典類型

名稱 數(shù)據(jù)包
鳶尾花數(shù)據(jù)集 load_iris()
乳腺癌數(shù)據(jù)集 load_breast_cancer()
手寫數(shù)字?jǐn)?shù)據(jù)集 load_digits()
糖尿病數(shù)據(jù)集 load_diabetes()
波士頓房?jī)r(jià)數(shù)據(jù)集 load_boston()
體能訓(xùn)練數(shù)據(jù)集 load_linnerud()
圖像數(shù)據(jù)集 load_sample_image(name)

鳶尾花數(shù)據(jù)集

image

下面使用花萼長(zhǎng)度單個(gè)特征來(lái)劃分查看剥汤,這是探索性分析县钥,當(dāng)我們不知道該使用那些特征的時(shí)候,就這樣查看一下省有。

image

下面使用兩個(gè)特征來(lái)劃分查看

image

手寫數(shù)字?jǐn)?shù)據(jù)集

image

圖像數(shù)據(jù)集

image

在線下載的數(shù)據(jù)集

使用datasets.get_data_home()函數(shù)獲取下載目錄

類型 獲取方式
20類新聞文本數(shù)據(jù)集 fetch_20newsgroups() / fetch_20newsgroups_vectorized()
野外帶標(biāo)記人臉數(shù)據(jù)集 fetch_lfw_people() / fetch_lfw_pairs()
Olivetti人臉數(shù)據(jù)集 fetch_olivetti_faces()
rcvl多標(biāo)簽數(shù)據(jù)集 fetch_rcvl()
加利福尼亞房?jī)r(jià)數(shù)據(jù)集 fetch_canlifornia_housing()

20類新聞文本數(shù)據(jù)集

包含了關(guān)于20個(gè)話題(topic)的18000條新聞報(bào)道蠢沿,被分為兩個(gè)子集: 訓(xùn)練集和測(cè)試集

函數(shù) 內(nèi)容
fetch_20newsgroups() 原始的文本列表舷蟀,該文本可以被輸入到文本特征提取器sklearn.feature_extraction.text.CountVectorizer進(jìn)一步處理得到特征向量
fetch_20newsgroups_vectorized() 返回一個(gè)直接可以使用的特征面哼,無(wú)須在進(jìn)行特征提取野宜。
image
image

Olivetti人臉數(shù)據(jù)集

Olivetti人臉數(shù)據(jù)集是AT&T在1992-1994年手機(jī)的人臉數(shù)據(jù)集匈子,包含了40個(gè)不同的目標(biāo)闯袒,每個(gè)目標(biāo)10張圖片游岳,某些目標(biāo)的圖像在不同的時(shí)間段采集其徙,帶有光照,面部表情(眼鏡開閉唾那,笑容),面部襲細(xì)節(jié)的各種變化朗若,所有的人臉圖像被正立的放在一個(gè)灰色的背景上昌罩。

每一張圖像上有256個(gè)灰度級(jí)哭懈,用無(wú)符號(hào)8為來(lái)存茎用。加載函數(shù)會(huì)將所有的圖像轉(zhuǎn)換成[0,1]區(qū)間上的浮點(diǎn)數(shù),目標(biāo)值target存放著0到39的數(shù)字代表人臉的類別標(biāo)簽旭斥。然而每個(gè)標(biāo)簽對(duì)應(yīng)的人臉圖像都只有10張古涧,每張圖像的分辨率是64*64。這個(gè)小數(shù)據(jù)集會(huì)更加適合來(lái)做無(wú)監(jiān)督學(xué)習(xí)或者半監(jiān)督學(xué)習(xí)羡滑。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市凳宙,隨后出現(xiàn)的幾起案子职祷,更是在濱河造成了極大的恐慌,老刑警劉巖有梆,帶你破解...
    沈念sama閱讀 221,198評(píng)論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件泥耀,死亡現(xiàn)場(chǎng)離奇詭異饺汹,居然都是意外死亡爆袍,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門弦疮,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)蜘醋,“玉大人,你說我怎么就攤上這事压语。” “怎么了扰才?”我有些...
    開封第一講書人閱讀 167,643評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵厕怜,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我琅捏,道長(zhǎng)递雀,這世上最難降的妖魔是什么柄延? 我笑而不...
    開封第一講書人閱讀 59,495評(píng)論 1 296
  • 正文 為了忘掉前任搜吧,我火速辦了婚禮杠输,結(jié)果婚禮上赎败,老公的妹妹穿的比我還像新娘蠢甲。我一直安慰自己,他們只是感情好搞糕,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評(píng)論 6 397
  • 文/花漫 我一把揭開白布曼追。 她就那樣靜靜地躺著,像睡著了一般驹吮。 火紅的嫁衣襯著肌膚如雪针史。 梳的紋絲不亂的頭發(fā)上碟狞,一...
    開封第一講書人閱讀 52,156評(píng)論 1 308
  • 那天族沃,我揣著相機(jī)與錄音频祝,去河邊找鬼脆淹。 笑死,一個(gè)胖子當(dāng)著我的面吹牛漓糙,可吹牛的內(nèi)容都是我干的烘嘱。 我是一名探鬼主播,決...
    沈念sama閱讀 40,743評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼拙友,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了辐棒?” 一聲冷哼從身側(cè)響起牍蜂,我...
    開封第一講書人閱讀 39,659評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎鲫竞,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體寄疏,經(jīng)...
    沈念sama閱讀 46,200評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡僵井,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評(píng)論 3 340
  • 正文 我和宋清朗相戀三年批什,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了农曲。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片驻债。...
    茶點(diǎn)故事閱讀 40,424評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖暮的,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情青扔,我是刑警寧澤翩伪,帶...
    沈念sama閱讀 36,107評(píng)論 5 349
  • 正文 年R本政府宣布,位于F島的核電站凛剥,受9級(jí)特大地震影響轻姿,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜互亮,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望炊昆。 院中可真熱鬧威根,春花似錦凤巨、人聲如沸洛搀。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評(píng)論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)谎砾。三九已至,卻和暖如春棺榔,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背症歇。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評(píng)論 1 271
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留宛蚓,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,798評(píng)論 3 376
  • 正文 我出身青樓远舅,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親图柏。 傳聞我的和親對(duì)象是個(gè)殘疾皇子任连,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容