Python的Sklearn庫中的數(shù)據(jù)集

一、Sklearn介紹

scikit-learn是Python語言開發(fā)的機(jī)器學(xué)習(xí)庫,一般簡稱為sklearn九昧,目前算是通用機(jī)器學(xué)習(xí)算法庫中實現(xiàn)得比較完善的庫了。其完善之處不僅在于實現(xiàn)的算法多毕匀,還包括大量詳盡的文檔和示例铸鹰。其文檔寫得通俗易懂,完全可以當(dāng)成機(jī)器學(xué)習(xí)的教程來學(xué)習(xí)皂岔。

二蹋笼、Sklearn數(shù)據(jù)集種類

sklearn 的數(shù)據(jù)集有好多個種

  • 自帶的小數(shù)據(jù)集(packaged dataset):sklearn.datasets.load_<name>
  • 可在線下載的數(shù)據(jù)集(Downloaded Dataset):sklearn.datasets.fetch_<name>
  • 計算機(jī)生成的數(shù)據(jù)集(Generated Dataset):sklearn.datasets.make_<name>
  • svmlight/libsvm格式的數(shù)據(jù)集:sklearn.datasets.load_svmlight_file(...)
  • 從買了data.org在線下載獲取的數(shù)據(jù)集:sklearn.datasets.fetch_mldata(...)

三、Sklearn數(shù)據(jù)集

1.有關(guān)數(shù)據(jù)集的工具類

clearn_data_home 清空指定目錄

get_data_home 獲取sklearn數(shù)據(jù)根目錄

load_files 加載類目數(shù)據(jù)

dump_svmlight_file 轉(zhuǎn)化文件格式為svmlight/libsvm

load_svmlight_file 加載文件并進(jìn)行格式轉(zhuǎn)換

load_svmlight_files 加載文件并進(jìn)行格式轉(zhuǎn)換

2.有關(guān)文本分類聚類數(shù)據(jù)集

fetch_20newsgroups 新聞文本分類數(shù)據(jù)集

fetch_20newsgroups_vectorized 新聞文本向量化數(shù)據(jù)集

fetch_rcv1 路透社英文新聞文本分類數(shù)據(jù)集

有關(guān)人臉識別的數(shù)據(jù)集
fetch_lfw_pairs 人臉數(shù)據(jù)集

fetch_lfw_people 人臉數(shù)據(jù)集

fetch_olivetti_faces 人臉數(shù)據(jù)集

3.有關(guān)圖像的數(shù)據(jù)集

load_sample_image 圖像數(shù)據(jù)集

load_sample_images 圖像數(shù)據(jù)集

load_digits 手寫體數(shù)據(jù)集

4.有關(guān)醫(yī)學(xué)的數(shù)據(jù)集

load_breast_cancer 乳腺癌數(shù)據(jù)集

load_diabetes 糖尿病數(shù)據(jù)集

load_linnerud 體能訓(xùn)練數(shù)據(jù)集

5.其他數(shù)據(jù)集

load_wine 葡萄酒數(shù)據(jù)集

load_iris 鳶尾花數(shù)據(jù)集

load_boston 波士頓房屋數(shù)據(jù)集

fetch_california_housing 加利福尼亞房屋數(shù)據(jù)集

fetch_kddcup99 入侵檢測數(shù)據(jù)集

fetch_species_distribution 物種分布數(shù)據(jù)集

fetch_covtype 森林植被數(shù)據(jù)集

load_mldata mldata.org 在線下載的數(shù)據(jù)集

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末躁垛,一起剝皮案震驚了整個濱河市剖毯,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌教馆,老刑警劉巖逊谋,帶你破解...
    沈念sama閱讀 223,207評論 6 521
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異土铺,居然都是意外死亡胶滋,警方通過查閱死者的電腦和手機(jī)板鬓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,455評論 3 400
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來究恤,“玉大人俭令,你說我怎么就攤上這事〔克蓿” “怎么了抄腔?”我有些...
    開封第一講書人閱讀 170,031評論 0 366
  • 文/不壞的土叔 我叫張陵,是天一觀的道長窟赏。 經(jīng)常有香客問我妓柜,道長,這世上最難降的妖魔是什么涯穷? 我笑而不...
    開封第一講書人閱讀 60,334評論 1 300
  • 正文 為了忘掉前任棍掐,我火速辦了婚禮,結(jié)果婚禮上拷况,老公的妹妹穿的比我還像新娘作煌。我一直安慰自己,他們只是感情好赚瘦,可當(dāng)我...
    茶點故事閱讀 69,322評論 6 398
  • 文/花漫 我一把揭開白布粟誓。 她就那樣靜靜地躺著,像睡著了一般起意。 火紅的嫁衣襯著肌膚如雪鹰服。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,895評論 1 314
  • 那天揽咕,我揣著相機(jī)與錄音悲酷,去河邊找鬼。 笑死亲善,一個胖子當(dāng)著我的面吹牛设易,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蛹头,決...
    沈念sama閱讀 41,300評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼顿肺,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了渣蜗?” 一聲冷哼從身側(cè)響起屠尊,我...
    開封第一講書人閱讀 40,264評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎袍睡,沒想到半個月后知染,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,784評論 1 321
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡斑胜,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,870評論 3 343
  • 正文 我和宋清朗相戀三年控淡,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片止潘。...
    茶點故事閱讀 40,989評論 1 354
  • 序言:一個原本活蹦亂跳的男人離奇死亡掺炭,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出凭戴,到底是詐尸還是另有隱情涧狮,我是刑警寧澤,帶...
    沈念sama閱讀 36,649評論 5 351
  • 正文 年R本政府宣布么夫,位于F島的核電站者冤,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏档痪。R本人自食惡果不足惜涉枫,卻給世界環(huán)境...
    茶點故事閱讀 42,331評論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望腐螟。 院中可真熱鬧愿汰,春花似錦、人聲如沸乐纸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,814評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽汽绢。三九已至吗跋,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間宁昭,已是汗流浹背跌宛。 一陣腳步聲響...
    開封第一講書人閱讀 33,940評論 1 275
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留久窟,地道東北人秩冈。 一個月前我還...
    沈念sama閱讀 49,452評論 3 379
  • 正文 我出身青樓,卻偏偏與公主長得像斥扛,于是被迫代替她去往敵國和親入问。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,995評論 2 361

推薦閱讀更多精彩內(nèi)容