機(jī)器學(xué)習(xí)介紹(基于Python scikit-learn模塊)

Machine learning : 綜述


通常梆暮,一個(gè)機(jī)器學(xué)習(xí)問題是通過n個(gè)樣本數(shù)據(jù)去預(yù)測或是發(fā)現(xiàn)一些未知的數(shù)據(jù)。如果每個(gè)樣本是由超過一個(gè)的數(shù)據(jù)組成顽决,那么我們稱組成該數(shù)據(jù)有一些熟悉或者特征每辟。

  • 機(jī)器學(xué)習(xí)問題按照目的一般可以分為一下兩類:
  • 分類問題
    所謂分類問題叶堆,是指已知輸入數(shù)據(jù)塔淤,要判斷數(shù)據(jù)屬于哪一類摘昌,要求屬于同類的數(shù)據(jù)具有預(yù)先定義的相似性
  • 回歸問題
    回歸問題本質(zhì)上和分類問題并沒有什么很大不同高蜂,為已知輸入數(shù)據(jù)求輸出數(shù)據(jù)聪黎,區(qū)別在于,分類問題的預(yù)測屬性是離散值妨马,而回歸問題的預(yù)測屬性是連續(xù)值挺举。
  • 還可以分為下面這兩類:
  • 監(jiān)督問題
    監(jiān)督問題是指需要一部分輸入數(shù)據(jù)及對應(yīng)的輸出數(shù)據(jù)來訓(xùn)練學(xué)習(xí)模型。
  • 非監(jiān)督問題
    非監(jiān)督問題是指只需要輸入數(shù)據(jù)而不必有對應(yīng)的輸出數(shù)據(jù)烘跺。

訓(xùn)練集與驗(yàn)證集

機(jī)器學(xué)習(xí)本質(zhì)上是通過已知的一些數(shù)據(jù)的特征來應(yīng)用于未知的數(shù)據(jù)湘纵,為了證明模型的正確性,通常需要準(zhǔn)備兩個(gè)數(shù)據(jù)集:訓(xùn)練集驗(yàn)證集滤淳。訓(xùn)練集是用來訓(xùn)練模型梧喷,讓模型學(xué)習(xí)這些數(shù)據(jù)的特征;驗(yàn)證集是用來檢驗(yàn)訓(xùn)練后的模型的正確性脖咐。

1 獲取數(shù)據(jù)及數(shù)據(jù)的預(yù)處理

現(xiàn)實(shí)世界的數(shù)據(jù)大都不能直接用來分析铺敌,在分析之前需要進(jìn)行數(shù)據(jù)清理、數(shù)據(jù)轉(zhuǎn)換屁擅、數(shù)據(jù)集成等預(yù)處理步驟后才能使用偿凭。
詳情見我的另一篇文章python data analysis | python數(shù)據(jù)預(yù)處理(基于scikit-learn模塊)

2 模型的學(xué)習(xí)和預(yù)測

  • 選擇模型
    根據(jù)數(shù)據(jù)的不同及問題的不同需求來選擇要用的模型,下面一張圖片可以提供選擇模型時(shí)的參考
    Choosing the right estimator — scikit-learn 0.17.1 documentation
    ml_map.png
  • 選擇參數(shù)
    我們希望學(xué)習(xí)的模型是最小化誤差的派歌,所以可以選擇備選的參數(shù)空間弯囊,然后用交叉驗(yàn)證的方法產(chǎn)生訓(xùn)練集合驗(yàn)證集來對不同參數(shù)的模型效果進(jìn)行評估,選擇一個(gè)最好的模型胶果。

3 訓(xùn)練模型的保存

因?yàn)?strong>Python每次關(guān)閉都會(huì)清空使用內(nèi)存匾嘱,為了保存訓(xùn)練完成的模型,可以使用Python中的序列化模塊pickle來進(jìn)行序列化反序列化早抠。序列化及將內(nèi)存中的數(shù)據(jù)存儲在文件中霎烙,反序列化是指將文件中的數(shù)據(jù)轉(zhuǎn)移到內(nèi)存中。

clf表示訓(xùn)練完成的分類模型

file表示存儲的路徑

import pickle
file=open(,)
pickle.dump(clf, file])
file.close()
clf=pickle.load(file)


##4 約定
* 類型約定:
除非另有說明蕊连,否則所有的輸入數(shù)據(jù)類型將被`fit_transform(X)`轉(zhuǎn)換成`float64`類型
* 更新超參數(shù):
超參數(shù)可以理解為訓(xùn)練之前的模型所需要的參數(shù)悬垃,比如k-means分類方法中的k就是一個(gè)超參數(shù)。超參數(shù)的修改可以用下面這種格式修改
`clf.set-params(param1=*p1*,param2=*p2*,...) #param1是具體的超參數(shù)名稱咪奖,*p1*等是選擇參數(shù)數(shù)值`

#####本文信息參考[scikit-learn官方文檔](http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末盗忱,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子羊赵,更是在濱河造成了極大的恐慌趟佃,老刑警劉巖扇谣,帶你破解...
    沈念sama閱讀 211,123評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異闲昭,居然都是意外死亡罐寨,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評論 2 384
  • 文/潘曉璐 我一進(jìn)店門序矩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來鸯绿,“玉大人,你說我怎么就攤上這事簸淀∑亢” “怎么了?”我有些...
    開封第一講書人閱讀 156,723評論 0 345
  • 文/不壞的土叔 我叫張陵租幕,是天一觀的道長舷手。 經(jīng)常有香客問我,道長劲绪,這世上最難降的妖魔是什么男窟? 我笑而不...
    開封第一講書人閱讀 56,357評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮贾富,結(jié)果婚禮上歉眷,老公的妹妹穿的比我還像新娘。我一直安慰自己颤枪,他們只是感情好汗捡,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,412評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著畏纲,像睡著了一般凉唐。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上霍骄,一...
    開封第一講書人閱讀 49,760評論 1 289
  • 那天,我揣著相機(jī)與錄音淡溯,去河邊找鬼读整。 笑死,一個(gè)胖子當(dāng)著我的面吹牛咱娶,可吹牛的內(nèi)容都是我干的米间。 我是一名探鬼主播,決...
    沈念sama閱讀 38,904評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼膘侮,長吁一口氣:“原來是場噩夢啊……” “哼屈糊!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起琼了,我...
    開封第一講書人閱讀 37,672評論 0 266
  • 序言:老撾萬榮一對情侶失蹤逻锐,失蹤者是張志新(化名)和其女友劉穎夫晌,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體昧诱,經(jīng)...
    沈念sama閱讀 44,118評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡晓淀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,456評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了盏档。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片凶掰。...
    茶點(diǎn)故事閱讀 38,599評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖蜈亩,靈堂內(nèi)的尸體忽然破棺而出懦窘,到底是詐尸還是另有隱情,我是刑警寧澤稚配,帶...
    沈念sama閱讀 34,264評論 4 328
  • 正文 年R本政府宣布畅涂,位于F島的核電站,受9級特大地震影響药有,放射性物質(zhì)發(fā)生泄漏毅戈。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,857評論 3 312
  • 文/蒙蒙 一愤惰、第九天 我趴在偏房一處隱蔽的房頂上張望苇经。 院中可真熱鬧,春花似錦宦言、人聲如沸扇单。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,731評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蜘澜。三九已至,卻和暖如春响疚,著一層夾襖步出監(jiān)牢的瞬間鄙信,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,956評論 1 264
  • 我被黑心中介騙來泰國打工忿晕, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留装诡,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,286評論 2 360
  • 正文 我出身青樓践盼,卻偏偏與公主長得像鸦采,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子咕幻,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,465評論 2 348

推薦閱讀更多精彩內(nèi)容