機(jī)器學(xué)習(xí)-1.sklearn總序

機(jī)器學(xué)習(xí)是根據(jù)不同事物的特征來推導(dǎo)它的分類或者預(yù)測(cè)它未來的值趾牧,
大類有分類和回歸,分類好理解就是把桃花和菊花分開阱穗,又分二分類和多分類。回歸就是預(yù)測(cè)房?jī)r(jià)笼呆,股價(jià)這種,預(yù)測(cè)具體的值旨别。
方法主要分為監(jiān)督學(xué)習(xí)诗赌、無監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)。最大區(qū)別是訓(xùn)練集(已知事物)是否有對(duì)應(yīng)的類別標(biāo)簽秸弛。
監(jiān)督學(xué)習(xí)就是用已知的事物特征(feature)和類別(label)
铭若,訓(xùn)練一個(gè)模型,用于預(yù)測(cè)只有特征的事物是哪個(gè)類別递览。
特征可以理解為導(dǎo)致分類的一些影響因素叼屠,比如分類桃花和菊花,可能特征就是顏色绞铃,花瓣數(shù)量镜雨,開花時(shí)間等等。
無監(jiān)督學(xué)習(xí)是根據(jù)已知的事物特征進(jìn)行聚類儿捧。
半監(jiān)督學(xué)習(xí)是部分有l(wèi)abel荚坞。

這是文檔給出的導(dǎo)圖


文檔導(dǎo)圖
樹結(jié)構(gòu)

圖自網(wǎng)友的總結(jié)

api


sklearn-api

我使用的一般基本流程是:
1.收集數(shù)據(jù),一般爬蟲就在這里用菲盾,包括特征(label颓影,監(jiān)督學(xué)習(xí)),用pandas處理數(shù)據(jù)得到更多的特征懒鉴,比如得到一些‘XX率’诡挂,得到原始的訓(xùn)練集。
2.用sklearn.processing對(duì)數(shù)據(jù)預(yù)處理临谱,normalize咆畏,主要針對(duì)的是feature數(shù)量級(jí)特別不一樣的情況,比如有10000和1.1吴裤,這種差別比較大的旧找,就會(huì)出現(xiàn)特征對(duì)結(jié)果的"貢獻(xiàn)"不一樣。(主要是影響梯度下降的計(jì)算)
還有一種預(yù)處理是把文字類型數(shù)據(jù)改成類別類型麦牺,
3.選取多個(gè)模型钮蛛,訓(xùn)練模型鞭缭,根據(jù)結(jié)果,得到學(xué)習(xí)曲線learning-curve魏颓,看是高偏差high bias還是高方差variance岭辣,調(diào)整原始數(shù)據(jù),選擇加入更多的數(shù)據(jù)甸饱,還是調(diào)整參數(shù)沦童。
4.用新數(shù)據(jù)訓(xùn)練模型,選取效果好的叹话,用 驗(yàn)證曲線cross-validation curve輔助來調(diào)參偷遗。
5.用grid網(wǎng)格化搜索參數(shù)

寫在最后
我的數(shù)學(xué)水平大概在能知道求導(dǎo),積分的概念驼壶,基本就是高中生水平氏豌,機(jī)器學(xué)習(xí)的確需要很高的數(shù)學(xué)基礎(chǔ),但是只是運(yùn)用的話热凹,就不需要那么高的水平泵喘,我覺得了解各個(gè)模型的參數(shù)影響什么,能夠調(diào)參就行了般妙。
機(jī)器學(xué)習(xí)我主要是看了吳恩達(dá)的教程和[機(jī)器學(xué)習(xí)實(shí)戰(zhàn)](https://book.douban.com/subject/24703171/)纪铺,統(tǒng)計(jì)方面看了白話統(tǒng)計(jì)
這三個(gè)我覺得算是非常通俗易懂,我是先看的機(jī)器學(xué)習(xí)實(shí)戰(zhàn)碟渺,感覺比較懵鲜锚,全靠吳恩達(dá)的教程,超級(jí)友好止状,推導(dǎo)由淺入深烹棉,關(guān)鍵把什么時(shí)候用攒霹,怎么樣用怯疤,流程是怎樣的都說的很清楚,超級(jí)推薦催束。
這個(gè)文集僅僅用于記錄我的學(xué)習(xí)心得集峦。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市抠刺,隨后出現(xiàn)的幾起案子塔淤,更是在濱河造成了極大的恐慌,老刑警劉巖速妖,帶你破解...
    沈念sama閱讀 219,039評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件高蜂,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡罕容,警方通過查閱死者的電腦和手機(jī)备恤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門稿饰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人露泊,你說我怎么就攤上這事喉镰。” “怎么了惭笑?”我有些...
    開封第一講書人閱讀 165,417評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵侣姆,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我沉噩,道長(zhǎng)捺宗,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,868評(píng)論 1 295
  • 正文 為了忘掉前任屁擅,我火速辦了婚禮偿凭,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘派歌。我一直安慰自己弯囊,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,892評(píng)論 6 392
  • 文/花漫 我一把揭開白布胶果。 她就那樣靜靜地躺著匾嘱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪早抠。 梳的紋絲不亂的頭發(fā)上霎烙,一...
    開封第一講書人閱讀 51,692評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音蕊连,去河邊找鬼悬垃。 笑死,一個(gè)胖子當(dāng)著我的面吹牛甘苍,可吹牛的內(nèi)容都是我干的尝蠕。 我是一名探鬼主播,決...
    沈念sama閱讀 40,416評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼载庭,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼看彼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起囚聚,我...
    開封第一講書人閱讀 39,326評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤靖榕,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后顽铸,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體茁计,經(jīng)...
    沈念sama閱讀 45,782評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,957評(píng)論 3 337
  • 正文 我和宋清朗相戀三年谓松,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了星压。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瓶蝴。...
    茶點(diǎn)故事閱讀 40,102評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖租幕,靈堂內(nèi)的尸體忽然破棺而出舷手,到底是詐尸還是另有隱情,我是刑警寧澤劲绪,帶...
    沈念sama閱讀 35,790評(píng)論 5 346
  • 正文 年R本政府宣布男窟,位于F島的核電站,受9級(jí)特大地震影響贾富,放射性物質(zhì)發(fā)生泄漏歉眷。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,442評(píng)論 3 331
  • 文/蒙蒙 一颤枪、第九天 我趴在偏房一處隱蔽的房頂上張望汗捡。 院中可真熱鬧,春花似錦畏纲、人聲如沸扇住。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽艘蹋。三九已至,卻和暖如春票灰,著一層夾襖步出監(jiān)牢的瞬間女阀,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工屑迂, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留浸策,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,332評(píng)論 3 373
  • 正文 我出身青樓惹盼,卻偏偏與公主長(zhǎng)得像庸汗,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子逻锐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,044評(píng)論 2 355