這個(gè)標(biāo)題不是多打了重復(fù)的字,而是我近期確實(shí)在學(xué)習(xí)一個(gè)叫機(jī)器學(xué)習(xí)的玩意饮焦,以下是一點(diǎn)隨記怕吴。
一個(gè)比喻
如果用比喻來(lái)解釋機(jī)器學(xué)習(xí),大致等于庖丁解牛县踢∽粒《莊子·養(yǎng)生主》中,庖丁非常漂亮地宰了一頭牛后硼啤,對(duì)下巴掉在地上的文惠君說(shuō)议经,"臣之所好者,道也;進(jìn)乎技矣煞肾。始臣之解牛之時(shí)咧织,所見(jiàn)無(wú)非牛者;三年之后籍救,未嘗見(jiàn)全牛也习绢。"
普通宰牛人一個(gè)月?lián)Q一把刀,高級(jí)宰牛人一年換一把刀蝙昙,庖丁十九年沒(méi)換過(guò)刀闪萄。
庖丁一開(kāi)始看到的牛跟我們普通人看到的牛沒(méi)什么區(qū)別。但屠宰一萬(wàn)頭牛之后奇颠,庖丁看到的牛已經(jīng)是骨骼桃煎、肌肉、筋脈以清晰明確的分界線組合在一起大刊,所以每一刀下去为迈,都是在精準(zhǔn)地分開(kāi)牛身體的不同部分,刀子并沒(méi)有真正切割什么東西缺菌,而是游走在本來(lái)就存在的分界線上葫辐。
給機(jī)器學(xué)習(xí)的模型(有很多種)投喂數(shù)據(jù),就是讓庖丁大量宰牛伴郁。數(shù)據(jù)越多耿战,牛的分解就越清晰容易,庖丁換刀的間隔也就越久焊傅。
近期筆記
"I have also learned not to take glory in the difficulty of a proof:difficulty means we have not understood. The idea is to be able to paint a landscape in which the proof is obvious." --Pierre Deligne
(以上引用是我偷的剂陡,實(shí)在眼紅好書(shū)都有章節(jié)前的引用。以下筆記沒(méi)能把想表達(dá)的內(nèi)容用人話說(shuō)清楚狐胎,不是內(nèi)容太難鸭栖,而是學(xué)習(xí)者理解程度不夠)
筆記內(nèi)容如下:
機(jī)器學(xué)習(xí)的基礎(chǔ)是回歸分析,基于大量的已知數(shù)據(jù)握巢,識(shí)別數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系和規(guī)律晕鹊,用來(lái)分析預(yù)測(cè)后續(xù)收集到的數(shù)據(jù)。
機(jī)器學(xué)習(xí)主要分為導(dǎo)向型學(xué)習(xí)和非導(dǎo)向型學(xué)習(xí)暴浦,前者是指事先已經(jīng)明確通過(guò)分析要得到的目標(biāo)結(jié)果有清晰定義溅话,后者在分析完成前并不知道具體會(huì)有什么結(jié)果。
目前階段的學(xué)習(xí)的主要是導(dǎo)向型機(jī)器學(xué)習(xí)歌焦,主要操作步驟如下:
1飞几、讀取已知的數(shù)據(jù)
2、了解已知數(shù)據(jù)包含哪些息維度独撇、各維度信息的性質(zhì)
3屑墨、剔除非數(shù)值類(lèi)信息躁锁,用剔除或內(nèi)插的方法處理信息不完整的數(shù)據(jù)條目
4、將處理后的數(shù)據(jù)切分成兩部分绪钥,一部分用來(lái)“投喂”我們選擇的機(jī)器分析的模型灿里,另一部分用來(lái)驗(yàn)證“投喂”后得到的模型
5、建立驗(yàn)證需要達(dá)到的標(biāo)準(zhǔn)程腹,投喂匣吊,驗(yàn)證
6、用通過(guò)驗(yàn)證的模型寸潦,預(yù)測(cè)其他數(shù)據(jù)樣本的結(jié)果
需要提升
對(duì)pd.DataFrame的各種搓圓捏扁的操作目前仍過(guò)目就忘色鸳,處于能看懂、不能隨時(shí)拿出來(lái)用的程度见转。
對(duì)DecisionTreeRegressor等常規(guī)模型的原理了解得太少命雀,僅處于拿來(lái)能用的階段。
對(duì)于非數(shù)值類(lèi)信息的分析仍需進(jìn)一步了解學(xué)習(xí)斩箫。
多說(shuō)一句
有時(shí)候有人問(wèn)我到底是干什么的吏砂,其實(shí)我是個(gè)搞地圖測(cè)繪的。在這么個(gè)復(fù)雜而廣闊的世界上乘客,我在愚公移山式地為一個(gè)人探索這世界上知識(shí)的種類(lèi)和邊界狐血,畫(huà)出我能看到但可能(很可能)不能去到的高峰和峽谷。畢竟蘇軾曾經(jīng)曰過(guò)的易核,書(shū)到今生讀已遲匈织。
讓我讀你上輩子該讀的書(shū)吧。