推薦機(jī)器學(xué)習(xí)網(wǎng)站:https://easyai.tech/ai-definition/machine-learning/
引言:機(jī)器學(xué)習(xí)、人工智能、深度學(xué)習(xí)是什么關(guān)系祠锣?
1956 年提出 AI 概念酷窥,短短3年后(1959)Arthur Samuel就提出了機(jī)器學(xué)習(xí)的概念:Field of study that gives computers the ability to learn without being explicitly programmed.機(jī)器學(xué)習(xí)研究和構(gòu)建的是一種特殊算法(而非某一個(gè)特定的算法),能夠讓計(jì)算機(jī)自己在數(shù)據(jù)中學(xué)習(xí)從而進(jìn)行預(yù)測(cè)伴网。所以蓬推,機(jī)器學(xué)習(xí)不是某種具體的算法,而是很多算法的統(tǒng)稱澡腾。
機(jī)器學(xué)習(xí)包含了很多種不同的算法沸伏,深度學(xué)習(xí)就是其中之一,其他方法包括決策樹动分,聚類毅糟,貝葉斯等。深度學(xué)習(xí)的靈感來(lái)自大腦的結(jié)構(gòu)和功能刺啦,即許多神經(jīng)元的互連留特。人工神經(jīng)網(wǎng)絡(luò)(ANN)是模擬大腦生物結(jié)構(gòu)的算法。不管是機(jī)器學(xué)習(xí)還是深度學(xué)習(xí)玛瘸,都屬于人工智能(AI)的范疇蜕青。所以人工智能、機(jī)器學(xué)習(xí)糊渊、深度學(xué)習(xí)可以用下面的圖來(lái)表示:
一渺绒、什么是機(jī)器學(xué)習(xí)贺喝?
在解釋機(jī)器學(xué)習(xí)的原理之前,先把最精髓的基本思路介紹給大家宗兼,理解了機(jī)器學(xué)習(xí)最本質(zhì)的東西躏鱼,就能更好的利用機(jī)器學(xué)習(xí),同時(shí)這個(gè)解決問(wèn)題的思維還可以用到工作和生活中殷绍。
1. 機(jī)器學(xué)習(xí)的基本思路
1). 把現(xiàn)實(shí)生活中的問(wèn)題抽象成數(shù)學(xué)模型染苛,并且很清楚模型中不同參數(shù)的作用
2). 利用數(shù)學(xué)方法對(duì)這個(gè)數(shù)學(xué)模型進(jìn)行求解,從而解決現(xiàn)實(shí)生活中的問(wèn)題
3). 評(píng)估這個(gè)數(shù)學(xué)模型主到,是否真正的解決了現(xiàn)實(shí)生活中的問(wèn)題茶行,解決的如何?
無(wú)論使用什么算法登钥,使用什么樣的數(shù)據(jù)畔师,最根本的思路都逃不出上面的3步!
當(dāng)我們理解了這個(gè)基本思路牧牢,我們就能發(fā)現(xiàn):
不是所有問(wèn)題都可以轉(zhuǎn)換成數(shù)學(xué)問(wèn)題的看锉。那些沒(méi)有辦法轉(zhuǎn)換的現(xiàn)實(shí)問(wèn)題 AI 就沒(méi)有辦法解決姿锭。同時(shí)最難的部分也就是把現(xiàn)實(shí)問(wèn)題轉(zhuǎn)換為數(shù)學(xué)問(wèn)題這一步。
2. 機(jī)器學(xué)習(xí)的原理
下面以監(jiān)督學(xué)習(xí)為例伯铣,給大家講解一下機(jī)器學(xué)習(xí)的實(shí)現(xiàn)原理艾凯。
假如我們正在教小朋友識(shí)字(一、二懂傀、三)。我們首先會(huì)拿出3張卡片蜡感,然后便讓小朋友看卡片蹬蚁,一邊說(shuō)“一條橫線的是一、兩條橫線的是二郑兴、三條橫線的是三”犀斋。
不斷重復(fù)上面的過(guò)程,小朋友的大腦就在不停的學(xué)習(xí)情连。
當(dāng)重復(fù)的次數(shù)足夠多時(shí)叽粹,小朋友就學(xué)會(huì)了一個(gè)新技能——認(rèn)識(shí)漢字:一、二却舀、三虫几。
我們用上面人類的學(xué)習(xí)過(guò)程來(lái)類比機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)跟上面提到的人類學(xué)習(xí)過(guò)程很相似挽拔。
1)上面提到的認(rèn)字的卡片在機(jī)器學(xué)習(xí)中叫——訓(xùn)練集
2)上面提到的“一條橫線辆脸,兩條橫線”這種區(qū)分不同漢字的屬性叫——特征
3)小朋友不斷學(xué)習(xí)的過(guò)程叫——建模
4)學(xué)會(huì)了識(shí)字后總結(jié)出來(lái)的規(guī)律叫——模型
通過(guò)訓(xùn)練集,不斷識(shí)別特征螃诅,不斷建模啡氢,最后形成有效的模型,這個(gè)過(guò)程就叫“機(jī)器學(xué)習(xí)”术裸!
3. 監(jiān)督學(xué)習(xí)倘是、非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)
機(jī)器學(xué)習(xí)根據(jù)訓(xùn)練方法大致可以分為3大類:
1)監(jiān)督學(xué)習(xí)
2)非監(jiān)督學(xué)習(xí)
3)強(qiáng)化學(xué)習(xí)
除此之外袭艺,大家可能還聽(tīng)過(guò)“半監(jiān)督學(xué)習(xí)”之類的說(shuō)法搀崭,但是那些都是基于上面3類的變種,本質(zhì)沒(méi)有改變匹表。
3.1 監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是指我們給算法一個(gè)數(shù)據(jù)集门坷,并且給定正確答案。機(jī)器通過(guò)數(shù)據(jù)來(lái)學(xué)習(xí)正確答案的計(jì)算方法袍镀。
舉個(gè)栗子:
我們準(zhǔn)備了一大堆貓和狗的照片默蚌,我們想讓機(jī)器學(xué)會(huì)如何識(shí)別貓和狗。當(dāng)我們使用監(jiān)督學(xué)習(xí)的時(shí)候苇羡,我們需要給這些照片打上標(biāo)簽绸吸。
我們給照片打的標(biāo)簽就是“正確答案”,機(jī)器通過(guò)大量學(xué)習(xí),就可以學(xué)會(huì)在新照片中認(rèn)出貓和狗锦茁。
這種通過(guò)大量人工打標(biāo)簽來(lái)幫助機(jī)器學(xué)習(xí)的方式就是監(jiān)督學(xué)習(xí)攘轩。這種學(xué)習(xí)方式效果非常好,但是成本也非常高码俩。
3.2 非監(jiān)督學(xué)習(xí)
非監(jiān)督學(xué)習(xí)中度帮,給定的數(shù)據(jù)集沒(méi)有“正確答案”,所有的數(shù)據(jù)都是一樣的稿存。無(wú)監(jiān)督學(xué)習(xí)的任務(wù)是從給定的數(shù)據(jù)集中笨篷,挖掘出潛在的結(jié)構(gòu)。
舉個(gè)栗子:
我們把一堆貓和狗的照片給機(jī)器瓣履,不給這些照片打任何標(biāo)簽率翅,但是我們希望機(jī)器能夠?qū)⑦@些照片分分類。
通過(guò)學(xué)習(xí)袖迎,機(jī)器會(huì)把這些照片分為2類冕臭,一類都是貓的照片,一類都是狗的照片燕锥。雖然跟上面的監(jiān)督學(xué)習(xí)看上去結(jié)果差不多辜贵,但是有著本質(zhì)的差別:
非監(jiān)督學(xué)習(xí)中,雖然照片分為了貓和狗脯宿,但是機(jī)器并不知道哪個(gè)是貓念颈,哪個(gè)是狗。對(duì)于機(jī)器來(lái)說(shuō)连霉,相當(dāng)于分成了 A榴芳、B 兩類。
3.3 強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)更接近生物學(xué)習(xí)的本質(zhì),因此有望獲得更高的智能歉井。它關(guān)注的是智能體如何在環(huán)境中采取一系列行為柿祈,從而獲得最大的累積回報(bào)。通過(guò)強(qiáng)化學(xué)習(xí)哩至,一個(gè)智能體應(yīng)該知道在什么狀態(tài)下應(yīng)該采取什么行為躏嚎。
最典型的場(chǎng)景就是打游戲。
二菩貌、 機(jī)器學(xué)習(xí)實(shí)操的7個(gè)步驟
通過(guò)上面的內(nèi)容卢佣,我們對(duì)機(jī)器學(xué)習(xí)已經(jīng)有一些模糊的概念了,這個(gè)時(shí)候肯定會(huì)特別好奇:到底怎么使用機(jī)器學(xué)習(xí)箭阶?
機(jī)器學(xué)習(xí)在實(shí)際操作層面一共分為7步:
1)收集數(shù)據(jù)
2)數(shù)據(jù)準(zhǔn)備
3)選擇一個(gè)模型
4)訓(xùn)練
5)評(píng)估
6)參數(shù)調(diào)整
7)預(yù)測(cè)(開始使用)
假設(shè)我們的任務(wù)是通過(guò)酒精度和顏色來(lái)區(qū)分紅酒和啤酒虚茶,下面詳細(xì)介紹一下機(jī)器學(xué)習(xí)中每一個(gè)步驟是如何工作的戈鲁。
步驟1:收集數(shù)據(jù)
我們?cè)诔匈I來(lái)一堆不同種類的啤酒和紅酒,然后再買來(lái)測(cè)量顏色的光譜儀和用于測(cè)量酒精度的設(shè)備嘹叫。
這個(gè)時(shí)候婆殿,我們把買來(lái)的所有酒都標(biāo)記出他的顏色和酒精度,會(huì)形成下面這張表格罩扇。
顏色酒精度種類
6105啤酒
59913紅酒
69314紅酒
………
這一步非常重要婆芦,因?yàn)閿?shù)據(jù)的數(shù)量和質(zhì)量直接決定了預(yù)測(cè)模型的好壞。
步驟2:數(shù)據(jù)準(zhǔn)備
在這個(gè)例子中喂饥,我們的數(shù)據(jù)是很工整的寞缝,但是在實(shí)際情況中,我們收集到的數(shù)據(jù)會(huì)有很多問(wèn)題仰泻,所以會(huì)涉及到數(shù)據(jù)清洗等工作。
當(dāng)數(shù)據(jù)本身沒(méi)有什么問(wèn)題后滩届,我們將數(shù)據(jù)分成3個(gè)部分:訓(xùn)練集(60%)集侯、驗(yàn)證集(20%)、測(cè)試集(20%)帜消,用于后面的驗(yàn)證和評(píng)估工作棠枉。
步驟3:選擇一個(gè)模型
研究人員和數(shù)據(jù)科學(xué)家多年來(lái)創(chuàng)造了許多模型辈讶。有些非常適合圖像數(shù)據(jù),有些非常適合于序列(如文本或音樂(lè))娄猫,有些用于數(shù)字?jǐn)?shù)據(jù)贱除,有些用于基于文本的數(shù)據(jù)。在我們的例子中媳溺,由于我們只有2個(gè)特征月幌,顏色和酒精度,我們可以使用一個(gè)小的線性模型悬蔽,這是一個(gè)相當(dāng)簡(jiǎn)單的模型扯躺。
步驟4:訓(xùn)練
大部分人都認(rèn)為這個(gè)是最重要的部分,其實(shí)并非如此~ 數(shù)據(jù)數(shù)量和質(zhì)量蝎困、還有模型的選擇比訓(xùn)練本身重要更多(訓(xùn)練知識(shí)臺(tái)上的3分鐘录语,更重要的是臺(tái)下的10年功)。這個(gè)過(guò)程就不需要人來(lái)參與的禾乘,機(jī)器獨(dú)立就可以完成澎埠,整個(gè)過(guò)程就好像是在做算術(shù)題。因?yàn)闄C(jī)器學(xué)習(xí)的本質(zhì)就是將問(wèn)題轉(zhuǎn)化為數(shù)學(xué)問(wèn)題盖袭,然后解答數(shù)學(xué)題的過(guò)程失暂。
步驟5:評(píng)估
一旦訓(xùn)練完成彼宠,就可以評(píng)估模型是否有用。這是我們之前預(yù)留的驗(yàn)證集和測(cè)試集發(fā)揮作用的地方弟塞。評(píng)估的指標(biāo)主要有 準(zhǔn)確率凭峡、召回率、F值决记。這個(gè)過(guò)程可以讓我們看到模型如何對(duì)尚未看到的數(shù)是如何做預(yù)測(cè)的摧冀。這意味著代表模型在現(xiàn)實(shí)世界中的表現(xiàn)。
步驟6:參數(shù)調(diào)整
完成評(píng)估后系宫,您可能希望了解是否可以以任何方式進(jìn)一步改進(jìn)訓(xùn)練牲阁。我們可以通過(guò)調(diào)整參數(shù)來(lái)做到這一點(diǎn)嫉晶。當(dāng)我們進(jìn)行訓(xùn)練時(shí),我們隱含地假設(shè)了一些參數(shù),我們可以通過(guò)認(rèn)為的調(diào)整這些參數(shù)讓模型表現(xiàn)的更出色况褪。
步驟7:預(yù)測(cè)
我們上面的6個(gè)步驟都是為了這一步來(lái)服務(wù)的。這也是機(jī)器學(xué)習(xí)的價(jià)值寒砖。這個(gè)時(shí)候逗宁,當(dāng)我們買來(lái)一瓶新的酒,只要告訴機(jī)器他的顏色和酒精度嫉到,他就會(huì)告訴你沃暗,這時(shí)啤酒還是紅酒了。
轉(zhuǎn)自:https://easyai.tech/ai-definition/machine-learning/