什么是機器學習
機器學習是一幫計算機科學家想讓計算機像人一樣思考所研發(fā)出的計算機理論,他們曾經說過,人和計算機本身沒有區(qū)別媳谁,同樣都是一大批互相連接的信息傳遞和存儲元素所組成的系統(tǒng),所以有了這樣的想法,加上他們得天獨厚的數(shù)學功底奶卓,機器學習的前身也就孕育而生了。
機器學習的萌芽誕生于19世紀60年代撼玄,20年前開始逐步興起夺姑,它是一門跨學科的交融。這里邊包含了概率論掌猛,統(tǒng)計學等等學科盏浙,隨著計算機硬件的提升,計算機運算性能的不斷提高荔茬,他真正開始進入到我們的日常生活中废膘,而在不久的將來,我相信他也會成為我們生活中必不可少的組成元素慕蔚。
讓我們說說日常當中的機器學習的應用吧
第一個提到的丐黄,最具代表性的公司,應該就是Google坊萝,他們所研發(fā)的Google NOW孵稽,Google Photos都是基于機器學習的產物。同樣在百度十偶,圖片識別也是應用到機器學習中的視覺處理系統(tǒng)菩鲜。與此同時,各種各樣的企業(yè)都開始嘗試把自己的產品往機器學習上靠攏 惦积。比如金融公司的匯率預測接校,股票漲跌,房地產公司的房價預測等等。
機器學習不僅只有一種方法蛛勉,實現(xiàn)他的方法有多種多樣鹿寻。這里所說的方法,在程序語言中诽凌,我們叫做算法毡熏。目前所有的機器學習的算法,大概分為四類到五類侣诵。如果在學習過程中痢法,我們不斷向計算機提供數(shù)據(jù)和這些數(shù)據(jù)相對應的值。下面我舉一個例子
現(xiàn)在給計算機看一個貓和狗的圖片杜顺,告訴計算機那些圖片里的是貓财搁,那些是狗,然后再讓他學習分辨去貓和狗躬络,通過這樣的指引的方式尖奔,讓計算機學習我們是如何把這些圖片數(shù)據(jù)所對應的圖片所代表的物體,也就是讓計算機學習那些標簽可以代表那些圖片穷当,這種方式就叫做“監(jiān)督學習(Supervised learning)”,預測房屋的價格提茁,股票的漲停同樣可以用監(jiān)督學習來實現(xiàn),大家所熟知的神經網絡同樣是一種監(jiān)督學習的方式膘滨,如果同樣在這樣的學習過程中甘凭,我們只給計算機提供貓和狗的圖片稀拐,但是并沒有告訴他那些是貓火邓,那些是狗。取而代之的是德撬,我讓他自己去判斷和分類铲咨,讓他自己總結出這兩種類型的圖片的不同之處,這就是一種“非監(jiān)督學習(Un-superrvised Learning)”,在這一種學習過程中蜓洪,我們可以不用提供數(shù)據(jù)所對應的標簽信息纤勒,計算機通過觀察各種數(shù)據(jù)之間的特性,會發(fā)現(xiàn)這些背后的規(guī)律隆檀,這些規(guī)律也就是非監(jiān)督方法所學到的東西摇天。
還有一種方法綜合了監(jiān)督學習和非監(jiān)督學習的特征,這種就叫做“半監(jiān)督學習”(semi-supervised learning),它主要考慮如何利用少量的恐仑,帶有標簽的樣本和大量的沒有標簽的樣本進行分揀和分類泉坐。
在規(guī)劃機器人的行為準則方面,一種機器學習的方法叫做“強化學習”(reinforcement learning)裳仆,也就是把計算機丟到一個對于他完全陌生的環(huán)境或者讓他完成一項從未接觸過的任務腕让,他自己回去嘗試各種的手段,最后讓自己去成功適應這樣一個陌生的環(huán)境歧斟,或者學會完成這件任務的方法途徑纯丸。比如說我像訓練機器人去投籃偏形,我要只需要給他一個球,并告訴他你投進了我給你記一分觉鼻,讓他自己去嘗試各種各樣的投籃的方法俊扭,在開始階段,他的命中率可能會非常低坠陈,不過他會想人類一樣统扳,自己總結和學習投籃失敗活或者成功的經驗,最后可以達到一個很高的命中率畅姊。Google開發(fā)的AlphaGo也就是應用了其中的一種學習方式咒钟。還有一種就是和強化學習類似的一種學習方法,叫做遺傳算法(Genetio algorithm)若未。這一種方法是模擬我們熟知的進化理論朱嘴,淘汰弱者,適者生存粗合。通過這種淘汰的機制去選擇最優(yōu)的設計或者模型萍嬉。比如讓計算機學會玩超級瑪麗,最開始的馬里奧一代可能不久就會犧牲了隙疚,不過計算機會基于一代的馬里奧隨機生成第二代壤追,然后再保存這些代里邊最厲害的馬里奧,淘汰掉比較弱的馬里奧供屉,然后再次幾區(qū)強者的繁衍和變異行冰,生成更強的馬里奧,這也就是遺傳算法的基本思想伶丐。
以上就是比較重要的機器學習方法悼做,我們再來總結一下:
他們包括有數(shù)據(jù)和標簽的監(jiān)督學習,只有數(shù)據(jù)沒有標簽的非監(jiān)督學習哗魂,有結合了監(jiān)督學習和非監(jiān)督學習的半監(jiān)督學習肛走。還有從經驗中總結提升的強化學習。最后是和強化學習類似的录别,有著適者生存的朽色,不適者淘汰準則的遺傳算法學習。如果你不僅僅只滿足與弄懂這些的區(qū)別组题,還想學著如何在你的生活中如何使用這些機器學習的方法葫男。推薦去麻省理工的網站上尋找更多的資料,也可以繼續(xù)關注我往踢,我也會定期的推薦如何用當下流行的編程語言Java和他的機器學習模塊來實現(xiàn)通俗易懂的機器學習的教程腾誉。
下一期讓我們來聊聊什么是神經網絡