一瘪弓、什么是人工智能
人工智能(Artificial Intelligence),英文縮寫為AI仅叫。它是研究遂跟、開發(fā)用于模擬延伸和擴展人的智能的理論假消、方法窄锅、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)殿雪。
簡單來說就是讓機器能夠模擬人類的思維能力,讓它能夠像人一樣去感知惰瓜、思考,甚至決策租冠,要知道归园,我們看見的世界和機器所見的世界很不一樣盗扒,我們看見一個人,知道那是一個人,看見一輛車,知道那是一輛車坛缕,但機器看到的宠页,卻只是一串毫無意義的數(shù)字。
機器代入人類的視角晌端,去學(xué)習(xí)人類的語言亲轨,進而總結(jié)經(jīng)驗,做出判斷鸟顺。
通常都是我們?nèi)W(xué)習(xí)機器語言惦蚊,如C語言、Java語言讯嫂,寫進機器里蹦锋,變成各種電信號,指揮機器去做事欧芽,但現(xiàn)在我們希望它們能夠不依賴這種指揮莉掂,就能根據(jù)人的目的,自動察覺應(yīng)該干什么千扔。
二憎妙、機器學(xué)習(xí)
人通過經(jīng)驗库正,歸納出規(guī)律。機器學(xué)習(xí)通過數(shù)據(jù)尚氛,訓(xùn)練出模型诀诊。
機器學(xué)習(xí)不是基于編程形成的結(jié)果,因此它的處理過程不是因果的邏輯阅嘶,而是通過歸納思想得出的相關(guān)性結(jié)論。
數(shù)據(jù)通過算法構(gòu)建出模型并對模型進行評估载迄,評估的性能如果達到要求就拿這個模型來測試其他的數(shù)據(jù)讯柔,如果達不到要求就要調(diào)整算法來重新建立模型,再次進行評估护昧,如此循環(huán)往復(fù)魂迄,最終獲得滿意的模型來處理其他的數(shù)據(jù)。
(1) 監(jiān)督學(xué)習(xí)
輸入數(shù)據(jù)中有導(dǎo)師信號惋耙,以概率函數(shù)捣炬、代數(shù)函數(shù)或人工神經(jīng)網(wǎng)絡(luò)為基函數(shù)模型,采用迭代計算方法绽榛,學(xué)習(xí)結(jié)果為函數(shù)湿酸。
就像人類小時學(xué)習(xí)一樣,老師一個字母一個字母教漢語拼音灭美。反復(fù)指著一個字母推溃,教你認,教你讀届腐,糾正你的發(fā)音铁坎,糾正你的書寫直到過關(guān)。這個過程被稱為監(jiān)督學(xué)習(xí)犁苏。
對于機器大腦來說硬萍,就是引導(dǎo)它從數(shù)據(jù)中尋找規(guī)律,也就是給它看題目围详,并告訴它答案朴乖,當它看的足夠多就會自己做題了,這種方法經(jīng)常被用于各種識別任務(wù)短曾,如人臉識別寒砖、車牌識別等。
(2)無監(jiān)督學(xué)習(xí)
輸入數(shù)據(jù)中無導(dǎo)師信號嫉拐,采用聚類方法哩都,學(xué)習(xí)結(jié)果為類別。典型的無導(dǎo)師學(xué)習(xí)有發(fā)現(xiàn)學(xué)習(xí)婉徘、聚類漠嵌、競爭學(xué)習(xí)等咐汞。
無監(jiān)督學(xué)習(xí)在訓(xùn)練的時候并不知道正確結(jié)果。
相當于只有題目沒有答案儒鹿,AI只能根據(jù)自己觀察到的特征化撕,把認為相似的東西分為一組,雖然它不知道誰是貓誰是狗约炎,但是也能區(qū)分出來植阴。這種方法很適合從一堆東西中找到隱藏規(guī)律,用途也比監(jiān)督學(xué)習(xí)廣圾浅。
(3) 強化學(xué)習(xí)
以環(huán)境反慣(獎/懲信號)作為輸人掠手,以統(tǒng)計和動態(tài)規(guī)劃技術(shù)為指導(dǎo)的一種學(xué)習(xí)方法。
這時AI不用做題狸捕,而是直接與環(huán)境互動喷鸽, 通過環(huán)境給出的獎懲來學(xué)習(xí),目的是通過一系列動作獲得最大的獎勵灸拍,在互動的過程中AI會不斷調(diào)整自己的行為做祝,對環(huán)境變化做出最佳的應(yīng)對,這種方法常被用來訓(xùn)練行為鸡岗,比如玩游戲混槐、無人駕駛、推送廣告等等纤房。
三纵隔、深度學(xué)習(xí)
人腦在識別人臉時,并不是像拼圖一樣炮姨,眼睛一塊鼻子一塊地分開提取捌刮,再拼成一張臉,而是分層次的學(xué)習(xí)提取舒岸。
當人臉在視網(wǎng)膜上成像后绅作,會先傳到我們大腦的第一層感覺神經(jīng),從中解析出簡單線條蛾派,再傳到第二層感覺神經(jīng)俄认,提取出更多輪廓信息,這樣一層層傳遞洪乍,最后到達我們的大腦皮層眯杏,形成人臉的整體形象,在和我們記憶中的形象做對比壳澳,就把人給認出來了岂贩,而機器識別人臉也使用了類似的辦法。
現(xiàn)代人臉識別系統(tǒng)主要通過一種被稱為深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)巷波,來對人臉特征進行分層提取萎津,再和記錄的人臉做對比卸伞。
深度神經(jīng)網(wǎng)絡(luò)處理信息的方式,和人腦非常相似锉屈,外部圖像輸入后荤傲,信號會像人類神經(jīng)傳導(dǎo)一樣,在網(wǎng)絡(luò)中逐層傳遞颈渊,一些特征被放大遂黍,另一些特征被縮小,經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)俊嗽,可以就此一步步排除干擾妓湘,找到那些穩(wěn)定的人臉特征。
以一個簡單的深度卷積神經(jīng)網(wǎng)絡(luò)為例
第一層:先提取到一些簡單的線條乌询,表達圖像中某些位置和某些方向上的輪廓。
第二層:會根據(jù)前一層檢測出的線條豌研,提取一些局部特征妹田,如眼睛、鼻子鹃共、嘴巴等鬼佣。
第三層:提取大體的人臉輪廓。
通過這樣的多層處理就可以從原始圖片中提取出表達人臉信息的有效特征霜浴,而光線晶衷、位置、姿態(tài)等和身份無關(guān)的因素阴孟,則在特征提取的過程被一步步地濾除晌纫。
四、機器博弈
弈就是棋永丝,機器博弈就是機器下棋锹漱,下棋是人類想到能夠體現(xiàn)機器智能最早的方式之一,它代表的是一類決策技能慕嚷。AI要做的是在多種可能性中哥牍,選擇最好的那一個。
2019年喝检,AlphaGo先后戰(zhàn)勝世界圍棋冠軍李世石和柯潔嗅辣,圍棋曾被稱為人類智力的圣杯,以至于當時棋壇上一片絕望之聲挠说。
AlphaGo是怎么做到的澡谭?
首先可能想到的是暴力搜索,也就是窮舉所有可能纺涤,找到最好的那一步译暂,但圍棋的棋盤抠忘,是19*19的方格,每一格可以下白子外永、黑子以及無子崎脉,加起來復(fù)雜度達到了3361次方,約等于10172次方伯顶,遠遠大于宇宙中所有原子的總數(shù)10^80次方囚灼,所以這個方法顯然是行不通的。
那么首要的問題就是解決搜索范圍祭衩,我們?nèi)祟愊缕逶钐澹膊⒉粫紤]所有情況,而只會根據(jù)棋感掐暮,在腦海想最好的那幾種走法蝎抽,然后在想這之后對手最有可能的走法,在想接下來自己最可能的走法路克,如此幾步大致做出判斷樟结,AlphaGo的思考方式也和這差不多。
使用兩個深度神經(jīng)網(wǎng)絡(luò)來充當自己的大腦精算,每個神經(jīng)網(wǎng)絡(luò)都可以通過學(xué)習(xí)人類棋譜瓢宦,或者自我對弈來積累經(jīng)驗。
其中一個被稱為策略網(wǎng)絡(luò)的大腦灰羽,主要思考下一步走什么驮履,它會憑借學(xué)到的經(jīng)驗,給出當前棋局下廉嚼,在每個點落子的概率玫镐,那些概率低的點會被它忽略,概率高的點則被納入考慮范圍前鹅。
而另一個被稱為評價網(wǎng)絡(luò)的大腦摘悴,則會根據(jù)經(jīng)驗,評估在每一步落子之后舰绘,黑棋或者白棋贏棋的機會蹂喻,它不關(guān)心過程,只關(guān)心結(jié)果捂寿,那些評價低的棋子口四,同樣也會被丟棄。
這樣的兩大腦相互配合秦陋,就將圍棋無比巨大的搜索空間蔓彩,壓縮到了可控的程度,AlphaGo也就此成為一位圍棋大師。
有意思的是一開始科學(xué)家們使用人類大師的棋譜赤嚼,來給AlphaGo積累經(jīng)驗旷赖,但后來證明,加入了隨機走子更卒,自我博弈之后等孵,AlphaGo變得更聰明了,這說明人類的認知是有限的蹂空,但AI卻可以憑借超快的自我搜索能力突破這種局限俯萌。
AlphaGo的升級版AlphaGo Zero,完全摒棄人類經(jīng)驗上枕,僅通過三天的自我博弈訓(xùn)練咐熙,就以100:0的戰(zhàn)績完敗了AlphaGo。