對所有事情都有一定了通常比擁有一項專業(yè)技能更實用。對于進入新興市場領(lǐng)域的人來說尤其如此坚踩。特別是指的注意的科技領(lǐng)域塌碌。
許多人認為他們對AI有一些了解舆驶。但是這個領(lǐng)域很新橱健,而且在飛速發(fā)展,專家們每天都在開拓新領(lǐng)域沙廉。
這就是本文的切入點拘荡。我希望通過簡短易懂的語言,讓有科技頭腦的人群快速熟悉AI術(shù)語撬陵、語言和技術(shù)珊皿。同時希望許多非該領(lǐng)域的人群能夠讀懂本文,并作為參考巨税。
介紹
人工智能(Artificial intelligence)蟋定,深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)是用來描述強大的機器學(xué)習(xí)技術(shù)的術(shù)語,這些技術(shù)可以解決許多現(xiàn)實世界的問題草添。
盡管演繹推理驶兜,推理和決策與人腦相比還有一段距離,但AI技術(shù)和相關(guān)算法已有許多最新進展远寸。AI可以從中學(xué)習(xí)的大型數(shù)據(jù)集也越來越多抄淑。
AI領(lǐng)域涉及到數(shù)學(xué)、統(tǒng)計學(xué)驰后、概率論肆资、物理學(xué)、信號處理灶芝、機器學(xué)習(xí)郑原、計算機科學(xué)、心理學(xué)夜涕、語言學(xué)和神經(jīng)科學(xué)等領(lǐng)域颤专。圍繞AI的社會責(zé)任和道德問題與許多哲學(xué)問題有相似之處。
進一步推進AI技術(shù)的動機是钠乏,解決許多變量問題所需的解決方案非常復(fù)雜栖秕,難以理解且不容易手動完成。
越來越多的公司晓避、研究人員和個人都依靠機器學(xué)習(xí)來解決問題簇捍,而不需要全面的編程指導(dǎo)只壳。程序員發(fā)現(xiàn)編寫模型和解決數(shù)據(jù)問題所需的算法越來越復(fù)雜和耗時。即使當我們形成有用的模式來處理大數(shù)據(jù)集時暑塑,這往往是非常復(fù)雜吼句,難以維護并且不能充分測試。
現(xiàn)代機器學(xué)習(xí)和人工智能算法事格,以及訓(xùn)練數(shù)據(jù)都能夠為我們編程惕艳。
概述
智能(Intelligence):能夠感知信息,并將其作為知識應(yīng)用于環(huán)境中的適應(yīng)性行為驹愚。
以上維基百科對智能的定義可以適用于大腦和機器远搪。智能并不意味著意識,這是科幻小說家普遍存在的誤解逢捺。
在網(wǎng)上搜索 AI 的例子谁鳍,你會看到IBM的Watson。這是一種機器學(xué)習(xí)算法劫瞳,由于在2011年在電視問答節(jié)目《危險邊緣》中獲勝而出名倘潜。此后,它被重新定位志于,并被用作各種商業(yè)應(yīng)用的模板涮因。蘋果,亞馬遜和谷歌正努力在我們的家庭和手機中構(gòu)建類似的系統(tǒng)伺绽。
自然語言處理和語音識別是機器學(xué)習(xí)的第一個商業(yè)應(yīng)用养泡。之后實現(xiàn)了許多其他自動識別任務(wù)(模式、文本憔恳、音頻瓤荔、圖像、視頻钥组、面部等)输硝。應(yīng)用范圍正在飛速增長,包括自動駕駛汽車程梦、醫(yī)療診斷点把、游戲、搜索引擎屿附、垃圾郵件過濾郎逃、打擊犯罪、市場營銷挺份、機器人技術(shù)褒翰、遙感技術(shù)、計算機視覺、交通优训、音樂識別朵你、分類等方面。
AI 已經(jīng)深入到我們所使用的技術(shù)中揣非,現(xiàn)在許多人并不將其視為”人工智能”抡医,而只是計算的延伸。如果上街采訪詢問行人他們手機上是否有AI早敬,他們可能會說不忌傻。但是AI算法已經(jīng)嵌入了各個領(lǐng)域,從預(yù)測文本到相機中的自動對焦系統(tǒng)搞监。人們通常認為AI時代尚未到來水孩,但實際上我們已處于AI時代,而且已經(jīng)有一段時間了腺逛。
AI 是一個相當普遍的術(shù)語荷愕。大多數(shù)研究的重點是人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)這類較狹窄的領(lǐng)域衡怀。
你的大腦如何工作
人腦是一個精密的碳計算機棍矛,估計每秒執(zhí)行一百萬兆次計算(1000 千萬億次),消耗約20瓦的功率抛杨。中國的超級計算機天河二號(截止到本文是目前世界上最快的超級計算機)每秒只能計算33,860萬億次計算(33.86 千萬億次)够委,消耗1760萬瓦(17.6兆瓦)。顯然機器要像媲美人腦還有一段路要走怖现。
大腦用于進行思維的確切機制需要辯論和深入研究茁帽。然而,內(nèi)部運行原理往往圍繞神經(jīng)元和其構(gòu)成的網(wǎng)絡(luò)屈嗤。大腦約包含1000億個神經(jīng)元潘拨。
神經(jīng)元之間的相互作用和溝通能夠傳遞信息。在激活其他神經(jīng)元之前饶号,單個神經(jīng)元的信號被進行加權(quán)和合并铁追。消息傳遞、結(jié)合茫船、激活其他神經(jīng)元的過程是跨層重復(fù)的琅束。在人腦的1000億個神經(jīng)元中,整體的信息加權(quán)是非常復(fù)雜的算谈。
每個神經(jīng)元在將功能或變化應(yīng)用于加權(quán)輸入前涩禀,會先測試是否達到在激活閾值。這些因素加起來可能是線性或非線性的然眼。
初始輸入信號來自各種來源......我們的感官艾船、身體機能的內(nèi)部監(jiān)測(血氧水平,胃內(nèi)容物等)。在決定如何反應(yīng)之前屿岂,單個神經(jīng)元可能會接收到數(shù)十萬個輸入信號礁蔗。
思考或處理給肌肉的結(jié)果指令是輸入信號和反饋在神經(jīng)網(wǎng)絡(luò)中經(jīng)過多層和多個周期處理的總和。但大腦的神經(jīng)網(wǎng)絡(luò)也在發(fā)生變化和更新雁社,包括神經(jīng)元間權(quán)重的調(diào)整浴井。這是由學(xué)習(xí)和經(jīng)驗造成的。
人類大腦的模型被用作模板在計算機仿真環(huán)境下復(fù)制大腦霉撵,即人工神經(jīng)網(wǎng)絡(luò)磺浙。
人工神經(jīng)網(wǎng)絡(luò)(ANNs)
人工神經(jīng)網(wǎng)絡(luò)是受到生物神經(jīng)網(wǎng)絡(luò)啟發(fā)的模擬數(shù)學(xué)模型。人工神經(jīng)網(wǎng)絡(luò)能夠?qū)斎牒洼敵鲋g的非線性關(guān)系進行建模和處理徒坡。人工神經(jīng)元之間的權(quán)重通過學(xué)習(xí)算法進行調(diào)整撕氧,該算法能夠讀取觀測數(shù)據(jù),并以提高輸出為目標喇完。
使用優(yōu)化技術(shù)讓人工神經(jīng)網(wǎng)絡(luò)解決方案盡可能接近最佳解決方案伦泥。如果優(yōu)化成功,人工神經(jīng)網(wǎng)絡(luò)能夠以高性能解決特定問題锦溪。
人工神經(jīng)網(wǎng)絡(luò)建模時使用到神經(jīng)元層不脯。這些層的結(jié)構(gòu)被稱為模型的結(jié)構(gòu)。神經(jīng)元是獨立的計算單元刻诊,能夠接收輸入并應(yīng)用數(shù)學(xué)函數(shù)來確定消息是否能傳遞防楷。
在簡單的三層模型中,第一層是輸入層则涯,接下來是隱藏層和輸出層复局。每層可以包含一個或多個神經(jīng)元。
隨著模型變得越來越復(fù)雜粟判,需要更多的層和更多的神經(jīng)元亿昏,解決問題的能力也隨之增加。但是如果模型對于給出的問題來說太大了档礁,那么模型不能被有效地優(yōu)化角钩。這被稱為過擬合。
基本的模型結(jié)構(gòu)和調(diào)整是人工神經(jīng)網(wǎng)絡(luò)技術(shù)的主要元素事秀,同時還包括讀取數(shù)據(jù)的學(xué)習(xí)算法彤断。所有部分都具備模型的性能。
模型具有激活函數(shù)的特征易迹。這用于將神經(jīng)元的加權(quán)輸入轉(zhuǎn)換為輸出激活宰衙。有一些轉(zhuǎn)換可用作激活函數(shù)。
人工神經(jīng)網(wǎng)絡(luò)非常強大睹欲。即使少數(shù)神經(jīng)元中的數(shù)學(xué)很簡單供炼,整個網(wǎng)絡(luò)也會變得復(fù)雜一屋。由于人工神經(jīng)網(wǎng)絡(luò)被認為是“黑盒”算法。選擇人工神經(jīng)網(wǎng)絡(luò)作為解決問題的工具應(yīng)該小心袋哼,因為之后無法取消系統(tǒng)的決策過程冀墨。
深度學(xué)習(xí)
深度學(xué)習(xí)是用來描述消耗原始數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)和相關(guān)算法的術(shù)語。數(shù)據(jù)通過模型層進行處理涛贯,目標是計算輸出诽嘉。
無監(jiān)督學(xué)習(xí)是深度學(xué)習(xí)技術(shù)卓越之處。正確配置的人工神經(jīng)網(wǎng)絡(luò)能夠自動識別輸入數(shù)據(jù)的重要特征弟翘,從而得出期望的輸出虫腋。傳統(tǒng)意義上,理解輸入數(shù)據(jù)的重任通常落在構(gòu)建系統(tǒng)的程序員身上稀余。然而悦冀,在深度學(xué)習(xí)設(shè)置中,模型本身可以識別如何解釋數(shù)據(jù)睛琳,從而獲得有意義的結(jié)果盒蟆。一旦優(yōu)化的系統(tǒng)進行訓(xùn)練,模型的計算师骗、內(nèi)存和功耗要求就會大大降低历等。
簡而言之,特征學(xué)習(xí)算法讓機器使用合適的數(shù)據(jù)學(xué)習(xí)特定任務(wù)丧凤,即算法學(xué)習(xí)如何學(xué)習(xí)募闲。
深度學(xué)習(xí)應(yīng)用于各種各樣的任務(wù)步脓,這被認為是創(chuàng)新的 AI 技術(shù)之一愿待。其中有用于監(jiān)督、無監(jiān)督和半監(jiān)督學(xué)習(xí)問題的算法靴患。
陰影學(xué)習(xí)用于描述更簡單的深度學(xué)習(xí)形式仍侥,其中數(shù)據(jù)的特征選擇需要程序員進行預(yù)先處理和更深入的知識。由此產(chǎn)生的模型更加透明和性能更高鸳君,但會增加設(shè)計階段的時間农渊。
結(jié)語
AI 是強大的數(shù)據(jù)處理領(lǐng)域,能夠比程序員開發(fā)的傳統(tǒng)算法更快地得出復(fù)雜的結(jié)果或颊。人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)可以解決多種難題砸紊。缺點是創(chuàng)建的優(yōu)化模型不能被取消。這可能會導(dǎo)致道德問題囱挑,因為數(shù)據(jù)透明是很重要的醉顽。
原文鏈接:
https://medium.com/@AdamTemper/ai-for-dinosaurs-67848a90fce3