人工智能是如何運作的
????????人工智能企圖了解智能的實質(zhì)绽慈,并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器你辣,該領(lǐng)域的研究包括機器人、語言識別、圖像識別醒陆、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來裆针,理論和技術(shù)日益成熟刨摩,應(yīng)用領(lǐng)域也不斷擴大,可以預(yù)見未來幾年將會進入“人工智能時代”据块。
????????目前AI已經(jīng)遍布我們的世界并且在日常生活中產(chǎn)生了巨大的變化码邻。這些AI并不是科幻電影中的那些有自我意識,計劃毀滅世界邪惡的機器人另假。而是像我們的智能手機像屋、智能家居、銀行信用卡管家和智能汽車這些圍繞我們每天生活的產(chǎn)品和服務(wù)都在使用AI边篮。
????????AI將通過推動自動駕駛汽車的發(fā)展己莺、改善醫(yī)學圖像分析奏甫、促進更好的醫(yī)療診斷和個性化醫(yī)療,從而帶來社會的重大轉(zhuǎn)變凌受。AI?也將是支撐未來技術(shù)發(fā)展的基礎(chǔ)資源阵子,就像電力和網(wǎng)絡(luò)一樣。但對大部分人來說胜蛉,AI?還是很詭異而且充滿神秘感挠进。
????那么我們今天就來聊一聊AI最重要的功能——模式識別的工作原理。希望通過簡明扼要的介紹幫助大家了解這個領(lǐng)域誊册。
????AI是一門嚴謹科學而不是無所不能神話故事领突,媒體過分夸大報道AI的功能,鼓吹威脅論都是不負責任的案怯。AI目標是設(shè)計具有智能的機器君旦,其中的算法和技術(shù)部分借鑒了當下對人腦的研究成果。今天許多流行的AI系統(tǒng)使用人工神經(jīng)網(wǎng)絡(luò)來模擬由非常簡單的互相連接單元組成的網(wǎng)絡(luò)嘲碱,有點像大腦中的神經(jīng)元金砍。這些網(wǎng)絡(luò)可以通過調(diào)整單元之間的連接來學習經(jīng)驗,這個過程類似人類和動物的大腦通過修改神經(jīng)元之間的連接來進行學習麦锯。神經(jīng)網(wǎng)絡(luò)可以學習模式識別恕稠、翻譯語言、學習簡單的邏輯推理离咐,甚至創(chuàng)建圖像或者形成新設(shè)計谱俭。其中,模式識別是一項特別重要的功能宵蛀,因為AI十分擅于識別海量數(shù)據(jù)中的隱藏的模式,而這對于依賴經(jīng)驗和知識的人類來說就沒有那么容易县貌。這些程序運行的神經(jīng)網(wǎng)絡(luò)具有數(shù)百萬單位和數(shù)十億的連接术陶。我們現(xiàn)在所能創(chuàng)造出來的“智能”就是由這些電子神經(jīng)元網(wǎng)絡(luò)組成的。
????機器不像人類具有感知器官和大腦煤痕,并且能夠很好地協(xié)調(diào)工作梧宫,比如當我們看到一只狗的時候,就會很快的判斷出來這是什么動物摆碉,并且具體什么種類塘匣。這個看似簡單的過程對于機器來說都是十分困難的。而人類獲得這樣的能力巷帝,也是源自于生物上億年的進化過程忌卤。而機器認識世界的方式是通過模型,需要通過復(fù)雜的算法和數(shù)據(jù)來構(gòu)建模型楞泼,從而使機器獲得很簡單的感知和判斷的能力驰徊。
????下面介紹一下深度學習系統(tǒng)中一個最重要算法——卷積神經(jīng)網(wǎng)絡(luò)笤闯。如果你之前對AI相關(guān)知識有所了解的話,那你一定聽說這個概念棍厂。這種算法參考了生物學研究人類和其他動物大腦視覺皮層的結(jié)構(gòu)颗味。簡單介紹一下這種特定類型的人工神經(jīng)網(wǎng)絡(luò),它使用感知器牺弹、機器學習單元算法浦马,用于監(jiān)督學習分析數(shù)據(jù)。適用于圖像處理张漂、自然語言處理和其他類型的認知任務(wù)晶默。與其他類型的人工神經(jīng)網(wǎng)絡(luò)一樣,卷積神經(jīng)網(wǎng)絡(luò)具有輸入層鹃锈、輸出層和各種隱藏層荤胁。其中一些層是卷積的,使用數(shù)學模型將結(jié)果傳遞給連續(xù)的層屎债。這過程模擬了人類視覺皮層中的一些動作仅政,所以稱為卷積神經(jīng)網(wǎng)路,也就是CNN盆驹。
舉例子來看圆丹,當我們?nèi)祟惪吹揭恢回埡鸵恢还窌r,盡管它們的體型很類似躯喇,但我們還是馬上能夠區(qū)分它們分別是貓和狗辫封。對計算機而言,圖像僅? ??僅只是一串數(shù)據(jù)廉丽。在神經(jīng)網(wǎng)絡(luò)的第一層會通過特征檢測物體的輪廓倦微。神經(jīng)網(wǎng)絡(luò)的下一層將檢測這些簡單圖案的組合所形成的簡單形狀,比如動物眼睛和耳朵正压。再下一層將檢測這些形狀組合所構(gòu)成的物體的某些部分欣福,例如貓和狗的頭或者腿。神經(jīng)網(wǎng)絡(luò)的最后一層將檢測剛才那些部分的組合:一只完整的貓焦履、一只完整的狗等等拓劝。每一層的神經(jīng)網(wǎng)絡(luò)都會目標進行圖像組合分析和特征檢測,從而進行判斷和組合嘉裤,并將結(jié)果傳遞給下一層神經(jīng)網(wǎng)絡(luò)郑临。實際使用的神經(jīng)網(wǎng)絡(luò)的層次深度會比這個例子多很多,所以神經(jīng)網(wǎng)絡(luò)能夠以這種分層的方式進行復(fù)雜的模式識別屑宠。
? ??只要有大量被標記的樣本數(shù)據(jù)庫厢洞,就可以對神經(jīng)網(wǎng)絡(luò)進行特征訓練。它對于識別圖像、視頻犀变、語音妹孙、音樂甚至文本等信息特別有用。為了很好地訓練AI的機器視覺获枝,我們需要提供給這些神經(jīng)網(wǎng)絡(luò)被人標記的大量圖像數(shù)據(jù)蠢正。神經(jīng)網(wǎng)絡(luò)會學習將每個圖像與其相應(yīng)的標簽并相互關(guān)聯(lián)起來。還能將以前從未見過的圖像及其相應(yīng)的標簽配對省店。這樣的系統(tǒng)可以梳理各種各樣的圖像嚣崭,并且識別照片中的元素。同時神經(jīng)網(wǎng)絡(luò)在語音識別和文本識別中也非常有用懦傍,自動駕駛汽車和最新醫(yī)學圖像分析系統(tǒng)中也是關(guān)鍵組成部分雹舀,所以你可以看到神經(jīng)網(wǎng)絡(luò)的運用是非常廣泛而且有效的。原來需要依賴人工標記大量有效數(shù)據(jù)來完成知識的輸入粗俱,現(xiàn)在通過運行海量數(shù)據(jù)说榆,讓神經(jīng)網(wǎng)絡(luò)進行自我學習。大大提升的人工智能的應(yīng)用范圍寸认,降低了使用的門檻签财。
? ??人類大腦與動物遠遠不同,在進化過程中高度特化并且具有明顯的適應(yīng)性偏塞。而當前的AI系統(tǒng)遠遠不具有人類擁有的看似一般的智能唱蒸。人工智能更高級的發(fā)展將會在后面進行討論,我們這里還是關(guān)注現(xiàn)在實現(xiàn)的AI的基本原理灸叼。
AI最常見的三種學習方式
強化學習?這是關(guān)于機器應(yīng)該如何行動以獲得最大化獎勵的問題神汹,它受行為心理學理論的啟發(fā)。在特定場景下古今,機器挑選一個動作或一系列動作并獲得獎勵屁魏。機器行為每一步驟都會被標記,并且記錄結(jié)果和賦予權(quán)重捉腥。強化學習通常用于教機器玩游戲和贏得比賽蚁堤,比如國際象棋、圍棋或簡單的視頻游戲但狭。強化學習的問題是,單純地強化學習需要海量的試錯撬即,才能學會簡單的任務(wù)立磁。好處是只要你提出一個有價值的問題,提供足夠的數(shù)據(jù)輸入剥槐,理論上來說強化學習最終會找到那個最優(yōu)解唱歧。
監(jiān)督學習就是需要我們告訴機器特定輸入的正確答案:這是一幅汽車的圖像,正確答案是“汽車”。它之所以被稱為監(jiān)督學習颅崩,是因為算法是從帶標簽數(shù)據(jù)學習的几于。這個過程類似于向年幼的孩子展示圖畫書。成年人預(yù)先知道正確的答案沿后,孩子根據(jù)前面的例子做出推測沿彭。這也是訓練神經(jīng)網(wǎng)絡(luò)和其他機器學習體系結(jié)構(gòu)最常用的技術(shù)。
? ??無監(jiān)督學習?人類和大多數(shù)其他動物的學習過程尖滚,特別是剛生下來的時候喉刘,是以沒有人監(jiān)督的方式來進行學習的:我們通過觀察和認知我們行動的結(jié)果來了解世界如何運作。沒有人告訴我們剛開始所看到的每一個物體的名稱和功能漆弄。但我們?nèi)匀粚W會非衬郎眩基本的概念,當前我們還不知道如何在機器身上實現(xiàn)這一點撼唾,至少無法達到人類和其他動物的水平廉邑。缺乏用于無監(jiān)督學習的AI技術(shù),也是當前AI發(fā)展問題之一倒谷。
????概括來說當前AI技術(shù)原理是:將大量數(shù)據(jù)與超強的運算處理能力和智能算法三者相結(jié)合起來蛛蒙,建立一個解決特定問題的模型,使程序能夠自動地從數(shù)據(jù)中學習潛在的模式或特征恨锚,從而實現(xiàn)接近人類的思考方式宇驾。下面補充介紹三個AI研究領(lǐng)域重要的理論方法和技術(shù)以便理解:
?一、機器學習自動化分析建模猴伶。
????它使用來自神經(jīng)網(wǎng)絡(luò)课舍、統(tǒng)計、數(shù)學和物理學的方法來發(fā)現(xiàn)數(shù)據(jù)中的隱藏模型他挎,并且無需明確編程查找具體目標和范圍筝尾。理論基礎(chǔ)是這樣的:假如我們?yōu)榱搜芯磕硞€復(fù)雜的科學問題,需要創(chuàng)建海量的機器學習模型办桨、使用大量的算法筹淫、使用不同的參數(shù)配置,在這種情況下呢撞,我們就可以使用自動化的方式進行建模损姜。發(fā)展自動化機器學習是為了向科學家提供幫助,而不是代替他們殊霞。這些方法使數(shù)據(jù)科學家擺脫了令人厭煩和復(fù)雜耗時的任務(wù)(比如詳細的參數(shù)優(yōu)化和調(diào)試)摧阅,機器可以更好地解決這些任務(wù)。而后面的數(shù)據(jù)分析與結(jié)論的工作仍然需要人類專家來完成绷蹲。在未來棒卷,理解行業(yè)應(yīng)用領(lǐng)域的數(shù)據(jù)科學家顾孽,也就是數(shù)據(jù)業(yè)務(wù)架構(gòu)師,仍然極其的重要比规。而這一項人工智能技術(shù)若厚,將會輔助數(shù)據(jù)科學家建立模型并且加速驗證的速度,從而減輕科學家的壓力蜒什,讓他們將精力放在那些機器無法完成的任務(wù)上面测秸,通過更加合理的分工協(xié)作,大大加快科學技術(shù)研發(fā)速度吃谣。
二乞封、深度學習領(lǐng)域
????這是應(yīng)用非常廣的技術(shù),它使用具有多層處理單元的巨大神經(jīng)網(wǎng)絡(luò)岗憋,利用強大計算能力和改進的訓練技術(shù)來學習大量數(shù)據(jù)中的復(fù)雜模式肃晚。原理是計算機在學習特定問題時,需要大量輸入這個問題相關(guān)的學習材料也就是數(shù)據(jù)仔戈,然后在計算機通過算法和模型來構(gòu)建對這個具體問題的認知关串,也就是總結(jié)出一個規(guī)律,那么在以后遇到相似問題時监徘,計算機會把收集的數(shù)據(jù)轉(zhuǎn)成特征值晋修,如果這個特征值符合這前面規(guī)律里面的特征值,那么這個事物凰盔、行為或者模式墓卦,就可以被識別出來。常見的應(yīng)用太多了户敬,這里大概舉一些例子:
? ??計算機視覺落剪,這就像是機器的“眼睛”。依賴于模式識別和深度學習來識別圖片或視頻中的內(nèi)容尿庐。當機器可以分析和理解圖像時忠怖,他們可以實時捕捉圖像或視頻并解讀周圍環(huán)境。感知周圍環(huán)境抄瑟、識別可行駛區(qū)域以及識別行駛路徑凡泣,這也是無人駕駛的基礎(chǔ)技術(shù)。其中圖像識別原理是通過識別圖片中的對象皮假,然后建立標簽鞋拟,實現(xiàn)對海量圖片進行分類,也可以對圖像中的人臉或者其他目標進行識別惹资,運用在安防監(jiān)控等領(lǐng)域严卖;
? ??自然語言處理中語音識別技術(shù)就像是機器的“耳朵”:這是計算機分析、理解和生成人類語言和語音的能力布轿。運用語音采集的技術(shù)和方法,對音頻中的語言內(nèi)容進行提取和識別,實現(xiàn)語音實時轉(zhuǎn)文字的功能汰扭;下一階段將會是自然語言交互稠肘,人們將可以使用普通的日常語言與計算機進行交流和執(zhí)行任務(wù)。這也是AI語音助手和語音控制交互技術(shù)的基礎(chǔ)萝毛。
????機器翻譯:模仿人腦理解語言的過程项阴,形成更加符合語法規(guī)則同時更加容易被人理解的翻譯,谷歌在線翻譯功能就是運用了深度學習技術(shù)笆包,讓機器的翻譯水平大大提升环揽;
????情感識別:通過識別新聞、社交媒體庵佣、論壇等文本內(nèi)容中所包含的情感因素歉胶,及時了解網(wǎng)絡(luò)輿論對新聞事件的反應(yīng)情況;
????醫(yī)療診斷:比如通過對各個階段的腫瘤診斷這類醫(yī)療圖像數(shù)據(jù)進行學習巴粪,總結(jié)出惡性腫瘤形狀通今、紋理、結(jié)構(gòu)等“特征”模型肛根,從而使機器可以進行判斷辫塌。
????可以看到深度學習在神經(jīng)元網(wǎng)絡(luò)的基礎(chǔ)上,發(fā)展出了非常多的應(yīng)用案例派哲,并且當下各個行業(yè)的人工智能輔助工具和軟件都在大力開發(fā)中臼氨,各種數(shù)據(jù)都在被大量采集、清洗芭届、輸入模型訓練储矩,一旦訓練成功就可以大規(guī)模部署,帶來巨大的商業(yè)價值喉脖。具體有多大呢椰苟?參考一下人臉識別領(lǐng)域的獨角企業(yè)估值和號稱千億的市場規(guī)模就知道了。如果這樣的市場再乘以百倍树叽、千倍呢舆蝴,這里面的蘊含商業(yè)機會有多少呢?
?三题诵、認知計算
這也是人工智能的子領(lǐng)域洁仗,目標是與機器進行自然的、類似人類的交互性锭。使用人工智能和認知計算赠潦,最終目標是讓機器獲得理解圖像和語音的能力,模擬人類交流過程草冈,從而實現(xiàn)與人類的自然對話她奥。也是根據(jù)神經(jīng)網(wǎng)絡(luò)和深度學習來構(gòu)建的瓮增,應(yīng)用來自認知科學的知識來構(gòu)建模擬人類思維過程的系統(tǒng)。它涵蓋多個學科哩俭,包括機器學習绷跑、自然語言處理、視覺和人機交互凡资。IBM Watson?就是認知計算的一個例子砸捏,在美國答題競賽節(jié)目上Watson?展現(xiàn)了它先進的問答交互能力,并且打敗了人類隙赁。與此垦藏,同時Watson這些服務(wù)應(yīng)用接口也進行了開放,可提供其他組織用于視覺識別伞访、語音識別掂骏、語言翻譯以及對話引擎等等。
就像AI的產(chǎn)生是多學科發(fā)展的綜合成果一樣咐扭,當下AI的快速發(fā)展也是多方面技術(shù)進步綜合起來取得的成果芭挽,總結(jié)里面重要的三個方面:
1.硬件方面:
?????直到本世紀初研究人員才意識到,為視頻游戲設(shè)計的GPU(圖形處理單元)可以被用作硬件加速器蝗肪,以運行比以前更大的神經(jīng)網(wǎng)絡(luò)袜爪。這要歸功于這些芯片能夠進行大量并行計算,而不是像傳統(tǒng)CPU那樣按順序處理它們薛闪。這對于同時計算構(gòu)成深度學習神經(jīng)網(wǎng)絡(luò)的數(shù)百個神經(jīng)元的權(quán)重特別有用辛馆。
2.通用算法:
????AI這么快就流行起來,在很大程度上是因為開放的軟件工具(也稱為框架)豁延,使得構(gòu)建和訓練一個神經(jīng)網(wǎng)絡(luò)實現(xiàn)目標應(yīng)用程序變得容易起來昙篙,即使是使用各種不同的編程語言。對于已知的識別目標诱咏,可以離線定義和訓練一個神經(jīng)網(wǎng)絡(luò)苔可。一旦訓練完成,神經(jīng)網(wǎng)絡(luò)可以很容易地部署到嵌入式平臺上袋狞,也可以遷移到各種軟件程序和硬件平臺中焚辅。這是一個聰明的架構(gòu),允許借助PC或云的能力訓練神經(jīng)網(wǎng)絡(luò)苟鸯,而低功耗的嵌入式處理器只需使用訓練好的數(shù)據(jù)來進行識別同蜻。人體和物體的能力與流行的應(yīng)用密切相關(guān),比如工業(yè)機器人和自動駕駛汽車早处。
3.其他技術(shù)支持:
??????圖形處理單元是AI的關(guān)鍵湾蔓,因為它們提供了迭代處理所需的大量計算能力。訓練神經(jīng)網(wǎng)絡(luò)需要大數(shù)據(jù)和計算能力砌梆。而物聯(lián)網(wǎng)從連接的設(shè)備生成大量數(shù)據(jù)默责,其中大部分未經(jīng)分析贬循。?使用AI自動化模型將允許我們使用更多的物聯(lián)網(wǎng)數(shù)據(jù)進行分析,將物流和信息流更好的結(jié)合起來傻丝。還有就是AI應(yīng)用程序接口甘有,可以將AI功能添加到現(xiàn)有產(chǎn)品和軟件中。比如它們可以為安防視頻系統(tǒng)中添加圖像識別功能葡缰;也可以在我們觀看網(wǎng)絡(luò)視頻時,自動創(chuàng)建翻譯和字幕忱反;或者是在拍照程序中自動識別人物性別和年齡甚至是表情和情緒等等泛释,應(yīng)用將會非常廣泛。
????總之温算,這都是?AI?經(jīng)常使用的方法怜校,即使我們創(chuàng)造了單個項目擁有超越人類智慧的機器,這些機器仍然能力有限注竿。短期來看茄茁,人工智能將提供接近人類交互體驗,并為特定任務(wù)提供輔助支持巩割,但它還不能成為人類的替代品裙顽,有自我意識的AI還不會很快出現(xiàn)。
??本篇是老張創(chuàng)作的課程《人工智能進化論課程》基礎(chǔ)篇內(nèi)容宣谈,轉(zhuǎn)載需授權(quán)愈犹。
? ? ? ?讀完了覺得有幫助請轉(zhuǎn)發(fā)和評論~? ??
??? ? ? ?想要了解全部課程內(nèi)容,加入圈子和老張討論的請點擊下面“加入圈子”闻丑,訂閱“人工智能進化論”課程漩怎。或者加wx:AI61825
加入圈子???