四、人工智能發(fā)展的成功要素
三個(gè)要素:先進(jìn)的算法、足夠的數(shù)據(jù)拜隧、執(zhí)行先進(jìn)算法和處理大數(shù)據(jù)的能力(硬件系統(tǒng))。
現(xiàn)在的人工智能算法是以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)算法趁仙。目前洪添,已有的各類(lèi)深度學(xué)習(xí)算法已經(jīng)非常成熟,不論算法的精確性還是魯棒性也越來(lái)越好幸撕;其中薇组,計(jì)算機(jī)視覺(jué)領(lǐng)域是深度學(xué)習(xí)算法應(yīng)用最廣泛、也是效果最好的場(chǎng)景坐儿,目前開(kāi)發(fā)出來(lái)網(wǎng)絡(luò)結(jié)構(gòu)可謂是五花八門(mén)律胀、各式各樣宋光。
1. 最左側(cè)的圖,是以“卷積神經(jīng)網(wǎng)絡(luò)”為代表的架構(gòu)炭菌,它可以通過(guò)更深的網(wǎng)絡(luò)罪佳、新的分層設(shè)計(jì)等等來(lái)繼續(xù)提升神經(jīng)網(wǎng)絡(luò)的性能。
2. 其次是“循環(huán)神經(jīng)網(wǎng)絡(luò)”黑低,比如擅長(zhǎng)于長(zhǎng)序列模式分類(lèi)的LSTM模型架構(gòu)赘艳,基于這一類(lèi)架構(gòu)所構(gòu)造的模型在一定程度上已經(jīng)實(shí)現(xiàn)了超越人類(lèi)的語(yǔ)音識(shí)別和語(yǔ)言翻譯能力。
長(zhǎng)短期記憶(Long Short-Term Memory克握,LSTM)是一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)(RNN)蕾管,適合被用于處理和預(yù)測(cè)時(shí)間序列中間隔和延遲非常長(zhǎng)的重要事件。
3. 第三個(gè)是大紅大紫的“生成對(duì)抗網(wǎng)絡(luò)”菩暗,它是要求讓網(wǎng)絡(luò)經(jīng)過(guò)訓(xùn)練來(lái)進(jìn)行判別掰曾,而另一個(gè)網(wǎng)絡(luò)則不斷學(xué)習(xí)和生成事例,以欺騙另一個(gè)網(wǎng)絡(luò)停团,最終就可以產(chǎn)生圖像旷坦、語(yǔ)音等等復(fù)雜的非結(jié)構(gòu)數(shù)據(jù)。
4. 最后是“強(qiáng)化學(xué)習(xí)”的架構(gòu)佑稠,它可以通過(guò)反復(fù)的試錯(cuò)秒梅,并且根據(jù)價(jià)值函數(shù)對(duì)機(jī)器進(jìn)行獎(jiǎng)懲,在工藝界用到的各種智能機(jī)器人就是利用強(qiáng)化學(xué)習(xí)來(lái)進(jìn)行行為學(xué)習(xí)的舌胶。
感知器是神經(jīng)網(wǎng)絡(luò)最簡(jiǎn)單的一種形式捆蜀,受到神經(jīng)元模型的啟發(fā)。
GPU的核心特點(diǎn)是可以同時(shí)并行處理海量的數(shù)據(jù)辆琅。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中漱办,最基本的計(jì)算工作就是要執(zhí)行大量的矩陣運(yùn)算,所以GPU這種高性能硬件就特別適合于深度學(xué)習(xí)的訓(xùn)練婉烟。
五娩井、人工智能迅速發(fā)展的技術(shù)領(lǐng)域
人工智能領(lǐng)域內(nèi)的3大基本應(yīng)用場(chǎng)景:計(jì)算機(jī)視覺(jué)、語(yǔ)音技術(shù)似袁、自然語(yǔ)言處理洞辣。
深度學(xué)習(xí)技術(shù)是非常擅長(zhǎng)識(shí)別非結(jié)構(gòu)化數(shù)據(jù)中的模式的,比如人們熟知的圖像昙衅、聲音扬霜、視頻、文本等媒體都屬于此類(lèi)數(shù)據(jù)而涉。那么著瓶,對(duì)人工智能的基本應(yīng)用場(chǎng)景分類(lèi)也是大致按照數(shù)據(jù)的結(jié)構(gòu)特點(diǎn)來(lái)分類(lèi)的。
目前啼县,計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)進(jìn)入到了規(guī)牟脑化商用的初期沸久。計(jì)算機(jī)視覺(jué)技術(shù)在高性能計(jì)算芯片、深度攝像頭和深度學(xué)習(xí)算法的推動(dòng)下獲得了快速的發(fā)展余蟹,市場(chǎng)空間巨大卷胯,應(yīng)用產(chǎn)品層出不窮,成為了人工智能應(yīng)用的急先鋒威酒。指紋識(shí)別窑睁、刷臉支付、機(jī)場(chǎng)自動(dòng)通關(guān)葵孤、增強(qiáng)現(xiàn)實(shí)担钮、無(wú)人駕駛等,都是圖像識(shí)別技術(shù)快速普及的一個(gè)縮影尤仍。
語(yǔ)音技術(shù)可以說(shuō)是最早落地的人工智能技術(shù)裳朋。在人工智能快速發(fā)展的今天,得益于深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)的發(fā)展吓著,語(yǔ)音識(shí)別取得了一系列的突破性進(jìn)展,在產(chǎn)品應(yīng)用上也越來(lái)越成熟送挑。
總體來(lái)說(shuō)绑莺,自然語(yǔ)言處理技術(shù)取得突破還仍需時(shí)日。在2016年惕耕,自然語(yǔ)言處理取得進(jìn)一步發(fā)展的一年纺裁,自然語(yǔ)言處理的主流技術(shù)已經(jīng)逐漸地從統(tǒng)計(jì)機(jī)器學(xué)習(xí)為主,轉(zhuǎn)向了以深度學(xué)習(xí)為主的模型算法中去司澎。
5.1 計(jì)算機(jī)視覺(jué)
從廣義上說(shuō)欺缘,計(jì)算機(jī)視覺(jué)就是賦予機(jī)器自然視覺(jué)能力的學(xué)科。所謂“自然視覺(jué)能力”就是指生物視覺(jué)系統(tǒng)所體現(xiàn)出來(lái)的視覺(jué)能力挤安。
深度學(xué)習(xí)正是在計(jì)算機(jī)視覺(jué)領(lǐng)域的孕育中得以快速的突破和發(fā)展的谚殊。
圖像分割是計(jì)算機(jī)視覺(jué)的核心問(wèn)題,是將整個(gè)圖像分成一個(gè)個(gè)像素的對(duì)象蛤铜,然后再對(duì)其進(jìn)行標(biāo)記和分類(lèi)嫩絮,由此實(shí)現(xiàn)的像素級(jí)別的分類(lèi)。與“分類(lèi)”不同的是围肥,需要用模型對(duì)密集的像素進(jìn)行預(yù)測(cè)剿干。
目標(biāo)檢測(cè)技術(shù)對(duì)于無(wú)人駕駛領(lǐng)域是非常重要的。
目標(biāo)檢測(cè)是近年來(lái)理論和應(yīng)用的研究熱點(diǎn)穆刻,是圖像處理和計(jì)算機(jī)視覺(jué)學(xué)科的重要分支置尔,是智能監(jiān)控系統(tǒng)的核心部分,同時(shí)目標(biāo)檢測(cè)也是泛身份識(shí)別領(lǐng)域的基礎(chǔ)性算法氢伟,比如人臉識(shí)別榜轿、步態(tài)識(shí)別幽歼、人群計(jì)數(shù)等任務(wù),都起著至關(guān)重要的作用差导。
可以理解试躏,如何實(shí)現(xiàn)多類(lèi)別、多物體的檢測(cè)设褐,是目標(biāo)檢測(cè)算法運(yùn)用到實(shí)際需求中必須達(dá)到的要求颠蕴,比如自動(dòng)駕駛領(lǐng)域。如何提高小目標(biāo)物體的檢測(cè)精度助析,是目標(biāo)檢測(cè)算法應(yīng)用的一個(gè)關(guān)鍵問(wèn)題犀被。
圖像分割可以作為預(yù)處理,將最初的圖像轉(zhuǎn)化為若干個(gè)更加抽象外冀、也更加便于計(jì)算機(jī)處理的形式寡键,既可以保留圖像中重要的特征信息,也可以有效的減少圖像中的無(wú)用數(shù)據(jù)雪隧,提高后續(xù)圖像處理的準(zhǔn)確率和效率西轩。比如,在通信方面脑沿,可以事先提取目標(biāo)的輪廓結(jié)構(gòu)和區(qū)域的內(nèi)容藕畔,保證不失有用信息的同時(shí),有針對(duì)性的去壓縮圖像庄拇,以提高網(wǎng)絡(luò)傳輸?shù)男省?/p>
凡是與目標(biāo)檢測(cè)注服、提取和識(shí)別等相關(guān)的內(nèi)容,都會(huì)需要運(yùn)用到圖像分割技術(shù)措近。因此溶弟,無(wú)論是從圖像分割的技術(shù)和算法,還是對(duì)圖像識(shí)別瞭郑、圖像處理辜御、計(jì)算機(jī)視覺(jué)的影響,以及實(shí)際應(yīng)用等各個(gè)方面來(lái)深入研究和探討圖像分割屈张,都是具有非常重要的意義的我抠。
5.2 語(yǔ)音技術(shù)
語(yǔ)音識(shí)別又稱(chēng)為自動(dòng)語(yǔ)音識(shí)別、語(yǔ)音轉(zhuǎn)文本識(shí)別袜茧;與說(shuō)話(huà)人識(shí)別和說(shuō)話(huà)人確認(rèn)是不相同的菜拓。
5.3 自然語(yǔ)言處理
自然語(yǔ)言處理是一門(mén)融合了語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)笛厦、數(shù)學(xué)等為一體的學(xué)科纳鼎。
計(jì)算機(jī)視覺(jué)是讓機(jī)器可以“看”,語(yǔ)音識(shí)別是讓機(jī)器可以“聽(tīng)”,自然語(yǔ)言處理就是要更進(jìn)一步贱鄙,讓機(jī)器可以“理解”劝贸,更加的善解人意,它推動(dòng)著語(yǔ)言智能的持續(xù)發(fā)展和突破逗宁。
目前映九,深度學(xué)習(xí)技術(shù)還不具備理解和使用自然語(yǔ)言中所必須的概念抽象和邏輯推理的能力,所以這方面的研究還有待未來(lái)進(jìn)一步的發(fā)展瞎颗。
1. 文本分類(lèi):對(duì)于給定的一個(gè)文本例子件甥,預(yù)測(cè)一個(gè)預(yù)定義的類(lèi)標(biāo)簽;文本分類(lèi)的目的是要對(duì)文檔的話(huà)題或主題進(jìn)行分類(lèi)哼拔,比如流行的分類(lèi)事例就是情緒分析引有,其中的類(lèi)標(biāo)簽就是要表示原文本的情緒基調(diào),是積極的還是消極的倦逐。舉個(gè)例子——1)垃圾郵件的過(guò)濾譬正,就是要實(shí)現(xiàn)電子郵件文本分類(lèi)是否是垃圾郵件;2)語(yǔ)言的識(shí)別檬姥,對(duì)原本文本的語(yǔ)言的類(lèi)型進(jìn)行分類(lèi)曾我,可以實(shí)現(xiàn)流派的分類(lèi)。
2. 機(jī)器翻譯:也稱(chēng)自動(dòng)翻譯健民,是計(jì)算語(yǔ)言學(xué)的一個(gè)分支您单,也是人工智能的終極目標(biāo)之一。
3. 知識(shí)圖譜:在圖書(shū)荞雏、情報(bào)界稱(chēng)為知識(shí)域可視化、知識(shí)領(lǐng)域的映射地圖平酿,顯示的是知識(shí)發(fā)展的進(jìn)程和結(jié)構(gòu)關(guān)系的一系列各種不同的圖形凤优,然后用可視化技術(shù)來(lái)描述知識(shí)資源以及相關(guān)載體,通過(guò)挖掘蜈彼、分析筑辨、構(gòu)建和繪制顯示出知識(shí)與它們之間的相互聯(lián)系。
4. 對(duì)話(huà)系統(tǒng):比如幸逆,聊天機(jī)器人棍辕、自動(dòng)問(wèn)答技術(shù)。自動(dòng)問(wèn)答技術(shù)是人工智能領(lǐng)域中一個(gè)非常熱門(mén)的研究方向还绘,它綜合運(yùn)用了自然語(yǔ)言處理楚昭、信息檢索、語(yǔ)義分析拍顷、機(jī)器學(xué)習(xí)等人工智能技術(shù)的一項(xiàng)新型信息服務(wù)技術(shù)抚太;可以自動(dòng)的分析、理解用戶(hù)自然語(yǔ)言的提問(wèn),然后直接返回用戶(hù)想要的答案尿贫。
5. 信息檢索:用戶(hù)進(jìn)行信息的查詢(xún)和獲取电媳,這也是查找信息的主要方法。狹義的信息檢索指信息的查詢(xún)庆亡,也就是用戶(hù)根據(jù)需要采用一定的方法匾乓、借助檢索的工具,在信息集合中能夠找出所需要的信息的一個(gè)查找過(guò)程又谋。
6. 文本生成:這是一個(gè)比較學(xué)術(shù)的說(shuō)法拼缝,通常在媒體上見(jiàn)到的叫做寫(xiě)作機(jī)器人或人工智能寫(xiě)作、自動(dòng)對(duì)話(huà)生成搂根。在自然語(yǔ)言處理中珍促,一個(gè)重要的應(yīng)用領(lǐng)域就是文本的自動(dòng)撰寫(xiě),包括關(guān)鍵詞抽取剩愧、關(guān)鍵短語(yǔ)抽取猪叙、自動(dòng)摘要提取,都屬于文本生成領(lǐng)域的一個(gè)應(yīng)用仁卷。
目前穴翩,文本翻譯最為主流的工作方式依然是以傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯和神經(jīng)網(wǎng)絡(luò)翻譯為主,比如谷歌锦积、微軟芒帕、百度、有道等公司都在為用戶(hù)提供免費(fèi)的丰介、在線(xiàn)的背蟆、多語(yǔ)言翻譯系統(tǒng),速度快哮幢、成文低是文本翻譯的主要特點(diǎn)带膀,而且應(yīng)用非常廣泛,不同行業(yè)等可以采用相應(yīng)的專(zhuān)業(yè)翻譯橙垢。
另外垛叨,語(yǔ)音翻譯可能是目前機(jī)器翻譯中比較富有創(chuàng)新意味的領(lǐng)域,比如某些公司推出的機(jī)器同傳技術(shù)柜某,在會(huì)議場(chǎng)景中出現(xiàn)嗽元,演講者的語(yǔ)音可以實(shí)時(shí)的轉(zhuǎn)換為文本,并且進(jìn)行同步翻譯喂击,這種低延遲顯示翻譯的效果希望能夠取代人工同傳剂癌,實(shí)現(xiàn)不同語(yǔ)言人們低成本的有效交流。
當(dāng)前翰绊,對(duì)話(huà)系統(tǒng)在各個(gè)領(lǐng)域越來(lái)越引起人們的重視珍手,深度學(xué)習(xí)技術(shù)的不斷進(jìn)步也會(huì)極大的推動(dòng)對(duì)話(huà)系統(tǒng)的發(fā)展。對(duì)于對(duì)話(huà)系統(tǒng),深度學(xué)習(xí)技術(shù)就可以利用大量的數(shù)據(jù)來(lái)去學(xué)習(xí)特征表示和回復(fù)生成策略琳要,這其中僅需要很少量的手工操作寡具。
任務(wù)導(dǎo)向型的對(duì)話(huà)系統(tǒng):為了幫助用戶(hù)完成實(shí)際、具體的任務(wù)稚补,比如幫助用戶(hù)尋找商品童叠、預(yù)定酒店餐廳等。
非任務(wù)導(dǎo)向型的對(duì)話(huà)系統(tǒng):與人類(lèi)交互课幕,提供合理的回復(fù)和娛樂(lè)消遣的功能厦坛,通常情況下主要集中在開(kāi)放的領(lǐng)域與人交談。非任務(wù)導(dǎo)向的系統(tǒng)似乎在進(jìn)行聊天乍惊,但是它在許多實(shí)際應(yīng)用程序中都可以發(fā)揮出巨大的作用杜秸。
- TBC -