熱點丨2018年全球AI突破性技術(shù)TOP10
今天人工智能是個高科技、寬領(lǐng)域奸鬓、多維度焙畔、跨學(xué)科的集大成者,從立足大數(shù)據(jù)串远、圍繞互聯(lián)網(wǎng)的純計算機應(yīng)用宏多,逐步衍生到人們?nèi)粘Ia(chǎn)生活的方方面面,在細(xì)微之處改善和改變著我們澡罚。目前伸但,不少新技術(shù)、新模式已經(jīng)逐步投入到現(xiàn)實運用留搔,但是多數(shù)領(lǐng)域仍然處在推廣更胖、試驗、研究階段隔显,如何把握推廣人工智能技術(shù)的重大機遇却妨,讓更廣大的老百姓像普及手機一樣,用上人工智能荣月,這是我們這一代人必須面對的時代發(fā)展“必答題”管呵。
2018年人工智能技術(shù)已在多方面實現(xiàn)突破進(jìn)展,國內(nèi)外的科技公司都在不斷嘗試將人工智能應(yīng)用于更多領(lǐng)域哺窄,不論科技巨頭還是初創(chuàng)企業(yè)捐下,都在致力于不斷創(chuàng)新,推動技術(shù)進(jìn)步萌业,接下來我們就來看看十項中外人工智能領(lǐng)域富有突破性的技術(shù)坷襟。
基于神經(jīng)網(wǎng)絡(luò)的機器翻譯
入選理由:翻譯是“自然語言處理”的最重要分支,也是比較難的一支生年。早年間婴程,機器翻譯還被視作 “低級翻譯”被嘲諷,如今神經(jīng)網(wǎng)絡(luò)的機器翻譯準(zhǔn)確性大大提高抱婉,堪比專業(yè)人工翻譯档叔。我們熟知的谷歌翻譯桌粉、微軟語音翻譯以及搜狗語音識別等都是基于此項技術(shù)。
技術(shù)突破:機器翻譯是科研人員攻堅了數(shù)十年的研究領(lǐng)域衙四,其技術(shù)核心是一個擁有海量結(jié)點的深度神經(jīng)網(wǎng)絡(luò)铃肯,可以自動的從語料庫中學(xué)習(xí)翻譯知識。
人類大腦處理語言的過程毫無疑問是最為復(fù)雜的認(rèn)知過程之一传蹈,曾經(jīng)很多人都認(rèn)為機器翻譯根本不可能達(dá)到人類翻譯的水平押逼。神經(jīng)網(wǎng)絡(luò)中的多層感知就試圖模擬人類大腦神經(jīng)多層傳遞處理的過程,但通常不超過三層惦界。2006年挑格,科學(xué)家提出了神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法,使至少具有7層的神經(jīng)網(wǎng)絡(luò)訓(xùn)練成為可能沾歪。由于能夠比較好地模擬人腦神經(jīng)元多層深度傳遞的過程漂彤,它在解決一些復(fù)雜問題的時候有著非常明顯的突破性表現(xiàn)。
今年3月瞬逊,微軟宣布其研發(fā)的機器翻譯系統(tǒng)首次在通用新聞的漢譯英上達(dá)到了人類專業(yè)水平显歧,實現(xiàn)了自然語言處理的又一里程碑突破,將機器翻譯超越人類業(yè)余譯者的時間确镊,提前了整整7年士骤。
重大意義:基于神經(jīng)網(wǎng)絡(luò)的機器翻譯,直接改善了之前逐詞直譯的效果蕾域,升級為以整個句子為單位進(jìn)行翻譯拷肌。
點評:機器翻譯在手,縱橫四海不是問題旨巷。
基于多傳感器跨界融合的機器人自主導(dǎo)航
入選理由:機器人的終極目標(biāo)是為人類提供智能化的服務(wù)巨缘,其中自主導(dǎo)航是近年來人類一直想要攻克的技術(shù)壁壘,臻迪(PowerVision)通過聲吶采呐、視覺等多傳感器融合若锁,使其水下機器人能實現(xiàn)自主導(dǎo)航及智能識別,在智能機器人領(lǐng)域內(nèi)取得了突破性進(jìn)展斧吐。
技術(shù)突破:隨著機器人的應(yīng)用場景及作業(yè)任務(wù)越來越復(fù)雜又固,單一傳感器難以滿足應(yīng)用需求。而多傳感器的信息融合對硬件資源依賴程度比較高煤率,臻迪(PowerVision)基于自身在機器人行業(yè)深耕細(xì)作多年所積累的各類傳感器仰冠、慣性導(dǎo)航、運動控制蝶糯、相機洋只、視覺檢測/識別、SLAM等核心技術(shù),以及深度學(xué)習(xí)的深入研究识虚,通過嵌入式端一體化集成平臺的系統(tǒng)架構(gòu)及優(yōu)化設(shè)計肢扯,突破了移動平臺硬件資源的限制,使水下機器人更加準(zhǔn)確舷礼、智能鹃彻、全面地感知目標(biāo),并具備對水下目標(biāo)進(jìn)行鎖定妻献、檢測、識別团赁、跟隨的能力育拨。
重大意義:通過導(dǎo)航控制、聲吶欢摄、視覺技術(shù)與深度學(xué)習(xí)的結(jié)合實現(xiàn)了機器人在全局環(huán)境中的定位及自主導(dǎo)航熬丧,以及智能化應(yīng)用,為人類探索更為廣闊的水下應(yīng)用提供了強有力的技術(shù)保障怀挠。
點評:這也許是未來人工智能落地的最佳方式
DuerOS對話式人工智能系統(tǒng)
入選理由:DuerOS3.0能夠為用戶帶來了劃時代的自然對話交互析蝴,包括情感語音播報、聲紋識別等能力在內(nèi)的自然語言交互技術(shù)的全面升級绿淋。
技術(shù)突破:DuerOS是百度度秘事業(yè)部研發(fā)的對話式AI操作系統(tǒng),擁有10大類目的250多項技能闷畸。DuerOS包括了從語音識別到語音播報再到屏幕顯示的一個完整交互流程,以及背后支撐交互的自然語言理解吞滞、對話狀態(tài)控制佑菩、自然語言生成、搜索等等核心技術(shù)裁赠,這些技術(shù)支撐著應(yīng)用層和能力層的實現(xiàn)殿漠。
2018年7月4日,最新的DuerOS 3.0正式發(fā)布佩捞,使賦能的產(chǎn)品能夠?qū)崿F(xiàn)語音多輪糾錯绞幌,進(jìn)行復(fù)雜的遞進(jìn)意圖識別與帶邏輯的條件意圖識別,從而更加準(zhǔn)確判斷用戶意圖一忱,最終實現(xiàn)功能升維——利用擴(kuò)展特征理解用戶行為莲蜘。基于此掀潮,DuerOS3.0提供了包括有屏設(shè)備解決方案菇夸、藍(lán)牙設(shè)備解決方案和行業(yè)解決方案等在內(nèi)超過20個跨場景、跨設(shè)備的解決方案仪吧。
重大意義:DuerOS率先開啟AI時代商業(yè)化庄新,將為生態(tài)合作伙伴從產(chǎn)品、內(nèi)容與推廣三大方面提供完整的應(yīng)用方案支持,加速AI設(shè)備落地择诈。
點評:小度小度械蹋,請問下一個技術(shù)我寫什么?
移動AR技術(shù)
入選理由:未來AR與AI需要相互加持羞芍,可以將AR比喻成AI的眼睛哗戈。
技術(shù)突破:集成了眾多計算機科技和圖形圖像學(xué)技術(shù),包括實時渲染技術(shù)荷科、空間定位追蹤唯咬、圖像識別、人機交互畏浆、顯示技術(shù)胆胰、云端存儲、數(shù)據(jù)傳輸刻获、內(nèi)容開發(fā)工具等領(lǐng)域蜀涨。
AR技術(shù)不僅展現(xiàn)了真實世界的信息,而且將虛擬的信息同時顯示出來蝎毡,兩種信息相互補充厚柳、疊加。在視覺化的增強現(xiàn)實中沐兵,用戶利用頭戴顯示器别垮,把真實世界與電腦圖形多重合成在一起,便可以看到真實的世界圍繞著它痒筒。增強現(xiàn)實技術(shù)包含了多媒體宰闰、三維建模、實時視頻顯示及控制簿透、多傳感器融合移袍、實時跟蹤及注冊、場景融合等新技術(shù)與新手段老充,為人類感知信息提供了新的方式葡盗。
未來移動AR技術(shù)將向創(chuàng)意性AR應(yīng)用、基于位置的AR體驗啡浊、多人AR體驗發(fā)展觅够。
重大意義:隨著蘋果ARKit、谷歌 ARCore 的發(fā)布巷嚣,移動AR在兩大移動平臺上均意義重大喘先。這也意味著,全球 5 億臺支持 AR 功能的移動設(shè)備正在吸引所有的公司入局廷粒,這些公司正在將數(shù)據(jù)與 API 相結(jié)合窘拯,為用戶創(chuàng)造新的 AR 體驗红且。
點評:感覺自己離進(jìn)入真正的二次元世界不遠(yuǎn)了。
生物特征識別技術(shù)
入選理由:行為識別技術(shù)應(yīng)用于安防涤姊,為安全又上了一道鎖暇番。
技術(shù)突破:店鋪安裝攝像頭已經(jīng)是一件非常普遍的行為,但普通的攝像頭只能紀(jì)錄店鋪內(nèi)人們的行為思喊,如果發(fā)現(xiàn)盜竊需要通過觀看監(jiān)控記錄人工排查壁酬,耗時費力。
而近日恨课,日本電信巨頭宣布已研發(fā)出一款名為“AI Guardman”的新型人工智能安全攝像頭舆乔,這款攝像頭可以通過對人類動作意圖的理解,在盜竊行為發(fā)生前就能準(zhǔn)確預(yù)測剂公,從而幫助商店識別偷竊行為蜕煌,發(fā)現(xiàn)潛在的商店扒手。
這套人工智能系統(tǒng)采用開源技術(shù)诬留,能夠?qū)崟r對視頻流進(jìn)行掃描,并預(yù)測人們的姿勢贫母。當(dāng)遇到監(jiān)控中出現(xiàn)可以行為時文兑,系統(tǒng)會嘗試將姿勢數(shù)據(jù)與預(yù)定義的“可疑”行為匹配,一旦發(fā)現(xiàn)就會通過相關(guān)手機App來通知店主腺劣。據(jù)相關(guān)媒體報道绿贞,這款產(chǎn)品使得商店減少了約四成的盜竊行為。
重大意義:通過行為識別技術(shù)橘原,能夠第一時間發(fā)現(xiàn)犯罪分子籍铁,預(yù)測犯罪行為,有效保護(hù)店鋪安全趾断。
點評:去日本的商店買東西一定要果斷拒名,被誤會成小偷就不好啦。
機器人流程自動化
入選理由:機器人流程自動化能夠幫助甚至代替人類負(fù)擔(dān)大量簡單且單一芋酌、重復(fù)而繁重的工作增显,并且效率更高、零失誤脐帝。
技術(shù)突破:機器人流程自動化(RPA)是通過使用高性能認(rèn)知技術(shù)實現(xiàn)業(yè)務(wù)的自動化和工作的效率同云。人類只需在操作界面上編寫需要人工完成的工作流程,即可處理各種業(yè)務(wù)堵腹,如瀏覽器炸站,云,以及各種軟件疚顷。
Gartner數(shù)據(jù)顯示旱易,在過去的一年中禁偎,全球范圍中大型商業(yè)巨頭里有300家陸陸續(xù)續(xù)開展了RPA工程,將原先手工化的流程進(jìn)行自動化改革咒唆。隨著科技的進(jìn)步RPA將融入更多人工智能技術(shù)届垫,即智能流程自動化(Intelligent Process Automation)。相當(dāng)于在基于規(guī)則的自動化基礎(chǔ)(RPA)之上增加基于深度學(xué)習(xí)和認(rèn)知技術(shù)的推理全释、判斷装处、決策能力
重大意義:機器人流程自動化能夠大幅提升企業(yè)的工作效率,減少人員投入浸船,幫助企業(yè)降低成本妄迁,讓人類釋放生產(chǎn)力,騰出雙手去做價值更高的事情李命。
點評:小白領(lǐng)被嚇的瑟瑟發(fā)抖登淘,請老板別炒我。
像素級聲源定位系統(tǒng)PixelPlayer
入選理由:從視覺和聽覺信號角度實現(xiàn)聲源分離封字,開辟研究新途徑黔州。
技術(shù)突破:在進(jìn)行音樂編輯時,一般是利用均衡器將音樂中的低音部分調(diào)出來阔籽,而麻省理工學(xué)院計算機科學(xué)和人工智能實驗室的研究人員發(fā)現(xiàn)了更好的解決方案流妻。他們所研發(fā)的新系統(tǒng)PixelPlayer。
PixelPlayer能夠通過結(jié)合聲音和圖像信息笆制,機器學(xué)習(xí)系統(tǒng)能以無監(jiān)督的方式從圖像或聲音中識別目標(biāo)绅这、定位圖像中的目標(biāo),以及分離目標(biāo)產(chǎn)生的聲音在辆。當(dāng)我們給定一個輸入視頻证薇,PixelPlayer可以聯(lián)合地將配音分離為目標(biāo)組件以及在圖像幀上定位目標(biāo)組件。PixelPlayer 允許在視頻的每個像素上定位聲源匆篓。
簡單點說就是PixelPlayer能識別出視頻中哪個物體發(fā)出哪些聲音浑度,并將聲音分離出來。
重大意義:PixelPlayer能夠過濾伴奏奕删、識別音源俺泣,不僅能幫助人類處理音樂,還能夠幫助機器人更好地理解其他物體所產(chǎn)生的環(huán)境聲音完残。
點評:如果老師用了這個系統(tǒng)伏钠,就能立刻找出課堂交頭接耳的同學(xué)。
兼顧高精度學(xué)習(xí)和低精度推理的深度學(xué)習(xí)芯片
入選理由:這個芯片可以涵蓋了目前已知的最佳訓(xùn)練和最好推理谨设,能夠保持所有處理器組件能夠得到數(shù)據(jù)和工作熟掂。
技術(shù)突破:該深度學(xué)習(xí)芯片是IBM正在研究的項目之一。IBM將這個芯片的目標(biāo)利用率定在90%扎拣。這將是一個質(zhì)的突破赴肚,為了實現(xiàn)這一突破素跺,IBM的研發(fā)團(tuán)隊做了兩項創(chuàng)新。
首先誉券,利用率低通常是因為存在于芯片周圍的數(shù)據(jù)流瓶頸指厌。為了突破這些信息障礙,該項目的團(tuán)隊開發(fā)了一個“定制”的數(shù)據(jù)流系統(tǒng)踊跟。該數(shù)據(jù)流系統(tǒng)是一種網(wǎng)絡(luò)方案踩验,可以加速數(shù)據(jù)從一個處理引擎到下一個處理引擎的傳輸過程。它還針對要處理的是學(xué)習(xí)任務(wù)還是推理任務(wù)以及不同的精度進(jìn)行了優(yōu)化商玫。
第二項創(chuàng)新是團(tuán)隊使用專門設(shè)計的“便箋本”形式的片上存儲器箕憾,而不是CPU或GPU上的傳統(tǒng)高速緩沖存儲器。構(gòu)建它的目標(biāo)是為了保持?jǐn)?shù)據(jù)流經(jīng)芯片的處理引擎拳昌,并確保數(shù)據(jù)在恰當(dāng)?shù)臅r間處于正確的位置袭异。為了獲得90%的利用率,IBM必須使設(shè)計出的便箋本具有巨大的讀/寫帶寬炬藤。
重大意義:該芯片可以執(zhí)行當(dāng)前所有的三種主要深度學(xué)習(xí)AI:卷積神經(jīng)網(wǎng)絡(luò)(CNN)御铃、多層感知器(MLP)和長-短期記憶(LSTM)。這些技術(shù)共同主導(dǎo)了語言沈矿、視覺和自然語言處理畅买。
點評:目前深度學(xué)習(xí)技術(shù)陷入瓶頸,IBM的深度學(xué)習(xí)芯片也許能夠扭轉(zhuǎn)這一局勢细睡。
智能代理訓(xùn)練平臺
入選理由:智能代理技術(shù)使計算機應(yīng)用趨向人性化、個性化帝火。它能夠以主動服務(wù)的方式完成的一組操作的機動計算實體,不需要人的即時干預(yù)溜徙。
技術(shù)突破:智能代理技術(shù)具有解決問題所需的豐富知識、策略和相關(guān)數(shù)據(jù)犀填,能夠進(jìn)行相關(guān)的推理和智能計算蠢壹,智能代理還可以在用戶沒有給出十分明確的需求時推測出用戶的意圖、興趣或愛好九巡,并按最佳方式代為其完成任務(wù)图贸,并能自動拒絕一些不合理或可能給用戶帶來危害的要求;智能代理還從經(jīng)驗中不斷自我學(xué)習(xí)冕广,能夠根據(jù)環(huán)境調(diào)整自身的行為疏日,從而提高處理問題的能力。
智能代理技術(shù)可以應(yīng)用于商業(yè)撒汉、智能搜索代理沟优、數(shù)字圖書館、電子商務(wù)和遠(yuǎn)程教育的研究等睬辐,現(xiàn)在它也被應(yīng)用于游戲領(lǐng)域挠阁。
Unity是全球領(lǐng)先的游戲開發(fā)公司之一宾肺,去年其推出了機器學(xué)習(xí)平臺ML-Agents,讓AI開發(fā)人員和研究人員在Unity模擬和游戲環(huán)境中侵俗,使用演化策略锨用、深度強化學(xué)習(xí)和其他訓(xùn)練方法來訓(xùn)練智能代理。這種模擬訓(xùn)練的方法在工業(yè)機器人隘谣、無人機增拥、無人駕駛車輛和游戲角色設(shè)計中均有著廣泛應(yīng)用。
重大意義:Unity以使機器學(xué)習(xí)研究人員獲得最強大的訓(xùn)練場景為使命洪橘,為快速增長的AI愛好者群體探索深度學(xué)習(xí)提供了一個研究平臺跪者。
點評:NPC越來越聰明,對于游戲手殘黨來說可能不是個好事熄求。
入耳式人工智能
入選理由:耳機從外變成了智能穿戴設(shè)備渣玲,可以無限延續(xù)使用時間和場景。
技術(shù)突破:蘋果在今年即將推出的AirPods 2中加入了Siri喚起弟晚、內(nèi)置芯片等等忘衍,可以收集行走步數(shù)、心率數(shù)據(jù)和體溫等等卿城,還可以通過內(nèi)置陀螺儀捕捉用戶頭部移動狀況甚至定位位置枚钓,當(dāng)然也可以通過麥克風(fēng)接受命令,再通過揚聲器進(jìn)行反饋瑟押。
谷歌的實時翻譯無線耳機PixelBuds常被拿來與AirPods相比搀捷,PixelBuds對Google Assistant的喚起十分迅速,只要把手指放在耳機的觸控板上多望,幾乎同一時刻就可以和Google Assistant進(jìn)行對話嫩舟。
AirPods與PixelBuds讓我們重新定義了耳機對人類的作用,相比手腕上的智能手表怀偷,耳機顯然可以更方便的進(jìn)行語音交互家厌,在接收信息時更無需占用寶貴的視覺空間。還將智能音箱式的遠(yuǎn)場交互變成更自然也更快捷的近場交互椎工。
重大意義:智能耳機讓智能助理更接近隨身隨行饭于,蘋果、谷歌的涉足维蒙,必將帶起一波耳中AI的風(fēng)潮掰吕。
點評:現(xiàn)在我們手機不離手,以后可能要耳機不離耳了颅痊。