現(xiàn)在,人工智能很火灌诅,應(yīng)該是相當(dāng)?shù)幕鸺酰芏鄤?chuàng)業(yè)公司不管是不是真有智能都號(hào)稱(chēng)自己是人工智能公司单刁,投資人追逐人工智能拼命的砸錢(qián)到這些公司生怕失去賺錢(qián)機(jī)會(huì),媒體自媒體跟時(shí)髦不分青紅皂白不追根問(wèn)底更是火上加油府适。那么羔飞,到底應(yīng)該怎么去考量一家人工智能創(chuàng)業(yè)公司呢?
如何去看一家人工智能創(chuàng)業(yè)公司檐春。
第一逻淌,看創(chuàng)始人和團(tuán)隊(duì)的背景,之前是否有人工智能相關(guān)的教育疟暖,訓(xùn)練卡儒,和從業(yè)經(jīng)驗(yàn)和實(shí)踐。人工智能畢竟是高科技俐巴,不相信看看幾本書(shū)骨望,讀讀幾篇文章,參加幾次高端會(huì)議欣舵,就能成為專(zhuān)家擎鸠,就能打造人工智能產(chǎn)品。
第二缘圈,看有沒(méi)有自己IP的人工智能算法劣光,算法有沒(méi)有說(shuō)得出的創(chuàng)新點(diǎn)。用了深度學(xué)習(xí)糟把,或是其它機(jī)器學(xué)習(xí)算法赎线,不一定就是人工智能吧,必須要有自己的創(chuàng)見(jiàn)糊饱,自己的革新,自己的特色颠黎;
好比Google當(dāng)初發(fā)明PageRank的時(shí)候另锋,其他搜索公司都在計(jì)算鏈接被引用的次數(shù)滞项,并且把次數(shù)作為權(quán)重來(lái)指導(dǎo)排名。但是夭坪,PageRank把鏈接之間的關(guān)系抽象成了隨機(jī)行走(Random?Walk)模型文判,而不是簡(jiǎn)單的計(jì)數(shù)。這就是洞見(jiàn)室梅,產(chǎn)品出來(lái)就超過(guò)了競(jìng)品戏仓,好評(píng)如潮。
AlphaGo和其他棋類(lèi)算法一樣也使用了蒙特卡羅搜索亡鼠,但是赏殃,首創(chuàng)通過(guò)引入深度學(xué)習(xí)算法來(lái)指導(dǎo)剪枝和評(píng)估棋盤(pán)的優(yōu)劣,從而超過(guò)之前任何別的算法间涵,達(dá)到新的高度仁热。阿爾法狗是新加入了“價(jià)值網(wǎng)絡(luò)”“策略網(wǎng)絡(luò)”兩種深度神經(jīng)網(wǎng)絡(luò)算法,分別減少了搜索所需的廣度和深度勾哩,靠著更精準(zhǔn)的評(píng)估和更聰明的棋步選擇抗蠢;
阿爾法狗兩個(gè)關(guān)鍵技術(shù):一是獲勝概率的數(shù)學(xué)模型(純靠數(shù)據(jù)訓(xùn)練)二是啟發(fā)式搜索算法—蒙特卡數(shù)搜索算,作用是將搜索空間限制在非常有限的范圍內(nèi)思劳,保證計(jì)算機(jī)能夠快速找到答案迅矛;
算法很重要,但需要理性的看待算法的壁壘潜叛。算法一般存在于人腦中秽褒,存在著被泄密的風(fēng)險(xiǎn),開(kāi)始可能有優(yōu)勢(shì)钠导,時(shí)間長(zhǎng)了震嫉,保不準(zhǔn)被員工泄露,從而被競(jìng)爭(zhēng)對(duì)手抄襲了牡属,可見(jiàn)算法的風(fēng)險(xiǎn)也高票堵,不是一勞永逸的東西。另外逮栅,算法調(diào)優(yōu)中積累的經(jīng)驗(yàn)也很重要悴势,但有可能隨著員工的流失而流失。
第三措伐,看有沒(méi)有有優(yōu)勢(shì)的數(shù)據(jù)特纤,數(shù)據(jù)可能是長(zhǎng)期積累的行業(yè)和通用大量數(shù)據(jù),可能是很多的行業(yè)專(zhuān)家知識(shí)以規(guī)則或是知識(shí)圖譜的形式存在侥加。沒(méi)有積累的大量數(shù)據(jù)捧存,沒(méi)有專(zhuān)家整理的知識(shí),數(shù)據(jù)沒(méi)有很好的清洗結(jié)構(gòu)化甚至標(biāo)簽化,號(hào)稱(chēng)自己是人工智能公司昔穴,不知道智能能從哪冒出來(lái)镰官。IBM的Watson能做精準(zhǔn)醫(yī)療,他們?cè)谥百I(mǎi)了很多的醫(yī)療數(shù)據(jù)公司吗货,積累和分析了大量的期刊泳唠,論文,病例宙搬,藥品笨腥,治療方案,等等數(shù)據(jù)勇垛,從而能使Watson能利用算法創(chuàng)造奇跡脖母。
其實(shí)人工智能要在產(chǎn)業(yè)落地需要五大條件,首先是要有數(shù)據(jù)窥摄,要有明確的業(yè)務(wù)定義镶奉,也需要懂算法,要懂如何去設(shè)計(jì)架構(gòu)崭放,要懂得如何設(shè)計(jì)產(chǎn)品哨苛。人工智能真正在產(chǎn)業(yè)落地,不僅僅是一個(gè)學(xué)科的事情币砂,而是五項(xiàng)綜合的結(jié)果建峭。
一個(gè)算法人才普遍學(xué)習(xí)過(guò)?1-3?年的深度學(xué)習(xí)、會(huì)用開(kāi)源平臺(tái)去訓(xùn)練模型决摧,即使是這樣的人也不多亿蒸,而這些人更談不上是研究大牛。所以我認(rèn)為研究大牛是一種很稀缺的人才掌桩。當(dāng)然边锁,AI?產(chǎn)品經(jīng)理也非常重要,因?yàn)樗x需求波岛。如果造出來(lái)一個(gè)東西技術(shù)水平高茅坛,但不能解決實(shí)際問(wèn)題,技術(shù)再高也沒(méi)有實(shí)際價(jià)值。因此我們?cè)趧?chuàng)辦一個(gè)商業(yè)公司,AI?產(chǎn)品經(jīng)理也十分重要嘲碱。
其實(shí)隨著人工智能技術(shù)的發(fā)展,深度學(xué)習(xí)技術(shù)的應(yīng)用斥铺,在數(shù)據(jù)來(lái)源選擇、數(shù)據(jù)采集坛善、數(shù)據(jù)分析處理晾蜘、自然語(yǔ)言理解邻眷、網(wǎng)絡(luò)語(yǔ)義分析、分詞斷句笙纤、組詞成文等方面都可以通過(guò)軟件算法來(lái)實(shí)現(xiàn)耗溜,把這些算法用到機(jī)器人系統(tǒng)中,就可以實(shí)現(xiàn)一些新聞稿子的自動(dòng)撰寫(xiě)和審查來(lái)代替一部分記者工作省容;
未來(lái)新一代智能計(jì)算機(jī),將集成人工智能算法和機(jī)器人技術(shù)燎字,具有知識(shí)表示和推理能力腥椒,可以模擬或部分模擬代替人的智能,具有人機(jī)通信和理解的能力候衍;隨著電腦和智能硬件快速發(fā)展和普及應(yīng)用笼蛛,更多的先進(jìn)計(jì)算和智能計(jì)算技術(shù)也得到了快速的研究和發(fā)展,尤其是智能邏輯(先進(jìn)的自然語(yǔ)言理解系統(tǒng))蛉鹿、并行計(jì)算(量子計(jì)算機(jī)和三值光計(jì)算機(jī))滨砍、情感計(jì)算(電腦智能化的趨勢(shì))量子計(jì)算機(jī)利用量子力學(xué)規(guī)律來(lái)進(jìn)行高速的數(shù)學(xué)和邏輯運(yùn)算、存儲(chǔ)及處理量子信息妖异,其基本規(guī)律包括不確定原理惋戏、對(duì)應(yīng)原理和波爾理論;
三值光計(jì)算機(jī)由上海計(jì)算機(jī)著名人工智能專(zhuān)家金翊教授發(fā)明的他膳,光學(xué)計(jì)算機(jī)用液晶陣列控制光速偏振方向响逢,同時(shí)配合偏振片來(lái)完成信息處理;情感計(jì)算的重點(diǎn)是通過(guò)各種傳感器獲取人的姿態(tài)及表情棕孙,并分析人的內(nèi)在情感舔亭,建立“情感模型”使得電腦能夠理解人的“喜怒哀樂(lè)”等情感變化并自動(dòng)做出相應(yīng)的動(dòng)作;
其實(shí)人造系統(tǒng)智能化是一個(gè)漫長(zhǎng)的蟀俊、波浪式前進(jìn)钦铺、螺旋式上升的進(jìn)化過(guò)程,從感知到認(rèn)知肢预,從本能到技能矛洞,從組織到自組織,由量變到質(zhì)變误甚,由無(wú)機(jī)系統(tǒng)到耗散系統(tǒng)缚甩,由非生命體到生命體,由實(shí)體化到數(shù)字化窑邦,由數(shù)字化到智能化擅威,最終達(dá)到三體一化;智能的核心是思維冈钦,一切思維不過(guò)就是計(jì)算郊丛;在三體智能中,人腦是“意識(shí)人體”的核心,電腦是“數(shù)字虛體”的核心厉熟;在人腦與電腦之間存在相互作用的連接線导盅,從人腦到電腦是“數(shù)字建模”從電腦到人腦是“學(xué)習(xí)提升”
因?yàn)橐粋€(gè)智能系統(tǒng)揍瑟,始于感知白翻,精于計(jì)算,巧于決策绢片,勤于執(zhí)行滤馍,善于學(xué)習(xí);認(rèn)識(shí)智能底循,理解智能巢株,定義智能,走向智能是我們今天人類(lèi)必須面對(duì)的課題熙涤;未來(lái)數(shù)字虛體中會(huì)有自己的運(yùn)行法則和發(fā)展規(guī)律阁苞,甚至可以形成獨(dú)立的自我意識(shí),乃至出現(xiàn)數(shù)字人格祠挫,完整那槽、完美地形成數(shù)體智能,成為平行于人類(lèi)智能的新智能主體茸歧;
三體化一智能模型:簡(jiǎn)稱(chēng)三體模型倦炒;三體世界彼此交匯出了三個(gè)界面:物理實(shí)體—意識(shí)人體系統(tǒng)界面;意識(shí)人體—數(shù)字虛體系統(tǒng)界面软瞎;數(shù)字虛體—物理實(shí)體系統(tǒng)界面逢唤;所以三體交匯,認(rèn)知互動(dòng)涤浇,協(xié)同發(fā)展鳖藕,共同進(jìn)化;
所以說(shuō)運(yùn)算的智能不代表行動(dòng)的智能只锭;智能本質(zhì)是一切生命系統(tǒng)對(duì)自然規(guī)律的感應(yīng)著恩、認(rèn)知與運(yùn)用;當(dāng)人造系統(tǒng)能夠像人一樣具有一定的認(rèn)知能力蜻展,既有感知喉誊、會(huì)分析、自決策纵顾、善動(dòng)作伍茄,并且在分析與決策過(guò)程中善于運(yùn)用知識(shí)、同時(shí)學(xué)習(xí)施逾、積累乃至創(chuàng)造知識(shí)敷矫,就稱(chēng)其具有某種人造智能例获;
智能是一種普遍的心智能力,除其他事項(xiàng)外曹仗,涉及推理榨汤、規(guī)劃、解決問(wèn)題怎茫、抽象思維收壕、理解復(fù)雜的思想、快速學(xué)習(xí)和從經(jīng)驗(yàn)中學(xué)習(xí)的認(rèn)知能力轨蛤;一個(gè)系統(tǒng)是否具有對(duì)外界信息的感知與獲取能力啼器,是判斷該系統(tǒng)是否智能的首要特征;
認(rèn)知引擎:吃進(jìn)數(shù)據(jù)俱萍,擠出知識(shí),由認(rèn)知技術(shù)的核心算法實(shí)現(xiàn)告丢,具備了各種人腦認(rèn)知能力枪蘑,是一種為我們提供超強(qiáng)大的認(rèn)知計(jì)算服務(wù)的超級(jí)系統(tǒng);隨著增強(qiáng)的技術(shù)和全息技術(shù)的不斷發(fā)展岖免,數(shù)字永生的概念似乎可以走進(jìn)我們生活中岳颇;機(jī)器智能化,企業(yè)自組織化颅湘,制造社會(huì)化话侧,創(chuàng)新常態(tài)化,一切服務(wù)化闯参,體腦自由化瞻鹏,是即將到來(lái)的新工業(yè)革命的必然趨勢(shì);
認(rèn)知計(jì)算系統(tǒng)程序正在醞釀下一輪的計(jì)算和信息處理技術(shù)革命鹿寨,讓計(jì)算系統(tǒng)獲得超過(guò)當(dāng)今系統(tǒng)的推理新博、學(xué)習(xí)能力及自主水平;那就得把自然語(yǔ)言處理脚草、機(jī)器學(xué)習(xí)赫悄、知識(shí)再現(xiàn)(龐大的知識(shí)數(shù)據(jù)庫(kù))、人際交互和靈活規(guī)劃等AI工具聚合到一起馏慨;未來(lái)需要的是智能增強(qiáng)(IA)而不是人工智能(AI)埂淮;
我們?nèi)说闹R(shí)體系及其演化路徑:數(shù)據(jù)—信息—知識(shí)—認(rèn)知—智慧;知識(shí)是模型化的写隶,指導(dǎo)人做事的信息倔撞;智慧則是人的洞察力在意識(shí)上的體現(xiàn),推斷出未發(fā)生的事物之間的相關(guān)性樟澜,在既有知識(shí)的支持下產(chǎn)生創(chuàng)新知識(shí)误窖;
未來(lái)必將進(jìn)入“大知識(shí)”時(shí)代叮盘,人造系統(tǒng)也可以自動(dòng)生產(chǎn)知識(shí);意識(shí)人體對(duì)接數(shù)字虛體的方式有軟件中介霹俺、腦機(jī)接口柔吼、芯片植入和行為感知等多種方式;在2015年美國(guó)華盛頓大學(xué)丙唧,該杏海科學(xué)家使用網(wǎng)絡(luò)在1.5公里的距離內(nèi),將一個(gè)人的思想通過(guò)電磁波傳給另一個(gè)人:這叫做思維意識(shí)傳感想际;其實(shí)人的意念和思維是一種物質(zhì)培漏,可以轉(zhuǎn)化成電磁波發(fā)送和接收;那人與人的思維(意識(shí)人體)可以通過(guò)數(shù)字虛體而彼此聯(lián)接胡本;未來(lái)植入人腦的超級(jí)芯片可以實(shí)現(xiàn)人腦意識(shí)之間的腦際互聯(lián)網(wǎng)牌柄;
當(dāng)大腦思考與記憶的機(jī)制研究清楚以及腦機(jī)接口的技術(shù)成熟后,人們完全可以把微型化智能數(shù)字裝置作為一個(gè)“智腦”植入人體侧甫,需要什么知識(shí)就灌入什么知識(shí)模塊芯片珊佣;三體交匯,智能爆發(fā)披粟;知識(shí)互聯(lián)咒锻,創(chuàng)新必成;當(dāng)所有的知識(shí)能匯總守屉、聯(lián)接在一起成為大知識(shí)惑艇,無(wú)論何人何時(shí)何地從任何終端進(jìn)入都可以找到關(guān)于任何事情的知識(shí)與信息,這對(duì)于創(chuàng)新來(lái)說(shuō)是巨大的激發(fā)與誘導(dǎo)作用拇泛;
所以知識(shí)圖譜是下一代搜索引擎滨巴、自動(dòng)問(wèn)答等智能應(yīng)用的基礎(chǔ)設(shè)施∨鼍担互聯(lián)網(wǎng)大數(shù)據(jù)是知識(shí)圖譜的重要數(shù)據(jù)來(lái)源兢卵。知識(shí)表示是知識(shí)圖譜構(gòu)建與應(yīng)用的基礎(chǔ)技術(shù)。實(shí)體鏈指绪颖、關(guān)系抽取和知識(shí)推理是知識(shí)圖譜構(gòu)建與應(yīng)用的核心技術(shù)秽荤。知識(shí)圖譜與本體(Ontology)和語(yǔ)義網(wǎng)(Semantic?Web)等密切相關(guān)。知識(shí)表示(Knowledge?Representation)是人工智能的重要課題柠横。知識(shí)圖譜應(yīng)用價(jià)值最大垂直領(lǐng)域:醫(yī)療窃款,金融。
金融搜索引擎的背后核心技術(shù)是高質(zhì)量的知識(shí)圖譜和大量的業(yè)務(wù)規(guī)則牍氛,幫助實(shí)現(xiàn)聯(lián)想晨继、屬性查找、短程關(guān)系發(fā)現(xiàn)搬俊。探索引擎紊扬,如分面瀏覽器蜒茄,也是在知識(shí)圖譜的基礎(chǔ)上,則提供了人機(jī)協(xié)作的界面餐屎,讓人對(duì)數(shù)據(jù)的探索過(guò)程可以很方便地被記錄檀葛、迭代、重用腹缩。此外推薦系統(tǒng)和推送系統(tǒng)也非常有用屿聋,幫助金融用戶(hù)聚焦在關(guān)鍵數(shù)據(jù)上,更省時(shí)省力地做投前發(fā)現(xiàn)和投后跟蹤藏鹊。
未來(lái)我國(guó)將進(jìn)入一個(gè)經(jīng)濟(jì)金融市場(chǎng)化程度更高的新時(shí)代润讥,利率、匯率等金融風(fēng)險(xiǎn)將成為市場(chǎng)主體日常經(jīng)營(yíng)中必須面對(duì)和處理的主要風(fēng)險(xiǎn)盘寡;全球的交易不斷加速楚殿,越來(lái)越多的交易由計(jì)算機(jī)AI系統(tǒng)光速執(zhí)行;目前高頻交易者已經(jīng)擠跑了傳統(tǒng)的長(zhǎng)期做市商竿痰;
動(dòng)態(tài)的人工智能算法可以快速調(diào)整市場(chǎng)策略勒魔,就好像是真正的人類(lèi)交易員那樣學(xué)習(xí)、預(yù)測(cè)菇曲、并主動(dòng)去適應(yīng)市場(chǎng)的變化,而這些變化很大程度上正是由于人類(lèi)固有的缺陷(恐懼抚吠、貪婪常潮、信息不對(duì)稱(chēng)等)帶來(lái)的;機(jī)器算法需要一個(gè)全新的“交易池”這將是一個(gè)全由機(jī)器算法驅(qū)動(dòng)的交易池楷力,各種算法可以在其中得到進(jìn)化喊式、演變、成長(zhǎng)萧朝,甚至形成屬于機(jī)器算法的“生態(tài)系統(tǒng)”岔留;有些算法在編輯中采用了隨機(jī)函數(shù),這樣它們就可以在不同策略之間隨機(jī)切換检柬,從而掩蓋了它們的行蹤献联;
在電子交易時(shí)代,對(duì)投資者來(lái)說(shuō)何址,最好的最容易的最便宜的保護(hù)他們自己的方式就是使用所謂的限價(jià)訂單里逆;交易活躍是因?yàn)樗鼈兊睦走_(dá)偵測(cè)算法感受到市場(chǎng)上的行情變化;
從目前來(lái)講用爪,絕大部分人工智能創(chuàng)業(yè)公司都是在基于 GPU 這樣的計(jì)算平臺(tái)和在基于 Caffe原押、TensorFlow 這樣的開(kāi)源平臺(tái)用比較成熟的模型結(jié)構(gòu)來(lái)訓(xùn)練,然后做一些解決性問(wèn)題和 Demo偎血,差異化確實(shí)不明顯诸衔《⑵基于現(xiàn)在的開(kāi)源模式來(lái)做創(chuàng)新,在算法方面壁壘確實(shí)也不高笨农。所以這就導(dǎo)致在一些標(biāo)準(zhǔn)問(wèn)題里各家的效果都差不多就缆,技術(shù)差距也并不大。這里面的核心原因之一就是中國(guó)人工智能原創(chuàng)性技術(shù)太少磁餐。
目前比較主流的框架就是谷歌的 TensorFlow违崇、Facebook 的 Torch、傳統(tǒng)的 Caffe诊霹、亞馬遜的 MXNet 等羞延;這些框架各有優(yōu)點(diǎn),比如?Caffe?對(duì)視覺(jué)成像分析做的非常好脾还,谷歌的?TensorFlow?對(duì)自然語(yǔ)言處理做得非常好伴箩,MXNet?對(duì)多臺(tái)機(jī)器平行處理做得非常好。所謂推理系統(tǒng)鄙漏,就是AI的兩種思考問(wèn)題的模式嗤谚,一種是基于記憶的,一種是基于邏輯的怔蚌。于是巩步,我們發(fā)現(xiàn),AI其實(shí)擁有和人腦機(jī)器相似的思維模式桦踊。
最后總結(jié)一下中國(guó)人工智能產(chǎn)業(yè)4點(diǎn)現(xiàn)狀:1椅野、現(xiàn)下處于弱人工智能階段;2籍胯、中國(guó)的大數(shù)據(jù)75%集中在政府手中竟闪,BAT次之;3杖狼、國(guó)際IT巨頭盤(pán)踞硬件基礎(chǔ)層炼蛤,單純做強(qiáng)計(jì)算這塊基本沒(méi)機(jī)會(huì);4蝶涩、人工智能的關(guān)鍵在于新算法理朋,沉著等待下一個(gè)十年。
我們常常對(duì)人工智能的常見(jiàn)七大誤解有:人工智能=機(jī)器學(xué)習(xí)绿聘,機(jī)器學(xué)習(xí)=深度學(xué)習(xí)暗挑;人工智能=海量數(shù)據(jù),數(shù)據(jù)比算法更重要斜友;專(zhuān)用智能=通用智能炸裆;人工智能=機(jī)器人;人工智能=機(jī)器人取代人類(lèi)鲜屏、機(jī)器人要統(tǒng)治世界烹看;人工智能很快超過(guò)人類(lèi)智能国拇;人工智能與人類(lèi)智能、機(jī)器人與人類(lèi)=零和搏弈惯殊。語(yǔ)音識(shí)別不是人工智能問(wèn)題而是一個(gè)通信問(wèn)題酱吝,用通信技術(shù)模型解決語(yǔ)音識(shí)別問(wèn)題;