AI 簡(jiǎn)易入門:AI 技術(shù)落地框架阅茶、以語(yǔ)音交互為例的具體流程

對(duì) AI 的關(guān)注不止于行業(yè),不止于商業(yè)落地項(xiàng)目谅海,還有實(shí)現(xiàn) AI 的技術(shù)目派。

AI 技術(shù)在大多數(shù)技術(shù)人看來,目前的關(guān)鍵詞除了對(duì)應(yīng)的高薪胁赢,還有技術(shù)本身的門檻。針對(duì)后者白筹,現(xiàn)在已經(jīng)開始有線上線下教育平臺(tái)智末,抓住類似于、更甚于 2011 年 iOS 技術(shù)市場(chǎng)帶來的機(jī)遇徒河,為非科班出身的在職系馆、高校同學(xué)提供相對(duì)專業(yè)系統(tǒng)的培訓(xùn)。這些培訓(xùn)顽照,正在彌補(bǔ)市場(chǎng)人才的空缺由蘑,同時(shí)降低入門或轉(zhuǎn)型 AI 領(lǐng)域的門檻。對(duì)于想轉(zhuǎn)型的同學(xué)代兵,現(xiàn)在是一個(gè)不錯(cuò)的切入時(shí)間尼酿,不妨做一份計(jì)劃,逐步進(jìn)入植影。

噢~回到我自己的情況裳擎。過去四個(gè)月,把自己扔到了一個(gè)技術(shù)圈思币,所在平臺(tái)恰好 All in AI鹿响,這使得我日常可以浸染在想了解的 AI 議題中谷饿,有時(shí)候是產(chǎn)品惶我,更多時(shí)候是技術(shù)本身。深度學(xué)習(xí)博投、機(jī)器學(xué)習(xí)绸贡、自然語(yǔ)言處理、語(yǔ)音識(shí)別等等,都是其中的關(guān)鍵詞恃轩。當(dāng)我回顧這段時(shí)間接觸到的內(nèi)容结洼,總覺得有些混亂,無法串成一條線:它們之間是什么關(guān)系叉跛,當(dāng)它們出現(xiàn)在不同的文章時(shí)松忍,應(yīng)該如何判斷 A 與 B 是包含還是被包含,是流程線的上游還是下游 ——我嘗試從線上搜索尋找體系化的解答筷厘,無功而返鸣峭,所以在此梳理我目前能接觸到的 AI 技術(shù)術(shù)語(yǔ),此番梳理應(yīng)能幫助自己/初學(xué)者理清媒體文章中論述 AI 時(shí)頻現(xiàn)的關(guān)鍵詞與技術(shù)實(shí)現(xiàn)邏輯酥艳。

這一次的分享將分為三部分

一摊溶、AI 技術(shù)落地的大框架流程

二、AI 技術(shù)落地的具體流程:以語(yǔ)音交互為例

三充石、AI 為什么與我們所有人相關(guān)

嗯莫换,對(duì)了,首先骤铃,在這里明確一個(gè)定義:人工智能拉岁。這是一個(gè)現(xiàn)在幾乎每個(gè)人都聽過的名詞,但是當(dāng)你隨意問身邊的朋友惰爬,應(yīng)該如何解釋這個(gè)名詞的時(shí)候喊暖,其實(shí)大多數(shù)時(shí)候并沒有一個(gè)清晰的答案。

那人工智能這個(gè)名詞應(yīng)該如何理解呢撕瞧?

追溯人工智能最初定義陵叽,《人工智能:一種現(xiàn)代方法》的作者 Russell 提到:人工智能是對(duì)計(jì)算機(jī)展現(xiàn)出智慧的研究。人工智能探究如何在機(jī)器中創(chuàng)造智能意識(shí)丛版,它不是一種特定的技術(shù)巩掺。

但這個(gè)解釋,現(xiàn)在變成我們對(duì)人工智能廣義上的理解页畦。

當(dāng)我們環(huán)顧出現(xiàn)在我們身邊的文章锌半、演說,不難發(fā)現(xiàn)寇漫,人工智能更多時(shí)候相對(duì)狹義地被劃分成了一種基礎(chǔ)技術(shù)刊殉。在 20 世紀(jì) 80、90 年代州胳,人們將專家系統(tǒng)與人工智能混為一談记焊,現(xiàn)在人們常將機(jī)器學(xué)習(xí)深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和人工智能等同栓撞。

定義的統(tǒng)一是為了人們?cè)跍贤ㄉ蠈?duì)議題同一層面的理解遍膜,不分絕對(duì)優(yōu)劣碗硬。

在這篇文章,我主要分享的是狹義之下的人工智能:從實(shí)現(xiàn)人工智能的技術(shù)本身展開瓢颅。

------------------

一恩尾、AI 技術(shù)落地的大框架流程

(1)人工智能技術(shù)是如何產(chǎn)生作用的:它能/要做什么、它通過什么方法來做挽懦,它需要什么基礎(chǔ)翰意。

在這一部分,你將了解到目前 AI 技術(shù)落地的流程:數(shù)據(jù)輸入-計(jì)算分析-方案輸出信柿。

(2)在梳理這個(gè)流程的同時(shí)冀偶,會(huì)涉及到:媒體文章中常見到的深度學(xué)習(xí)、機(jī)器學(xué)習(xí)渔嚷、神經(jīng)網(wǎng)絡(luò)都是些什么进鸠,它們之間的關(guān)系又是怎樣的?

------------------

在說框架之前形病,需要清楚的是客年,人工智能這個(gè)被熱捧的技術(shù)領(lǐng)域能做什么?

如上 Russell 提到的人工智能技術(shù)漠吻,要使機(jī)器獲得類人的智能意識(shí)——使得機(jī)器像有智慧的人那樣量瓜,對(duì)外界的信息進(jìn)行吸收、內(nèi)化/分析侥猩,形成自己的“思考框架”,然后對(duì)外界進(jìn)行重新定義抵赢、解釋欺劳、對(duì)話/輸出。更通俗一些铅鲤,就是:使得機(jī)器像人一樣划提,看聽讀感受外界信息,然后像人一樣邢享,輸出自己看聽讀感受到的外界鹏往。只不過,對(duì)于人而言骇塘,獲取與輸出的信息更多為自我需求服務(wù)伊履,而人工智能機(jī)器的落地,是需要為第三方款违,即人唐瀑,實(shí)現(xiàn)衣食住行及工作領(lǐng)域的服務(wù)。

好了插爹,了解了人工智能通俗定義下“”能夠做什么“”的一個(gè)核心邏輯哄辣,我們回到人工智能技術(shù)本身请梢,它要通過什么方法/流程來實(shí)現(xiàn)“像人那樣智能”呢?

嗯力穗,三步走毅弧。

數(shù)據(jù)輸入-計(jì)算分析-方案輸出。

數(shù)據(jù)輸入当窗,可以類比人類接受的外界刺激够坐。機(jī)器依靠特定載體(如傳感器),接收“刺激”超全,這些“刺激”就是機(jī)器可以解讀的數(shù)據(jù)咆霜,包括語(yǔ)音、文本嘶朱、圖像蛾坯、手勢(shì)、體感疏遏、虹膜等形式脉课,最前沿的還有來自動(dòng)物包括人類的大腦信號(hào)/刺激。

計(jì)算分析财异,可以類比接受刺激后倘零,“神經(jīng)中樞”(如底層芯片、云端算法等硬件軟件)戳寸,對(duì)輸入的數(shù)據(jù)進(jìn)行識(shí)別呈驶、理解、分析疫鹊。在人工智能技術(shù)領(lǐng)域袖瞻,這種對(duì)數(shù)據(jù)的計(jì)算分析,通常會(huì)用到:語(yǔ)音識(shí)別拆吆、文本翻譯聋迎、計(jì)算機(jī)視覺/圖像識(shí)別等關(guān)鍵詞。

在計(jì)算分析的過程中枣耀,我們要實(shí)現(xiàn)的是對(duì)數(shù)據(jù)(語(yǔ)音霉晕、文本、圖像捞奕、體感等)處理牺堰。處理的目的是使得機(jī)器智能(可以感知、學(xué)習(xí)颅围、推理萌焰、規(guī)劃、判斷等)谷浅。學(xué)習(xí)是機(jī)器獲得“知識(shí)”扒俯,實(shí)現(xiàn)智能行為如推理奶卓、規(guī)劃、判斷撼玄、再學(xué)習(xí)的基礎(chǔ)——可以類比我們?nèi)祟愃械姆治雠袛鄾Q策依據(jù)夺姑,均基于我們已有的知識(shí)經(jīng)驗(yàn)。

這個(gè)“學(xué)習(xí)”掌猛,正是目前人工智能技術(shù)領(lǐng)域主流關(guān)注的核心盏浙。這里涉及一個(gè)“機(jī)器學(xué)習(xí)”的專業(yè)術(shù)語(yǔ)。機(jī)器學(xué)習(xí)是人工智能技術(shù)的一種識(shí)別模式荔茬,相較“數(shù)據(jù)挖掘”(Data Mining)這個(gè)以商業(yè)視角來理解人工智能應(yīng)用的方法废膘,機(jī)器學(xué)習(xí)是以人工智能技術(shù)實(shí)現(xiàn)層面來定義,這一個(gè)術(shù)語(yǔ)可以被解釋為:計(jì)算的相反過程/反問題慕蔚。這是什么意思呢丐黄?計(jì)算的正過程是,我們給出一個(gè)方程式/規(guī)則孔飒,然后將數(shù)據(jù)代入方程式獲得計(jì)算結(jié)果灌闺。相反的:過程是,我們現(xiàn)在有數(shù)據(jù)坏瞄,但是沒有方程式桂对,機(jī)器要通過數(shù)據(jù)(訓(xùn)練數(shù)據(jù))來給出方程式,然后再走下一步(根據(jù)推算的方程式預(yù)測(cè)新的數(shù)據(jù)結(jié)果)鸠匀。

機(jī)器學(xué)習(xí):計(jì)算的反問題

這其中蕉斜,“機(jī)器如何學(xué)習(xí)”這個(gè)維度,衍生出了:全監(jiān)督學(xué)習(xí)缀棍、半監(jiān)督學(xué)習(xí)宅此、無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)睦柴、遷移學(xué)習(xí)等學(xué)習(xí)方式的劃分诽凌。這一個(gè)維度的劃分毡熏,區(qū)分了機(jī)器學(xué)習(xí)模式是否需要人為干預(yù)給予機(jī)器標(biāo)簽坦敌、機(jī)器是否可以基于數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)自動(dòng)學(xué)習(xí)或者觸類旁通。

比如痢法,監(jiān)督學(xué)習(xí)狱窘,是需要預(yù)設(shè)“標(biāo)簽”,給機(jī)器當(dāng)“老師”的角色财搁,應(yīng)用涉及醫(yī)學(xué)診斷等蘸炸;無監(jiān)督學(xué)習(xí)是讓機(jī)器自己來學(xué)習(xí),不需要人為預(yù)設(shè)的答案尖奔;強(qiáng)化學(xué)習(xí)是機(jī)器可以在訓(xùn)練中自己學(xué)習(xí)搭儒,比如基于環(huán)境穷当、動(dòng)作、外界反饋進(jìn)行自我迭代淹禾、博弈馁菜,比如 AlphaGo 可以基于外界的反饋,進(jìn)行自我學(xué)習(xí)铃岔、博弈汪疮;遷移學(xué)習(xí)涉及更高級(jí)的智能,可以實(shí)現(xiàn)觸類旁通毁习,比如基于人的表情圖+環(huán)境布置智嚷,來分析推斷情節(jié)的發(fā)展等。

另外纺且,對(duì)機(jī)器學(xué)習(xí)盏道,行業(yè)還有一個(gè)二分式的劃分維度:基于“學(xué)習(xí)”流程中是否“應(yīng)用到多個(gè)隱含神經(jīng)網(wǎng)絡(luò)”這個(gè)維度,機(jī)器學(xué)習(xí)被劃分為:深度學(xué)習(xí)隆檀、其他機(jī)器學(xué)習(xí)摇天。這個(gè)維度,深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)恐仑,兩個(gè)子集的一刀切泉坐,不難初步判斷出,應(yīng)用了隱含層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)裳仆,區(qū)別于其他的機(jī)器學(xué)習(xí)存在腕让,在機(jī)器學(xué)習(xí)中具備重要地位——事實(shí)上,深度學(xué)習(xí)在近年引領(lǐng)了語(yǔ)音與圖像識(shí)別領(lǐng)域的重要突破歧斟,因而被越來越多地從機(jī)器學(xué)習(xí)這個(gè)“母體”獨(dú)立區(qū)分開來纯丸。

對(duì)了,上面提到的“神經(jīng)網(wǎng)絡(luò)”静袖,也是常出現(xiàn)在人工智能相關(guān)文章中的關(guān)鍵詞觉鼻。我們可以大致(但其實(shí)并不完全準(zhǔn)確地)將“神經(jīng)網(wǎng)絡(luò)”類比為神經(jīng)元,神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)學(xué)習(xí)推理的過程中還有人們無法解釋的環(huán)節(jié)队橙,但神經(jīng)網(wǎng)絡(luò)的復(fù)雜度遠(yuǎn)沒有人類的神經(jīng)元復(fù)雜坠陈。

含多個(gè)隱層的深度學(xué)習(xí)

方案輸出,是指機(jī)器接收了外界圖文捐康、語(yǔ)音等數(shù)據(jù)信息仇矾,經(jīng)由計(jì)算分析流程,輸出的內(nèi)容解总≈埃基于 AI 技術(shù)輸出的信息,需要終端設(shè)備承接花枫、需要交互界面與人/物進(jìn)行交互刻盐。目前行業(yè)主流最為關(guān)注的频伤,應(yīng)算是智能音箱這樣的終端設(shè)備查乒。終端設(shè)備還與智能可穿戴產(chǎn)品相關(guān)名眉。經(jīng)由終端載體承接忙芒,AI 技術(shù)輸出的方案,現(xiàn)在已經(jīng)應(yīng)用到金融供屉、安防行冰、營(yíng)銷、醫(yī)療伶丐、汽車悼做、家居等領(lǐng)域。鑒于文章的重點(diǎn)在于理清 AI 技術(shù)落地流程哗魂,而不在行業(yè)與產(chǎn)品落地現(xiàn)狀肛走,就不在此展開后者,不過想了解更多录别,可以看一下我此前專門寫的 AI 產(chǎn)品落地的兩篇文章朽色。(1.AI技術(shù)要比產(chǎn)品落地進(jìn)展快得多:智能音箱只是第一步2.這個(gè)時(shí)代與我們有關(guān):不止于AI定制化新金融、決策方案组题、智能出行

不知道讀者有沒有留意到葫男,上述三步,每一步都是涉及數(shù)據(jù)(外界信息語(yǔ)音崔列、圖文轉(zhuǎn)化成的數(shù)據(jù))梢褐。這其實(shí)是我在上面提到的: AI 技術(shù)的落地需要什么基礎(chǔ)——是數(shù)據(jù),是海量的數(shù)據(jù)赵讯。所以當(dāng)我們提到 AI 技術(shù)盈咳,大數(shù)據(jù)是技術(shù)落地的“肉”,沒有數(shù)據(jù)边翼,技術(shù)只是一個(gè)無法運(yùn)轉(zhuǎn)的骨架鱼响。嗯,這延伸到技術(shù)領(lǐng)域的學(xué)習(xí)组底,你會(huì)發(fā)現(xiàn)丈积,AI 技術(shù)中,會(huì)有算法與數(shù)據(jù)結(jié)構(gòu)之類的關(guān)鍵詞斤寇,算法與數(shù)據(jù)是落地 AI 繞不過的一環(huán)桶癣。

二拥褂、AI 技術(shù)落地的具體流程:以語(yǔ)音交互為例

文章到目前為止娘锁,梳理了 AI 技術(shù)在大框架流程的內(nèi)容,厘清這些信息饺鹃,算是初步了解 AI 技術(shù)落地的原理莫秆。在這一步之后间雀,我們可以進(jìn)一步解讀 AI 技術(shù)本身是怎樣形成具體 AI 產(chǎn)品的。接下來镊屎,我將拆解目前 AI 領(lǐng)域被熱捧的智能音箱——實(shí)現(xiàn)語(yǔ)音交互的流程惹挟。

在這一部分,你將了解到:

語(yǔ)音交互實(shí)現(xiàn)流程缝驳,以及其中的難點(diǎn)是什么连锯?

與之相較,延伸開來用狱,當(dāng)我們談到計(jì)算機(jī)視覺运怖、文本翻譯、腦神經(jīng)連接又可以聊些什么夏伊?

------------------

現(xiàn)在摇展,我們來看一下語(yǔ)音交互實(shí)現(xiàn)的流程:語(yǔ)音輸入→語(yǔ)音識(shí)別→語(yǔ)義理解→語(yǔ)音合成→語(yǔ)音輸出。下圖的左側(cè)是簡(jiǎn)約版的流程溺忧,右側(cè)是相對(duì)細(xì)化的流程咏连。

語(yǔ)音交互技術(shù)落地流程

從第一步輸入語(yǔ)音,機(jī)器識(shí)別系統(tǒng)就要面對(duì)這樣的問題:聲音源距離是否合適鲁森、機(jī)器如何被聲音激活祟滴。這兩個(gè)問題,在 ASR 領(lǐng)域有對(duì)應(yīng)的術(shù)語(yǔ):遠(yuǎn)場(chǎng)識(shí)別歌溉、語(yǔ)音激活檢測(cè)以及語(yǔ)音喚醒踱启。(對(duì)這些詞語(yǔ)的認(rèn)知將有助于入門者更好理解沒有背景介紹的文獻(xiàn)資料。在此不作更細(xì)的展開研底,有興趣深入的同學(xué)可以再作探究埠偿,或者關(guān)注我未來兩個(gè)月的分享)

語(yǔ)音識(shí)別(Automatic Speech Recognition,ASR)榜晦,是語(yǔ)音輸入后冠蒋,機(jī)器接收器下一步要做的事情。完成 ASR 流程要走三步乾胶,對(duì)輸入的語(yǔ)音編碼→解碼→輸出抖剿。

在 ASR 編碼、解碼過程中识窿,機(jī)器會(huì)基于不同的聲學(xué)模型:主要是利用隱馬爾科夫模型實(shí)現(xiàn)的傳統(tǒng)識(shí)別斩郎、利用深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的端到端識(shí)別兩種識(shí)別模式,解決語(yǔ)音非標(biāo)喻频、環(huán)境嘈雜缩宜、聲音無法打斷等現(xiàn)實(shí)語(yǔ)音存在的問題。

語(yǔ)義理解,這里指的是自然語(yǔ)言處理(Natural Language Processing锻煌,NLP)妓布。如圖提到的,NLP 是目前人工智能領(lǐng)域最大的瓶頸宋梧。額外提一下匣沼,NLP 不僅適用于語(yǔ)言文字本身,還適用于圖像等——更甚的發(fā)展是捂龄,現(xiàn)在 FaceBook 等企業(yè)已經(jīng)嘗試通過 NLP 打通文字释涛、語(yǔ)音、圖片的識(shí)別環(huán)節(jié)(比如看到圖片可以解釋出文字倦沧、輸出語(yǔ)音)枢贿,相較單一在文字或者語(yǔ)音、或者圖片上進(jìn)行 NLP 刀脏,這是更高層次的機(jī)器智能局荚。回到語(yǔ)音交互領(lǐng)域的 NLP ,目前自然語(yǔ)言生成(Natural Language Generation愈污,NLG)是 NLP 最前沿的研究領(lǐng)域耀态。經(jīng)過 ASR ,還有自然語(yǔ)言理解(Natural Language Understanding暂雹,NLU)流程首装,機(jī)器進(jìn)行計(jì)算處理對(duì)話語(yǔ)音,那最后如何生成符合人類需要的語(yǔ)言(像人一樣對(duì)外界問題給出答案)杭跪?問題的答案在于 NLG仙逻,其中,NLG 的水平涧尿,是未來語(yǔ)音交互的核心點(diǎn)之一——試想一下系奉,你(C 端用戶)和一臺(tái)機(jī)器對(duì)話,你需要它輸出什么回復(fù)給你姑廉?越是匹配你的需求缺亮,越能獲得你的認(rèn)可與信賴,不是嗎桥言?在 B 端亦然萌踱。只不過 C 端相對(duì)沒那么重客觀數(shù)據(jù),而 B 端重客觀信息号阿。

關(guān)于 NLP 這個(gè)環(huán)節(jié)并鸵,在落地的過程中有更多值得深究的細(xì)節(jié)。對(duì)話應(yīng)該如何理解扔涧,理解對(duì)話之后應(yīng)該輸出什么园担?現(xiàn)在的語(yǔ)音交互市場(chǎng),比如智能音箱,就有基于不同的需求粉铐,比如個(gè)人助理、家居助理卤档、購(gòu)物助理蝙泼、學(xué)習(xí)助理等等定位,經(jīng)過不同的對(duì)話理解與設(shè)計(jì)劝枣,產(chǎn)出不同的落地音箱產(chǎn)品汤踏。這其中,不同的對(duì)話設(shè)計(jì)舔腾,尤其是面對(duì) C 端用戶溪胶,現(xiàn)在各創(chuàng)業(yè)項(xiàng)目,開始用“訓(xùn)機(jī)師”的角色稳诚,讓機(jī)器獲得更具備“人性哗脖、個(gè)性”特色的表現(xiàn)。比如 Amazon 的 Alexa扳还,在原始對(duì)話組織上才避,就由具有創(chuàng)意寫作碩士身份的米歇爾·里根·蘭森負(fù)責(zé),其手下還有一批劇作家氨距、詩(shī)人桑逝、音樂家、小說家等俏让,他們每周的作品都被整合到 Alexa 的人格設(shè)定中楞遏。

噢~對(duì)了,那機(jī)器學(xué)習(xí)首昔、深度學(xué)習(xí)是如何在語(yǔ)音交互中產(chǎn)生作用的呢寡喝?就像你在上幾段內(nèi)容看到的,輸入語(yǔ)音后勒奇,機(jī)器需要識(shí)別拘荡、理解、生成反饋的語(yǔ)言撬陵。怎樣才能輸出合適珊皿、或者說相對(duì)合適的語(yǔ)言(數(shù)據(jù))呢?就需要機(jī)器從過去的數(shù)據(jù)(比如網(wǎng)絡(luò)上的語(yǔ)料巨税、人工輸入的語(yǔ)料)進(jìn)行訓(xùn)練蟋定,訓(xùn)練出一個(gè)相對(duì)最優(yōu)的方程式/規(guī)則,這個(gè)方程式將為未來用戶使用時(shí)輸入的語(yǔ)音(數(shù)據(jù))提供一個(gè)依據(jù)草添,產(chǎn)出相對(duì)匹配的對(duì)話信息驶兜。(所以啊,機(jī)器學(xué)習(xí)過程和效果直接影響輸出的對(duì)話對(duì)用戶的價(jià)值。)

語(yǔ)音合成(Text to Speech抄淑,TTS)屠凶,是經(jīng)過語(yǔ)音輸入、語(yǔ)音識(shí)別肆资、語(yǔ)義理解矗愧、自然語(yǔ)言生成后,機(jī)器形成語(yǔ)言文字(也可是其他形式的語(yǔ)言表達(dá))郑原,轉(zhuǎn)化成語(yǔ)音的過程唉韭。語(yǔ)音的合成,目前來看犯犁,落地產(chǎn)品會(huì)在語(yǔ)音形象上(產(chǎn)品面向的人群是誰(shuí)属愤,需要細(xì)膩溫和的聲音還是其他?需要保持平穩(wěn)的語(yǔ)調(diào)還是基于人格化設(shè)置產(chǎn)出適合場(chǎng)景的個(gè)性化語(yǔ)調(diào)酸役?)做出區(qū)別住诸。嗯,在我看來涣澡,語(yǔ)音合成在語(yǔ)音形象上的設(shè)置只壳,只有在 NLP、NLG 等環(huán)節(jié)匹配適合人們需求的解答暑塑,才可以作為錦上添花的角色吼句,否則也不難基于這個(gè)單點(diǎn)形成產(chǎn)品競(jìng)爭(zhēng)力。

好了事格,到這里惕艳,我們已經(jīng)對(duì) AI 領(lǐng)域語(yǔ)音交互具體實(shí)現(xiàn)流程做了一個(gè)較為詳細(xì)的梳理:你可以從流程中,獲得對(duì) AI 技術(shù)產(chǎn)品落地的具象認(rèn)識(shí)——也可以基于這個(gè)流程驹愚,設(shè)想如果自己來構(gòu)建一個(gè)智能音箱远搪,需要經(jīng)過怎樣的關(guān)鍵環(huán)節(jié),在每個(gè)環(huán)節(jié)可能遇到的主要問題有哪些(更具體的還有待探究)逢捺。

上述是 AI 技術(shù)實(shí)現(xiàn)語(yǔ)音交互的分享谁鳍。那談到同樣要基于 AI 技術(shù)去落地的計(jì)算機(jī)視覺(Computer Vision ,CV)(在此不嚴(yán)謹(jǐn)區(qū)分 CV劫瞳、MV)倘潜、文本翻譯,甚至是更前沿的腦機(jī)連接志于,我們又可以聊些什么呢涮因?其實(shí)核心流程是相似的,都需要輸入數(shù)據(jù)(圖像伺绽、文字养泡、神經(jīng)元信號(hào))嗜湃,然后通過計(jì)算分析,輸出現(xiàn)實(shí)需要的解決方案/依據(jù)澜掩。比如在 CV 領(lǐng)域购披,目前最受關(guān)注的包括無人駕駛障礙物處理、安防人臉識(shí)別等肩榕,就要基于海量的圖片數(shù)據(jù)刚陡,通過機(jī)器學(xué)習(xí),計(jì)算分析圖片的意義(此處還要 NLP )点把,輸出幫助決策判斷的信息橘荠。流程相似屿附,同時(shí)意味著郎逃,有差異——不同領(lǐng)域的具體落地,會(huì)遇到不同的問題挺份,比如計(jì)算機(jī)視覺中要解決攝像頭信噪褒翰、對(duì)比度、光照匀泊、觀察角度等問題优训。

三、講完狹義之下專注的 AI 技術(shù)各聘,我們回到廣義之下的 AI :AI 與我們所有人相關(guān)

現(xiàn)在揣非,從 AI 短期的影響來看,很多人說 AI 是程序員的新機(jī)遇躲因。放長(zhǎng)視線早敬,我們不難發(fā)現(xiàn),AI 給所有人提供了新的機(jī)遇大脉。技術(shù)落地是 AI 給我們帶來的第一層影響搞监,而 AI 產(chǎn)品,需要懂人性镰矿、企業(yè)需求的人來架構(gòu)琐驴,這會(huì)是未來幾年 AI 引發(fā)的對(duì)我們的第二層影響,對(duì)人的了解秤标、對(duì)商業(yè)運(yùn)轉(zhuǎn)的把握會(huì)給另一批人帶來新的可能绝淡。AI 產(chǎn)品架構(gòu)成型后,如何擴(kuò)大影響力苍姜,這將是 AI 給我們帶來的第三層影響够委,當(dāng)這一層廣泛涉及到每一個(gè)我們的日常生活、工作時(shí)怖现,我們將進(jìn)入一個(gè)類同現(xiàn)在互聯(lián)網(wǎng)世界的 AI 世界茁帽,嗯玉罐,運(yùn)營(yíng)人在其中的作用不可忽視。

談到 AI 與我們所有人相關(guān)潘拨,AI 帶來的機(jī)遇是其中一個(gè)維度吊输,如果說這一個(gè)維度滿足了現(xiàn)實(shí)層面的功利需求,那么铁追,我在這最后季蚂,想以“人文素養(yǎng)與精神境界”的維度,來分享為什么 AI 與我們所有人有關(guān)系:機(jī)器通過數(shù)據(jù)訓(xùn)練獲得的“智能”琅束,是人們主動(dòng)的輸入與設(shè)定扭屁,目前機(jī)器沒有倫理道德的判斷,只會(huì)針對(duì)數(shù)字分析涩禀、給予人類反饋料滥。AI 產(chǎn)品最終的落地是對(duì)人類友好與否,由人來設(shè)定艾船;AI 產(chǎn)品使人們向善葵腹、向積極生活進(jìn)化與否,由人來設(shè)定屿岂。前者的落地践宴,需要落地 AI 產(chǎn)品的人們具備人文素養(yǎng),用匹配社會(huì)友好價(jià)值觀的準(zhǔn)則來設(shè)定是與非爷怀;后者的落地阻肩,依靠具備如哲學(xué)家素養(yǎng)的人們來為 AI 產(chǎn)品注入人類深層的思考。落地產(chǎn)品的人直接塑造 AI 產(chǎn)品本身运授,而接受這些 AI 產(chǎn)品的我們將可能被越來越像人的 AI 產(chǎn)品影響烤惊,甚至是塑造。

嗯徒坡,文章已經(jīng)很長(zhǎng)了撕氧,在此就不再展開說其他。希望讀完此文喇完,你能對(duì)狹義之下 AI 技術(shù)落地框架伦泥、 AI 領(lǐng)域語(yǔ)音交互技術(shù)的落地流程有一個(gè)相對(duì)具體的認(rèn)識(shí)。最后是對(duì)廣義之下的 AI 有更多人文探索的好奇心锦溪。


歡迎 AI 創(chuàng)業(yè)者和我進(jìn)一步交流不脯。

(感謝這個(gè)月能在黃釗老師主導(dǎo)的AI PM大本營(yíng)學(xué)到相關(guān)內(nèi)容,文中觀點(diǎn)多來自黃釗老師及大本營(yíng)小伙伴的分享與啟發(fā))

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末刻诊,一起剝皮案震驚了整個(gè)濱河市防楷,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌则涯,老刑警劉巖复局,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件冲簿,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡亿昏,警方通過查閱死者的電腦和手機(jī)峦剔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來角钩,“玉大人吝沫,你說我怎么就攤上這事〉堇瘢” “怎么了惨险?”我有些...
    開封第一講書人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)脊髓。 經(jīng)常有香客問我辫愉,道長(zhǎng),這世上最難降的妖魔是什么供炼? 我笑而不...
    開封第一講書人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任一屋,我火速辦了婚禮窘疮,結(jié)果婚禮上袋哼,老公的妹妹穿的比我還像新娘。我一直安慰自己闸衫,他們只是感情好涛贯,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蔚出,像睡著了一般弟翘。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上骄酗,一...
    開封第一講書人閱讀 51,688評(píng)論 1 305
  • 那天稀余,我揣著相機(jī)與錄音,去河邊找鬼趋翻。 笑死睛琳,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的踏烙。 我是一名探鬼主播师骗,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼讨惩!你這毒婦竟也來了辟癌?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤荐捻,失蹤者是張志新(化名)和其女友劉穎黍少,沒想到半個(gè)月后寡夹,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡厂置,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年要出,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片农渊。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡患蹂,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出砸紊,到底是詐尸還是另有隱情传于,我是刑警寧澤,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布醉顽,位于F島的核電站沼溜,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏游添。R本人自食惡果不足惜系草,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望唆涝。 院中可真熱鬧找都,春花似錦、人聲如沸廊酣。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)亡驰。三九已至晓猛,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間凡辱,已是汗流浹背戒职。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留透乾,地道東北人洪燥。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像续徽,于是被迫代替她去往敵國(guó)和親蚓曼。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容