人工智能現(xiàn)在很熱值漫,但是對(duì)于很多人來說還是搞不清楚它到底是個(gè)什么東西。比如說:
- AI機(jī)器人已經(jīng)能和人類對(duì)話了织盼,它是能夠簡(jiǎn)單思考了嗎杨何?
- alpha狗在圍棋上打敗了人類,它是否智商超群并且擁有思維了悔政?
- 機(jī)器學(xué)習(xí)晚吞,是機(jī)器人懂得學(xué)習(xí)了嗎延旧?
機(jī)器好像越來越聰明谋国,我們生活在一個(gè)越來越智能的時(shí)代,并且迁沫,時(shí)代只會(huì)繼續(xù)向前推進(jìn)芦瘾。這篇文章作為一個(gè)小小的科普捌蚊,已經(jīng)了解這些的人大可付之一笑。此文僅獻(xiàn)給和我一樣曾經(jīng)困惑的人近弟。不講高科技不講數(shù)學(xué)公式缅糟,讓每個(gè)人能看得懂才是此文的意義。
3祷愉,2窗宦,1,開始二鳄。
AI和人類對(duì)話是怎么做到的赴涵?
1、最簡(jiǎn)單的方式——關(guān)鍵詞回復(fù)
最簡(jiǎn)單的實(shí)現(xiàn)方式订讼,作為一個(gè)程序員我就要說關(guān)鍵詞回復(fù)了髓窜。如果你不大懂什么叫關(guān)鍵詞回復(fù),就去看看你關(guān)注的公眾號(hào)欺殿,好多公眾號(hào)里都會(huì)有:回復(fù)某些關(guān)鍵詞寄纵,就可以查看相關(guān)信息,對(duì)吧~
舉個(gè)例子脖苏,當(dāng)粉絲在公眾號(hào)里發(fā)“你好”的時(shí)候程拭,自動(dòng)回復(fù)“您好呀,歡迎關(guān)注xxx”棍潘。
關(guān)鍵就在于當(dāng)程序收到“你好”兩個(gè)字的時(shí)候哺壶,就自動(dòng)回復(fù)一句事先設(shè)置好的回復(fù)內(nèi)容。類似觸發(fā)條件蜒谤,你按哪個(gè)燈的開關(guān)山宾,哪個(gè)燈就會(huì)亮起。
2鳍徽、加入點(diǎn)難度
為啥關(guān)鍵詞回復(fù)是最簡(jiǎn)單的资锰?因?yàn)闂l件固定啊阶祭!你發(fā)送關(guān)鍵詞"A"绷杜,就推給你實(shí)現(xiàn)設(shè)置好的和A相匹配的信息,發(fā)送"B"濒募,就推給你和B相匹配的信息鞭盟。人工智能可不是這樣,他能夠?qū)υ挘?/p>
那么對(duì)話的難度在哪里瑰剃?
這里我要澄清一個(gè)問題齿诉,人工智能并不是能夠思考,也并沒有思維。那么人工智能為什么能像人類一樣對(duì)話呢粤剧?
我是不是已經(jīng)把你搞糊涂了歇竟?那一定是我講得不夠好,希望你還有耐心往下看抵恋。
AI沒有思維焕议,它之所以能夠回答你的問題,并且更進(jìn)一步和你聊天弧关,實(shí)際上還是關(guān)鍵詞回復(fù)的原理盅安。
對(duì)話的難度,其實(shí)也是讓你感到神奇的地方世囊,是它能夠根據(jù)一整句話而不是單個(gè)的詞語(即關(guān)鍵詞)來作為回復(fù)的依據(jù)宽堆。
“你好,我叫王小明茸习,今天認(rèn)識(shí)你很開心畜隶。”這句話号胚,如果你是一個(gè)機(jī)器人而不是一個(gè)自帶聊天天賦的人類籽慢,你要怎么回復(fù)?按我們剛才說的關(guān)鍵詞回復(fù)的方法猫胁,你是按照“你好”回復(fù)呢箱亿?還是“王小明”,還是“今天”弃秆,還是“開心”來回復(fù)届惋?
這里其實(shí)我已經(jīng)在下意識(shí)的使用分詞了。什么叫分詞菠赚,就是把語句分成一個(gè)一個(gè)重要的關(guān)鍵詞脑豹。
有木有豁然開朗?是這樣的呀衡查,你說的是一整個(gè)句子瘩欺,可是機(jī)器在處理的時(shí)候其實(shí)是分成了一個(gè)一個(gè)的關(guān)鍵詞。這樣我們重要的關(guān)鍵詞就有了拌牲,回復(fù)才有了可能俱饿。
當(dāng)然和AI的對(duì)話涉及到“語音識(shí)別”問題,我后面會(huì)講到塌忽,其實(shí)實(shí)現(xiàn)這個(gè)技術(shù)用了好多年拍埠,說起來卻很簡(jiǎn)單的原理。我先賣個(gè)關(guān)子土居,其實(shí)語音識(shí)別和AI與人類的對(duì)話枣购,解決的方法是一樣的嬉探。
繼續(xù)來說句子的回復(fù),現(xiàn)在我有了多個(gè)有意義的關(guān)鍵詞坷虑。有意義是相對(duì)于那些無意義的虛詞來說,比如中文中的“的”埂奈,“了”迄损,還有各種語氣詞。有意義的關(guān)鍵詞現(xiàn)在有了账磺,下一步芹敌,就是給詞語標(biāo)權(quán)重。
什么叫權(quán)重垮抗?
現(xiàn)在玩過狼人殺的人應(yīng)該很多吧氏捞,在把狼人投出去的時(shí)候,普通人每人有1票的權(quán)利冒版,警長(zhǎng)有3票液茎。這個(gè)就是權(quán)重,普通人的權(quán)重是1辞嗡,警長(zhǎng)的權(quán)重是3捆等。那么他說話自然更有用一些。
詞語也有權(quán)重续室,并且這個(gè)權(quán)重是人為加上去的栋烤,背后是我們叫做"library"的。你可以理解為字典挺狰,或者詞庫明郭。大家的輸入法有時(shí)候可以選擇輸入偏好吧,是體育類別的還是互聯(lián)網(wǎng)類別的丰泊,詞庫會(huì)不太一樣薯定。互聯(lián)網(wǎng)里面我們說“數(shù)據(jù)庫”瞳购、“服務(wù)器”沉唠、“AI”、“人工智能”比較多苛败,那體育類的就是“足協(xié)”满葛、“比賽”、“賽事”之類的比較多罢屈,我不懂體育嘀韧,瞎編的。
詞語有了權(quán)重缠捌,這時(shí)候就可以綜合把幾個(gè)關(guān)鍵詞以及他們的權(quán)重綜合運(yùn)算锄贷,怎么運(yùn)算我就不細(xì)講了译蒂,不是本文側(cè)重點(diǎn)。
于是這時(shí)候谊却,AI就能回答你的句子了柔昼。
這個(gè)時(shí)候,其實(shí)回復(fù)還不是特別的準(zhǔn)確和令人滿意炎辨。想想你最初的sira捕透。
靈魂是——統(tǒng)計(jì)
什么?不是在說智能嗎碴萧?不是在說技術(shù)嗎乙嘀?不是互聯(lián)網(wǎng)嗎?你說編程雖然我看不懂但是符合我的邏輯啊破喻,和統(tǒng)計(jì)有什么關(guān)系虎谢?Are you kidding me?
NO!相信我曹质,當(dāng)初也和你一樣懵逼婴噩。同時(shí)我也要告訴你,語音識(shí)別技術(shù)的突破背后羽德,其實(shí)也是統(tǒng)計(jì)學(xué)讳推。搜索引擎能夠那么貼心的給你幾乎最合適的答案背后也是統(tǒng)計(jì)學(xué)凝赛。
大家知道現(xiàn)在語音識(shí)別技術(shù)已經(jīng)可以做到同聲翻譯了饮潦,跟專業(yè)做同傳幾十年的人類已經(jīng)不相上下了。機(jī)器并不是擁有比人類更高的智商践宴,它的背后是大量的數(shù)據(jù)坏为,也就是我們耳朵都聽出繭來的“大數(shù)據(jù)”究驴。大數(shù)據(jù)為嘛牛?是統(tǒng)計(jì)啊童鞋們匀伏,因?yàn)闃颖驹蕉嘟y(tǒng)計(jì)越精確啊洒忧。就是這么簡(jiǎn)單的道理。
當(dāng)然道理很簡(jiǎn)單够颠,做起來卻有很復(fù)雜的數(shù)學(xué)公式在起作用熙侍,當(dāng)然還有許許多多的技術(shù)人員在技術(shù)方便的改善,比如說算法履磨。數(shù)據(jù)量那么龐大蛉抓,算法的進(jìn)步直接影響到處理結(jié)果的時(shí)間和精確度。
這里引入一個(gè)有些人應(yīng)該并不陌生的詞——信息熵剃诅。但是并不多講巷送。
今天只能到這里了,統(tǒng)計(jì)的作用在人工智能中是巨大的矛辕,我最近正在惡補(bǔ)統(tǒng)計(jì)的知識(shí)笑跛。
我信息的來源是吳軍的《數(shù)學(xué)之美》付魔,從搜索引擎的實(shí)現(xiàn)原理,到語音識(shí)別技術(shù)飞蹂,背后其實(shí)都是統(tǒng)計(jì)學(xué)几苍。大數(shù)據(jù)+統(tǒng)計(jì)學(xué),才是真正變革我們時(shí)代的秘密武器陈哑。想要了解的童鞋可以去看一下妻坝,肯定比我講得好。
希望我寫的對(duì)你有用芥颈,當(dāng)然第一次寫又是在深夜惠勒,可能比較亂赚抡,請(qǐng)見諒爬坑。如果能解決你一星半點(diǎn)的疑惑,那么我的目的就達(dá)到了涂臣。