以下都是自己平時(shí)知識(shí)的一些總結(jié),只是一些個(gè)人的愚見,下面出現(xiàn)的公司、書籍灸眼、視頻匕积、網(wǎng)站都是自己看過體驗(yàn)過的,不是給他們打廣告,不是廣告奠骄!不是廣告!不是廣告!不同意見的評(píng)論區(qū)留下意見即可
一、AI的興起與互聯(lián)網(wǎng)
1.互聯(lián)網(wǎng)的紅利消失
1) PC端和移動(dòng)端使用人數(shù)固定
目前來看,PC端和移動(dòng)端的每年出貨量都在一個(gè)值上下垂攘,移動(dòng)端大概在每年4億臺(tái)陨仅,PC端更少而且每年還在下降咪鲜。
2) 大流量入口被巨頭瓜分
從平時(shí)大部分人的手機(jī)端來看,一般人下載的應(yīng)用就那么幾個(gè)。
聊天(QQ展蒂、微信)松捉,資訊(今熱頭條、知乎评汰、微博)惨缆,外賣(餓了么、美團(tuán))等軟件,基本上的移動(dòng)端流量都被這些巨頭給帶走了。
3) 獲客成本大幅度提高
現(xiàn)在已經(jīng)不是幾個(gè)人合作開發(fā)個(gè)APP就能搞定的年代了,基本上投資家就會(huì)問,你是怎樣獲客的,也就是你能找到你的適用人群嗎?怎樣讓人去用它。
2015年打車大戰(zhàn)時(shí)五嫂,資本投了很多錢抛猫,滴滴和快的一年都燒了一個(gè)億用來獲客败匹;2016年的共享單車也是一樣槽棍。隨著APP的飽和豌拙,即使出現(xiàn)一個(gè)很好的idea拼岳,你都需要大量的資金去燒。
2.互聯(lián)網(wǎng)對(duì)傳統(tǒng)行業(yè)的改造有限
1) 醫(yī)療本質(zhì)
醫(yī)療的本質(zhì)是醫(yī)生給人看病哪审。但是有一個(gè)問題互聯(lián)網(wǎng)它是解決不來的滴须,那就是全國上下醫(yī)生的數(shù)量并沒有因?yàn)榛ヂ?lián)網(wǎng)而增多朝氓,數(shù)量就那么多将宪。互聯(lián)網(wǎng)的本質(zhì)是解決了信息的不對(duì)稱問題,它把醫(yī)生和病人連接在一起秉剑,但是本質(zhì)上還是一個(gè)醫(yī)生只能看一個(gè)病人价卤,只是效率上略有提高,本質(zhì)問題并沒有解決。
AI可以帶來新的可能五续,未來她可以在很多方面代替醫(yī)生給人看病、抓藥等挖息。從本質(zhì)上提升了看病的效率幢码。
2) 物流本質(zhì)
物流的本質(zhì)上問題也是跟醫(yī)療問題一樣贞铣,也是一個(gè)司機(jī)開一輛車圣勒,并沒有從根本上解決這個(gè)行業(yè)的效率痛點(diǎn)。
3) 制造業(yè)本質(zhì)
制造業(yè)從第二次工業(yè)革命之后痴鳄,生產(chǎn)效率就沒有大的提升顾画。第一工業(yè)革命后寓盗,制造業(yè)全面升級(jí)箩艺,伴隨著大量手工業(yè)者的失業(yè)虫给,隨之而來的是谷暮,蒸汽動(dòng)力帶來的產(chǎn)業(yè)鏈革新蔬充;而第二次工業(yè)革命是內(nèi)燃機(jī)和電力的普及,帶來新的動(dòng)力班利,制造業(yè)進(jìn)入飛速發(fā)展的時(shí)代饥漫,從而帶來生產(chǎn)力的進(jìn)步推動(dòng)社會(huì)的發(fā)展闯割;互聯(lián)網(wǎng)帶來的三次革命是信息革命锥忿,制造業(yè)并沒有從中獲取太多的好處,而AI可以為制造業(yè)帶來新的可能,大幅度提升生產(chǎn)力。
4) 其他的類似有打車行業(yè)氧骤、餐飲行業(yè)和教育行業(yè)等输枯,互聯(lián)網(wǎng)也都沒有對(duì)其作出根本性的改變议泵。
3.AI有無限遐想
1) 全新的世界
a) 新的交互方式:語音交互,視頻交互桃熄,手勢(shì)交互
b) 新的購物方式:虛擬試衣
c) 新的游戲體驗(yàn):VR/AR帶來的新一代沉入式游戲
2) 機(jī)會(huì)眾多
a) 雙創(chuàng)帶來的AI機(jī)會(huì)
國家近年來提出的雙創(chuàng)計(jì)劃先口,鼓勵(lì)大眾創(chuàng)新創(chuàng)業(yè),而且國家最近又將AI列入國家的發(fā)展規(guī)劃之中瞳收,可見未來AI將會(huì)給年輕人帶來很多機(jī)會(huì)碉京。
b) AI可以帶來新的商業(yè)模式
看互聯(lián)網(wǎng)的20年發(fā)展史可知,互聯(lián)網(wǎng)的每一次小小革新都將帶來新的商機(jī)和商業(yè)模式螟深。干爹馬云創(chuàng)立淘寶給商家和用戶直接的交易帶來了可能谐宙;小馬哥創(chuàng)立的騰訊帝國帶來了社交方式的突破,讓我明白了“羊毛出在豬身上”的真諦界弧;而最近幾年的共享經(jīng)濟(jì)模式和直播經(jīng)濟(jì)模式又是一個(gè)創(chuàng)新的商業(yè)模式凡蜻,并且中國的共享單車被外國人稱為“新四大發(fā)明”之一。
3) 大量的工作機(jī)會(huì)
a) AI訓(xùn)練師:
這個(gè)職業(yè)已經(jīng)在某些招聘網(wǎng)站上可以看到了垢箕,而且工資還都不低划栓。
b) 機(jī)器人顧問:
我想這個(gè)是未來為機(jī)器人服務(wù)的一個(gè)崗位。
c) 虛擬律師:
我想大概將來虛擬產(chǎn)業(yè)起來之后条获,將會(huì)有針對(duì)虛擬的事物(機(jī)器人忠荞、智能產(chǎn)品、虛擬的世界NPC等)法律法規(guī),這時(shí)這個(gè)職業(yè)將會(huì)應(yīng)運(yùn)而生钻洒。類似的我猜應(yīng)該還有機(jī)器慰問師等奋姿。
d) AI PM:
這個(gè)現(xiàn)在應(yīng)經(jīng)被大多數(shù)科技企業(yè)所接受了,也是伴隨著AI而生的素标。
4.AI將大規(guī)模提升生產(chǎn)力
1) 看病效率大幅度提升
AI創(chuàng)企依圖科技已經(jīng)在和某些三家醫(yī)院合作称诗,并采用AI系統(tǒng)平臺(tái)來代替醫(yī)生對(duì)腫瘤等影像圖片進(jìn)行分析了,未來將會(huì)在更多的領(lǐng)域協(xié)助醫(yī)生看病分析病情头遭,改變以往一個(gè)醫(yī)生在單位時(shí)間內(nèi)的看病效率寓免。
2) 無人車解決交通物流壓力
現(xiàn)如今各大一線城市皆都因?yàn)樗郊臆嚨钠占霸斐山煌ǖ亩氯o大城市的交通運(yùn)輸造成極大壓力计维。電商的發(fā)展造成物流的運(yùn)輸壓力袜香。
3) 智慧機(jī)器人推進(jìn)制造業(yè)升級(jí)
智慧機(jī)器人的高精度重復(fù)作業(yè)既降低了企業(yè)的人力成本,也降低了人身安全風(fēng)險(xiǎn)鲫惶,相反卻可大大提高企業(yè)的生產(chǎn)力蜈首。
4) 經(jīng)濟(jì)的發(fā)展帶動(dòng)文明的進(jìn)步
AI帶來的生產(chǎn)力發(fā)展,而生產(chǎn)力又是人類文明進(jìn)步的推動(dòng)力欠母,文明發(fā)展將會(huì)為人類探索未知世界(星空欢策、深海、生命的起源等)帶了新的機(jī)會(huì)和突破赏淌。
5) 機(jī)器人解決陪伴踩寇、護(hù)理、客服等問題
5.AI能為用戶打造個(gè)性化服務(wù)體驗(yàn)
1) 淘寶能夠根據(jù)個(gè)人信息匹配衣服尺寸
淘寶上買衣服眾所周知都是看中后詢問客服衣服的尺寸及其他的信息六水,以后則可以利用機(jī)器學(xué)習(xí)建立每個(gè)用戶的尺寸信息和款式愛好等特征給用戶畫像俺孙,下一次買衣服則不用客服來回答用戶的尺寸信息了,直接可以推薦用戶的合適款式掷贾。
2) 婚戀網(wǎng)站根據(jù)用戶社交屬性打造興趣朋友圈
婚戀交友網(wǎng)站可以利用用戶的數(shù)據(jù)來訓(xùn)練機(jī)器從而建立模型為用戶畫像睛榄,再為用戶推薦匹配交友對(duì)象等。
3) 點(diǎn)對(duì)點(diǎn)式教育促進(jìn)個(gè)性化知識(shí)的傳播
未來的教育形式在滿足普通教育的基礎(chǔ)上胯盯,人們?cè)絹碓匠缟袀€(gè)性化的因材施教方案懈费,而只有利用AI為每一個(gè)用戶個(gè)性化打造個(gè)性化的教育內(nèi)容计露。
4) 百度能根據(jù)用戶畫像博脑,實(shí)現(xiàn)精準(zhǔn)搜索
這個(gè)百度已經(jīng)在利用了,不需要多說了票罐。
二叉趣、AI? PM的必須
1.算法的開源和數(shù)據(jù)資源戰(zhàn)
1) 谷歌和BAT算法框架的免費(fèi)
未來的算法和框架肯定都是免費(fèi)的,這是大公司們的套路该押,“羊毛出在豬身上”疗杉,大公司靠其他業(yè)務(wù)盈利如云計(jì)算等。
2) 技術(shù)服務(wù)利潤窄
3) 數(shù)據(jù)價(jià)值的商業(yè)提現(xiàn)
2.技術(shù)人才不適用于商業(yè)發(fā)展的需求
1) 推動(dòng)社會(huì)進(jìn)步的不是技術(shù)的創(chuàng)造而是技術(shù)落地的實(shí)現(xiàn)著
a) 瓦特發(fā)明蒸汽機(jī)從而進(jìn)入蒸汽時(shí)代推動(dòng)工業(yè)革命
b) 貝爾發(fā)明電話打開通訊時(shí)代
c) 愛迪生發(fā)明電燈從而讓人類拜托黑暗
d) 促進(jìn)信息時(shí)代發(fā)展的不是互聯(lián)網(wǎng)的提出者,而是各大科技公司的CEO們
2) AI技術(shù)人才的思維并不一定適用于商業(yè)模式的探討
3) 商業(yè)落地需要?jiǎng)?chuàng)新意識(shí)
3.產(chǎn)品的落地需要專業(yè)人才探討
1) 百度引進(jìn)陸奇
百度AI技術(shù)在中國是走在前列的烟具,領(lǐng)先與BAT中的其他兩家梢什,然而Robin還是去硅谷請(qǐng)來了陸奇為其開拓AI的落地業(yè)務(wù),隨之而來的是一大批技術(shù)大牛(吳恩達(dá)朝聋、余凱等)的離去嗡午。側(cè)面證明了AI產(chǎn)品人在未來場(chǎng)景落地應(yīng)用方面的重要性。
2) 智能音箱的落地更需產(chǎn)品思維
在美國的所有高科技企業(yè)中冀痕,谷歌是以技術(shù)見長的在AI方面更是技術(shù)人才輩出荔睹,然而正如陸奇所說的,在硅谷言蛇,AI商業(yè)化的落地探尋中僻他,亞馬遜才是最成功的(原話不記得了,大概意思是這樣)腊尚,因?yàn)閬嗰R遜的智能音箱Echo至少是賣火了的吨拗,賣出了AI的概念,讓用戶知道了有這么個(gè)高科技玩意婿斥。
4.未來的產(chǎn)品涉及到各個(gè)方面(哲學(xué)丢胚、心理、情感)
1) 智能音箱(情感)
智能音箱中的對(duì)話情景涉及到人與人之間的情感分析受扳,這些都不是技術(shù)人才能搞得定的携龟,所謂術(shù)業(yè)有專攻,這些情景類的探尋還是需要懂用戶的產(chǎn)品人來開拓市場(chǎng)勘高。
2) 虛擬購物(懂用戶)
5.細(xì)分行業(yè)的垂直應(yīng)用需要復(fù)合型人才開拓
1) 陪伴類機(jī)器人需要情感交流
2) 智能投顧需要金融知識(shí)
3) 智慧醫(yī)療需醫(yī)學(xué)知識(shí)
4) 無人車商用需要懂人文法律
三峡蟋、未來產(chǎn)品的思考
1.未來工具
1) 交互工具
人用語音,機(jī)器視覺呈現(xiàn)华望、手表蕊蝗、頭盔、眼鏡等
2) 交通工具
可能是移動(dòng)分眾平臺(tái)赖舟、星巴克蓬戚、書房
3) 社交工具
虛擬社區(qū)、主題公園宾抓、游戲世界等
2.AI+行業(yè)
1) 定義:AI技術(shù)沒發(fā)展之前是沒有這個(gè)行業(yè)的
2) 特點(diǎn):
a) 行業(yè)壁壘較低子漩,和巨頭同一起跑線
b) 機(jī)會(huì)太少
c) 技術(shù)要求高,創(chuàng)業(yè)團(tuán)隊(duì)得高大上
d) 創(chuàng)新思維要求高
3) 應(yīng)用:
a) 無人車:AI技術(shù)發(fā)展起來之前石洗,誰敢大言不饞的說無人駕駛幢泼。
b) 智能音箱:ASR、NLP沒突破之前讲衫,智能音箱的概念估計(jì)都沒人敢提缕棵。
c) 城市大腦:計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)的突破才讓圖片分析成為可能,才能幫助治理城市。
d) 人臉識(shí)別:這個(gè)方向純粹就是計(jì)算機(jī)視覺和機(jī)器視覺發(fā)展的產(chǎn)物招驴。
e) 陪伴機(jī)器人:未來機(jī)器人發(fā)展的必經(jīng)之一篙程。
3.行業(yè)+AI
1) 定義:一直存在的行業(yè),AI只是帶來產(chǎn)業(yè)升級(jí)
2) 特點(diǎn):
a) 有很深的行業(yè)壁壘别厘,巨頭并沒有什么優(yōu)勢(shì)
b) 對(duì)創(chuàng)業(yè)公司更友好
c) 懂AI的行業(yè)人才相較AI人才更重要
d) 七成以上的產(chǎn)品落地都在行業(yè)+AI上
3) 應(yīng)用:
a) AI醫(yī)療影像
b) 無人物流貨運(yùn)
c) AI數(shù)據(jù)投顧
d) 無人零售
e) AI安防
4.方式的考慮
1) 控制方式
未來產(chǎn)品的控制方式將會(huì)更加的自然房午,從以前的少數(shù)極客到受過高等教育的學(xué)生再到老人和小孩。
2) 感知豐富
a) 輸入:多種感知方式的輸入丹允,語音郭厌、手勢(shì)
b) 輸出:語言、圖像雕蔽、行為
3) 導(dǎo)向:從功能導(dǎo)向到以人為核心
4) 內(nèi)容
a) 內(nèi)容標(biāo)簽化折柠、精細(xì)化
b) 內(nèi)容個(gè)性化用戶畫像、精準(zhǔn)化
c) 形態(tài):以語音和視頻為主體(不再主動(dòng)尋找)
5.產(chǎn)品形態(tài)
1) 云端一體:
????a) 端:語音批狐、視覺扇售、行動(dòng)
????b) 云:數(shù)據(jù)、算法嚣艇、服務(wù)
2) 形態(tài)以方便自然為導(dǎo)向
6.應(yīng)用類別
1) 關(guān)鍵性應(yīng)用
a) 用戶承受要求極高承冰,容錯(cuò)率極低
精確度99%意味著100次出一次事故,99.9%意味著1000次出一次事故食零,因此技術(shù)要求高困乒,非要一些技術(shù)大牛坐鎮(zhèn)不可,因此對(duì)大部分的創(chuàng)業(yè)公司不是很友好贰谣。
b) 落地應(yīng)用
????i. 手術(shù)機(jī)器人
????ii. 醫(yī)療影像分析
????iii. 無人飛行
????iv. 智能配藥
????v. 無人駕駛
c) 技術(shù)要求很高娜搂,非高大上搞不定
d) 項(xiàng)目周期長,商業(yè)化遙遠(yuǎn)吱抚,盈利遙遙百宇。
2) 非關(guān)鍵性應(yīng)用
a) 落地應(yīng)用:
????i. 智能安防
????ii. 人臉識(shí)別
????iii. 掃地機(jī)器人
????iv. 陪伴機(jī)器人
????v. 送餐機(jī)器人
b) 技術(shù)要求不高,能達(dá)到通用技術(shù)即可
c) 用戶承受力期望要求不高
d) 項(xiàng)目周期短秘豹,短時(shí)間可判斷能否盈利携御,且對(duì)廣大想要在AI上尋找機(jī)會(huì)的創(chuàng)業(yè)者來說更友好一點(diǎn),機(jī)會(huì)跟多一點(diǎn)既绕。
四啄刹、產(chǎn)品人技能樹
1.AI發(fā)展史
1) AI孕育期(1943-1955):計(jì)算機(jī)器與智能的提出
????a) 明斯基和同學(xué)造出第一臺(tái)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)
????b) 阿蘭.圖靈提出圖靈測(cè)試
2) AI的誕生(1956):達(dá)特矛斯會(huì)議幾個(gè)科學(xué)家(麥卡錫、明斯基岸更、香農(nóng)等)提出了人工之能這個(gè)名詞鸵膏,并正式有了概念。
3) 熱情與期望(1956-1973)
????a) 西蒙提出物理符號(hào)系統(tǒng)
????b) 薩繆爾編寫西洋跳棋程序
????c) 算法發(fā)明
????????????i. 貝爾曼公式的提出:增強(qiáng)學(xué)習(xí)的雛形
????????????ii. 感知器的提出:深度學(xué)習(xí)模型的雛形
????d) 人工智能實(shí)驗(yàn)室在高校(MIT怎炊、斯坦福)的建立
????e) 廣泛應(yīng)用于數(shù)學(xué)和NLP領(lǐng)域以解決代數(shù)、幾何證明和英語問題
4) 第一次寒冬(1974-1980)
????a) 邏輯證明器、感知器评肆、增強(qiáng)學(xué)習(xí)只能夠做簡單的任務(wù)
????b) 數(shù)學(xué)模型被發(fā)現(xiàn)有缺陷
????c) 政府中斷合作并轉(zhuǎn)移資金债查,社會(huì)輿論壓力
5) AI崛起(1980)
????a) 專家系統(tǒng)的提出
????b) BP算法的提出
6) 第二次寒冬(1987)
????a) 蘋果和IBM生產(chǎn)的臺(tái)式機(jī)性能超越專家系統(tǒng)性能
????b) 美國政府項(xiàng)目局否決AI為下一個(gè)浪潮
7) 現(xiàn)代AI(21世紀(jì)初左右)
????a) 1997年IBM深藍(lán)戰(zhàn)勝國際象棋冠軍
????b) 2009年羅斯聯(lián)邦理工學(xué)院的藍(lán)腦計(jì)劃成功模擬部分鼠腦
????c) 大數(shù)據(jù)導(dǎo)致深度學(xué)習(xí)興起
????d) 2011年IBM沃森挑戰(zhàn)智力問答節(jié)目“危險(xiǎn)邊緣”奪冠
????e) 2016年阿法狗戰(zhàn)勝人類圍棋冠軍
????f) 2017年AI被列入各大國的戰(zhàn)略發(fā)展規(guī)劃中
2.AI通識(shí)理解
1) 基礎(chǔ)計(jì)算能力層:云計(jì)算、GPU等硬件加速瓜挽,神經(jīng)網(wǎng)絡(luò)芯片
2) 技術(shù)框架層:TensorFlow盹廷、Caffe、Theano久橙、Torch俄占、DMTK、DTPAR淆衷、ROS等框架或操作系統(tǒng)
3) 算法層(機(jī)器學(xué)習(xí))
a) 監(jiān)督學(xué)習(xí)
i. 定義:已標(biāo)注的數(shù)據(jù)為老師缸榄,機(jī)器得出模型,然后輸出預(yù)測(cè)數(shù)據(jù)結(jié)果
ii. 解決問題
????① 回歸問題
????② 分類問題
iii. 算法模型
????① 線性回歸模型
????② K-近鄰算法
????③ 決策樹
????④ 樸素貝葉斯
????⑤ 邏輯回歸
b) 半監(jiān)督學(xué)習(xí)
i. 定義:通識(shí)使用未標(biāo)注和標(biāo)注的數(shù)據(jù)訓(xùn)練模型來進(jìn)行模式識(shí)別工作
ii. 解決問題
????① 垃圾信息過濾
????② 視頻網(wǎng)站分析
iii. 算法模型
????① 半監(jiān)督SVM(支持向量機(jī))
????② 高斯模型
????③ KNN模型
????④ Self-trainning
????⑤ Co-trainning
iv. 優(yōu)點(diǎn)
????① 相比監(jiān)督學(xué)習(xí)祝拯,節(jié)約人力成本甚带,提高投入產(chǎn)出比
????② 相比無監(jiān)督學(xué)習(xí),可以得到分配更高精度的模型
c) 無監(jiān)督學(xué)習(xí)
i. 定義:不給機(jī)器提供已標(biāo)注的數(shù)據(jù)佳头,讓機(jī)器自己對(duì)數(shù)據(jù)進(jìn)行處理并輸出結(jié)果
ii. 解決問題
????① 關(guān)聯(lián)
????② 聚類
????③ 降維
iii. 算法模型
????① K均值算法
????② 自編碼
????③ 主成分分析
????④ 隨機(jī)森林
d) 強(qiáng)化學(xué)習(xí)
i. 定義:機(jī)器感知環(huán)境的正狀態(tài)轉(zhuǎn)移時(shí)會(huì)反饋給機(jī)器的一個(gè)獎(jiǎng)賞鹰贵,使機(jī)器學(xué)習(xí)朝著正信號(hào)趨勢(shì)學(xué)習(xí),從而使累積獎(jiǎng)賞值最大康嘉。
ii. 解決問題
????① 自動(dòng)直升機(jī)
????② 機(jī)器人控制
????③ 手機(jī)網(wǎng)絡(luò)路由
????④ 市場(chǎng)決策
????⑤ 工業(yè)控制
????⑥ 高效網(wǎng)頁索引
iii. 算法模型
① K-搖臂賭博機(jī)(單步強(qiáng)化學(xué)習(xí)任務(wù))
????1. ε-貪心算法
????2. Softmax算法
② 有模型學(xué)習(xí)(多步強(qiáng)化學(xué)習(xí)任務(wù))
????1. 基于T步累積獎(jiǎng)賞的策略評(píng)估算法
????2. 基于T步累積獎(jiǎng)賞的策略迭代算法
③ 免模型學(xué)習(xí)
????1. 蒙特卡羅強(qiáng)化學(xué)習(xí)
????????a) 同策略
????????b) 異策略
????2. 時(shí)序查分學(xué)習(xí)
????????a) Q-學(xué)習(xí)算法
????????b) Sarsa算法
④ 模仿學(xué)習(xí)
e) 遷移學(xué)習(xí)
i. 定義:指從一個(gè)領(lǐng)域的學(xué)習(xí)結(jié)果遷移到另一個(gè)學(xué)習(xí)領(lǐng)域
ii. 解決問題
????① 終身學(xué)習(xí)
????② 知識(shí)轉(zhuǎn)移
????③ 歸納遷移
????④ 多任務(wù)學(xué)習(xí)
????⑤ 知識(shí)的鞏固
????⑥ 上下文相關(guān)學(xué)習(xí)
????⑦ 元學(xué)習(xí)
????⑧ 增量學(xué)習(xí)
iii. 算法模型:TrAdBoost算法
f) 深度學(xué)習(xí)
i. 定義:多層神經(jīng)網(wǎng)絡(luò)
ii. 解決問題
????① 預(yù)測(cè)學(xué)習(xí)
????② 語音識(shí)別
????③ 圖像識(shí)別
iii. 算法模型:RNN碉输、DNN、CNN
iv. 優(yōu)點(diǎn)
????① 從特征中檢測(cè)復(fù)雜的相互作用
????② 從幾乎沒有處理的原始數(shù)據(jù)中學(xué)習(xí)低層次的特征
????③ 處理高基數(shù)類成員
????④ 處理未標(biāo)記的數(shù)據(jù)
4) 通用技術(shù)層
a) 語音識(shí)別(ASR)
i. 概念
① 原理:輸入——編碼——解碼——輸出
② 識(shí)別方式
????1. 傳統(tǒng)識(shí)別:一般采用隱馬爾可夫模型HMM
????2. 端到端識(shí)別:一般采用深度神經(jīng)網(wǎng)絡(luò)DNN
ii. 遠(yuǎn)場(chǎng)識(shí)別
????① 語音激活檢測(cè)VAD:遠(yuǎn)場(chǎng)識(shí)別信噪比(SNR)比較高
????② 語音喚醒:智能設(shè)備需要語音喚醒詞來使其工作
③ 難點(diǎn)
????1. 喚醒時(shí)間:用戶發(fā)出語音到設(shè)備響應(yīng)用戶所花時(shí)間(目前還是略長)
????2. 功耗:目前功耗并不低
????3. 喚醒詞:一般在3-4個(gè)字
????4. 喚醒結(jié)果
????????a) 漏報(bào):喊他他不應(yīng)(喚醒詞字?jǐn)?shù)太多容易發(fā)生漏報(bào))
????????b) 誤報(bào):沒喊他他應(yīng)(喚醒詞字?jǐn)?shù)太少容易發(fā)生誤報(bào))
iii. 麥克風(fēng)陣列
????① 背景:在復(fù)雜的背景下經(jīng)常有各種噪聲亭珍、回聲腊瑟、混響來干擾識(shí)別場(chǎng)景此時(shí)需要麥克風(fēng)陣列 ? ? ?來處理雜聲。
????② 作用
????????1. 語音增強(qiáng)
????????2. 聲源定位
????????3. 去混響
????????4. 聲源信號(hào)的提取和分離
????③ 分類
????????1. 線性:一維(180度)
????????2. 環(huán)形:二維(360度)
????????3. 球形:三維空間
????④ 個(gè)數(shù)
????????1. 一般常用為2块蚌、4闰非、6麥
???????2. 單麥、雙麥峭范、多麥在嘈雜環(huán)境下拾音效果差距較大
????????3. 5麥和8麥在安靜環(huán)境下效果相當(dāng)
iv. 全雙工
????① 單工:A和B說話财松,B只能聽A說
????② 半雙工:A(中路miss了,下路注意了纱控,完畢)? B(下路收到辆毡,完畢)
????③ 全雙工:兩人多輪對(duì)話,可插話和打斷
v. 糾錯(cuò):對(duì)識(shí)別的語句進(jìn)行糾錯(cuò)
b) 自然語音處理(NLP)
i. 過程
????① NLU(自然語言理解)
????② NLG(自然語言生成)
ii. 難點(diǎn)
????① 語言歧義性:意思意思(到底是什么意思甜害,機(jī)器無法弄明白)
????② 語言魯棒性:句子多字少字錯(cuò)字舶掖,語法錯(cuò)誤(這個(gè)人都經(jīng)常出錯(cuò),機(jī)器現(xiàn)在還無法搞定)
????③ 知識(shí)依賴:蘋果(這個(gè)到底指“水果”還是指“手機(jī)”)
????④ 語境:上下文的語境分析(她走了——她到底是哪個(gè)呢)
iii. 解決方法(這個(gè)太多了就不細(xì)說了尔店,深究的同學(xué)可自查資料)
????① 規(guī)則方法
????② 統(tǒng)計(jì)方法
????③ 深度學(xué)習(xí)
????④ 關(guān)聯(lián)方法
iv. 應(yīng)用
????① 句法語義分析
????② 信息抽取
????③ 文本挖掘
????④ 機(jī)器翻譯
????⑤ 信息檢索
????⑥ 問答系統(tǒng)
????⑦ 對(duì)話系統(tǒng)
c) 語音合成(TTS)
i. 實(shí)現(xiàn)方法
????① 拼接法:
????????1. 定義:從事先錄制的大量語音中眨攘,選擇基本單位(音節(jié)主慰、音素)拼接而成,為了連貫性 ? ? ? ? 常采用雙音子(一個(gè)因素的中央倒下一個(gè)因素的中央)作為單位鲫售。
????????2. 優(yōu)點(diǎn):語音質(zhì)量較高
????????3. 缺點(diǎn):數(shù)據(jù)庫較大共螺,一般需幾十小時(shí)的成品語料,企業(yè)級(jí)商用的話需5萬句費(fèi)用在幾百 ? ? ? ? 萬情竹。
????② 參數(shù)法:
????????1. 定義:根據(jù)統(tǒng)計(jì)模塊來產(chǎn)生每時(shí)每刻的語音參數(shù)藐不,然后將參數(shù)轉(zhuǎn)化為波形,主要分三個(gè) ? ? ? ? 模塊:前端處理秦效,建模和聲碼器雏蛮。
????????????a) 這句話的語氣語調(diào),節(jié)奏阱州,韻律邊界挑秉,重音,情感
????????????b) 拼接法和參數(shù)法贡耽,都有前端處理衷模,區(qū)別在于后端聲學(xué)建模方法。
????????2. 優(yōu)點(diǎn):個(gè)性化的TTS大多是用參數(shù)法可節(jié)約時(shí)間成本
????????3. 缺點(diǎn):質(zhì)量比拼接法差一些蒲赂,因?yàn)槭苤朴诎l(fā)生算法阱冶,有損失。
ii. 評(píng)判標(biāo)準(zhǔn)(評(píng)判TTS系統(tǒng)的好壞)
????① 主觀測(cè)試:人為評(píng)測(cè)(人為來聽)
????② 客觀測(cè)試:系統(tǒng)評(píng)測(cè)(機(jī)器評(píng)測(cè))
iii. 瓶頸和機(jī)會(huì)
????① 數(shù)據(jù)匱乏(可用的語音數(shù)據(jù))
????② 人才匱乏:TTS人才相比于AI中的NLP和CV類人才太少
????③ 產(chǎn)品化難度高
????????1. 用戶預(yù)期場(chǎng)景較復(fù)雜
????????2. 技術(shù)現(xiàn)在還有較多難點(diǎn)
????????3. 細(xì)節(jié)設(shè)計(jì)還需較多斟酌
????④ 商業(yè)化壓力
????????1. 項(xiàng)目周期較長(這個(gè)需要長時(shí)間的數(shù)據(jù)和技術(shù)的積累與沉淀)
????????2. 細(xì)分場(chǎng)景上的切入目前還處于早期階段滥嘴,試錯(cuò)成本較高
d) 計(jì)算機(jī)視覺(CV)
????i. 發(fā)展階段(四個(gè)階段)
????① 馬爾計(jì)算視覺階段
????????1. 計(jì)算理論
????????2. 表達(dá)和算法
????????3. 算法實(shí)現(xiàn)
????② 主動(dòng)和目的視覺階段
????③ 多視幾何和分層三維重建階段
????????1. 多視幾何
????????2. 分層三維重建
????????3. 攝像機(jī)自標(biāo)定
????④ 基于學(xué)習(xí)的視覺階段
????????1. 流形學(xué)習(xí)
????????2. 深度學(xué)習(xí)
????ii. CV應(yīng)用的處理過程
?① 成像
?1. 定義:模擬相機(jī)原理(怎樣把照片的質(zhì)量進(jìn)行提升)
?2. 影響圖片因素
????a) 光照影響
? ? ? ? i. 從產(chǎn)品角度控制:可以通過提醒來改變用戶的使用場(chǎng)景木蹬;通過升級(jí)或變更硬件設(shè)施來 ? ? ? ? ? ? 提升產(chǎn)品的體驗(yàn)
? ? ? ? ii. 從算法角度控制:利用算法對(duì)圖片進(jìn)行處理來提升圖片的質(zhì)量
????b) 模糊
????????i. 運(yùn)動(dòng)模糊:人體、車輛若皱、攝像頭的移動(dòng)造成
????????ii. 對(duì)焦模糊:攝像頭的距離镊叁、質(zhì)量和天氣等因素造成
????????iii. 低分辨率差值模糊:小圖放大和攝像頭硬件等設(shè)備造成
????????iv. 混合模糊:多重模糊存在
????c) 噪聲、分辨率
② 早期視覺
1. 定義:圖片的處理加工過程
2. 圖像分割
3. 邊緣求取
4. 運(yùn)動(dòng)和深度估計(jì)
5. 圖像拼接
6. 目前問題
????a) 結(jié)果不精確
????b) 需要長時(shí)間的知識(shí)沉淀
③ 識(shí)別理解
1. 定義:把一張圖片對(duì)應(yīng)到一個(gè)文字走触、一張照片或標(biāo)簽
2. 標(biāo)簽
????a) 越精確對(duì)模型越有利晦譬,但數(shù)據(jù)就會(huì)越少
????b) 主觀因素影響
????c) 細(xì)分標(biāo)簽
3. 數(shù)據(jù)優(yōu)化
????iii. 研究內(nèi)容(此部分還未總結(jié)完,感興趣的可自己探尋)
① 空間視覺
② 物體視覺
????iv. 典型物體表達(dá)理論
① 馬爾的三維物體表達(dá)
② 基于二維的圖像物體表達(dá)
③ 逆生成模型表達(dá)
????v. 應(yīng)用發(fā)展趨勢(shì)
① 人臉識(shí)別
② 圖片搜索
③ 個(gè)性化廣告投放
④ 即時(shí)定位與地圖構(gòu)建
3.AI產(chǎn)品理解(此部分還未涉獵)
1) 人人都是產(chǎn)品經(jīng)理(AI時(shí)代應(yīng)該也不變)
2) 產(chǎn)品理解
a) NLP類
i. 對(duì)話機(jī)器人(圖靈的BabyQ互广、微軟小冰)
ii. 語音搜索(百度敛腌、谷歌)
iii. 智能語音輸入法(訊飛、搜狗)
iv. 智能音箱(喜馬拉雅和獵戶星空的小雅音響惫皱、亞馬遜的Echo)
b) CV類
i. 無人機(jī)(大疆)
ii. 醫(yī)療影像分析系統(tǒng)(依圖科技的胸部CT智能輔助診斷系統(tǒng))
iii. 無人駕駛(馭勢(shì)科技像樊、百度、谷歌)
iv. 安防
c) 機(jī)器學(xué)習(xí)類
五旅敷、產(chǎn)品人上車(都是自己平時(shí)涉獵)
1.思想上認(rèn)識(shí)到AI的重要性:認(rèn)識(shí)到AI時(shí)代確實(shí)是已經(jīng)來了生棍,主要開闊一下視野
1) 書籍
a) 奇點(diǎn)臨近
b) 未來簡史
c) 智能時(shí)代
d) 人工智能時(shí)代
e) 智能主義
f) 科學(xué)的極致——漫談人工智能
2) 視頻(影視)
a) 人工智能
b) I robot
c) 西部世界
d) 終結(jié)者
e) 黑客帝國
2.理論知識(shí)
1) 書籍
a) 機(jī)器學(xué)習(xí)(周志華)
b) 機(jī)器學(xué)習(xí)實(shí)戰(zhàn)
c) 數(shù)學(xué)之美
d) 統(tǒng)計(jì)學(xué)習(xí)方法
e) 人工智能—一種現(xiàn)代的方法
f) 計(jì)算機(jī)視覺——算法與應(yīng)用
2) 視頻
a) Ng的機(jī)器學(xué)習(xí) 課程(網(wǎng)易公開課)
b) 楊瀾的AI訪談節(jié)目
c) 北大的人工智能公開課(網(wǎng)易云課堂)
3) 網(wǎng)站
a) 知乎(所有AI的問答和知乎Live)
b) 簡書(所有AI文章)
c) 人人都是產(chǎn)品經(jīng)理(產(chǎn)品經(jīng)理學(xué)習(xí)的最佳社區(qū))
d) 36氪(AI行業(yè)研究報(bào)告和AI新聞)
e) CSDN(可以跟隨AI方面的博主學(xué)習(xí)系統(tǒng)的AI知識(shí))
f) AI論文下載網(wǎng)(有些是要花錢的,但對(duì)未來的投資來說都是些小錢)
i. 維普
ii. 萬方
iii. 中國知網(wǎng)
iv. 谷歌學(xué)術(shù)
4) 資訊
a) 36氪
b) 虎嗅
c) 極客公園
d) 商業(yè)周刊
e) 中關(guān)村在線
5) 微信公眾號(hào)
a) 飯團(tuán)AI產(chǎn)品經(jīng)理大本營(這個(gè)是業(yè)內(nèi)最早成立的AI PM社區(qū)媳谁,有很多AI PM的開拓者在這里分享干貨涂滴,不過要花點(diǎn)錢)
b) 集智俱樂部(科學(xué)的極致——漫談人工智能友酱,這本書是這個(gè)俱樂部出的)
c) 量子位
d) 專知(有很多AI的專業(yè)知識(shí)和大佬見解)
e) AI科技大本營
3.整理輸出:看完書或者視頻之后一定要輸出自己的內(nèi)容
1) 簡書(輸出自己所得所想)
2) 知乎(輸出自己所得所想)
3) CSDN(輸出自己所得所想)
4.研究行業(yè)
1) 政策
a) 國家AI規(guī)劃
b) 人才扶持政策
c) 創(chuàng)業(yè)資金扶持政策
2) 市場(chǎng)及融資
3) 城市對(duì)比(北上廣深杭成武)
a) 人才對(duì)比
b) 行業(yè)完整對(duì)比(產(chǎn)業(yè)鏈雛形)
c) 行業(yè)集中度及公司分布
d) AI氛圍對(duì)比
4) 細(xì)分行業(yè)切入
a) 醫(yī)療
b) 無人車
c) 安防
d) VR/AR
e) 機(jī)器人
f) 金融
5) 公司選擇
a) 芯片類:寒武紀(jì)、地平線氢妈、深鑒科技
b) NLP類:圖靈機(jī)器人粹污、艾特曼段多、思必馳首量、云知聲、科大訊飛
c) CV類:商湯科技进苍、曠視科技加缘、依圖科技、云從科技觉啊、碼隆科技拣宏、極視角科技
d) 機(jī)器人類:優(yōu)必選、圖靈機(jī)器人杠人、Rokid
e) 平臺(tái)類(巨頭):百度勋乾、阿里、騰訊嗡善、京東辑莫、小米
f) 應(yīng)用類:乂學(xué)教育、智齒科技罩引、出門問問
g) 駕駛類:馭勢(shì)科技各吨、圖森未來、奇點(diǎn)汽車
h) 細(xì)分類:匯醫(yī)慧影(醫(yī)療)袁铐、第四范式(金融)揭蜒、量化派(金融)、碳云智能(醫(yī)療)
6) 上車
a) 挑選公司
i. 查找AI創(chuàng)企的相關(guān)榜單并總結(jié)出公司的上榜次數(shù)
ii. IT桔子查找相關(guān)公司的公司狀況
iii. 上知乎和拉鉤查找相關(guān)公司的員工評(píng)論和介紹
iv. 上脈脈勾搭相關(guān)公司的在職人員了解公司詳情
v. 上公司官網(wǎng)體驗(yàn)公司產(chǎn)品并總結(jié)輸出
b) 研究相關(guān)公司
i. 公司定位及主要產(chǎn)品
ii. 創(chuàng)始人及團(tuán)隊(duì)
iii. 戰(zhàn)略融資情況
iv. 公司合作伙伴
v. 公司核心技術(shù)
c) 上車
i. 投簡歷
ii. 拿著研究報(bào)告上門找Hr談
iii. 拿著在知乎剔桨、簡書屉更、CSDN上的輸出內(nèi)容找人談
iv. 認(rèn)識(shí)行業(yè)內(nèi)的人,找人內(nèi)推(AI產(chǎn)品經(jīng)理大本營洒缀、產(chǎn)品社區(qū))
六瑰谜、自我思考
1.AI時(shí)代的交互方式
1) 交互更加自然簡便
2) 人用語音(手勢(shì))與機(jī)器交互,機(jī)器用圖像與人交互
3) 更容易攜帶(手表帝洪、眼鏡等其他硬件產(chǎn)品作為承載)
2.機(jī)器的存在方式
1) 工具
2) 寵物
3) 朋友
4) 陪伴的親人
5) 戀人
3.新的職位
1) 機(jī)器訓(xùn)練師
2) 機(jī)器人保險(xiǎn)/顧問
3) 無人車管理員
4) 機(jī)器人4S店
5) 機(jī)器人糾紛解決師
4.未來的消費(fèi)
1) 無人零售
2) 虛擬消費(fèi)
a) 虛擬游戲
b) 虛擬社交
c) 虛擬旅行