最近接觸了飯團的“AI產(chǎn)品經(jīng)理大本營”這個社群俺猿,從中學習到很多AI方面的知識护盈,現(xiàn)在總結(jié)梳理一下自己學習到的知識以及接下來的一些規(guī)劃。
一万皿、學習路線與規(guī)劃
對于學習,在我的認知里核行,有兩個因素最為重要:一個是目的牢硅,做事前必須先明確目的,這樣才能找到方向芝雪,才有動力堅持下去减余;第二個是抓手,即你要圍繞什么來制定學習計劃惩系、獲取資源來進行系統(tǒng)性的學習位岔,只有把這兩個因素都確定下來如筛,才能達到最大效率的學習。
對于我而言抒抬,目標就是畢業(yè)后成功入職AI PM的崗位杨刨,因此首先要對AI PM進行基本的了解,主要的渠道如下:
? ? ? ? 一是AI公司的AI PM的崗位職責和任職要求擦剑;二是從知乎妖胀、簡書以及人人都是產(chǎn)品經(jīng)理等產(chǎn)品網(wǎng)站上搜集到的與AI PM相關(guān)的知識;三是最近接觸到的飯團“AI產(chǎn)品經(jīng)理大本營”的社群惠勒。
在通過在以上渠道閱讀了大量資料后赚抡,主要確定了三個學習鍛煉的方向:一是產(chǎn)品方面知識和能力的學習培養(yǎng),這是一個PM最基本的要求纠屋;二是AI應用場景的分析涂臣,在AI技術(shù)商業(yè)化落地的過程中,對應用場景的理解分析基本上決定了產(chǎn)品是否能滿足用戶的需求售担,因此對應用場景的分析很重要赁遗;三是對AI技術(shù)的了解,不同與互聯(lián)網(wǎng)的PM灼舍,AI PM需要對技術(shù)有一定的了解吼和,這樣才能從整體上把控產(chǎn)品的生產(chǎn)流程,交付出能滿足用戶需求的產(chǎn)品骑素。
在產(chǎn)品方面炫乓,已經(jīng)在上學期閱讀學習了大量的資料,因此在這里主要做個簡要總結(jié)献丑,主要有兩點末捣,一個是輸入,一個是輸出创橄。
在輸入方面箩做,搜集并學習了如下的資料:一個是產(chǎn)品經(jīng)理方面的課程;二是網(wǎng)上提到的一些產(chǎn)品經(jīng)理方面的書籍妥畏,例如啟示錄邦邦、神一樣的產(chǎn)品經(jīng)理、用戶體驗要素醉蚁、簡約至上燃辖、增長黑客等;三是人人都是產(chǎn)品經(jīng)理网棍、PMCAFF等產(chǎn)品網(wǎng)站和微信公眾號黔龟,從中了解最新的產(chǎn)品知識和前輩們的思考;四是收藏了一些知名大牛的博客、知乎氏身,如俞軍巍棱、張小龍、純銀蛋欣、白鴉航徙、蘇杰等,研究他們是如何思考產(chǎn)品的陷虎;五是學習了梁寧老師的產(chǎn)品思維三十講課程捉偏。
在輸出方面,一是加入職景的產(chǎn)品思維打卡社群泻红,每周進行產(chǎn)品思維的鍛煉,并多次選入留言精選霞掺;二是輸出一篇小紅書的產(chǎn)品分析報告谊路,從產(chǎn)品、市場菩彬、用戶缠劝、功能、運營等方面對產(chǎn)品進行了全面的分析骗灶;三是參加360 Hackaday創(chuàng)新產(chǎn)品大賽西北賽區(qū)的比賽惨恭,設計了定位于禮物分享社區(qū)的產(chǎn)品,完成了整個產(chǎn)品設計流程耙旦,現(xiàn)已進入復賽脱羡,由于還在參賽中,還未有最終結(jié)果免都。
以上是上學期產(chǎn)品方面的學習總結(jié)锉罐,而接下來,主要的學習計劃則是AI方面的知識和能力積累绕娘,找到的抓手是飯團“AI產(chǎn)品經(jīng)理大本營”黃釗團長提倡的自我背書的方式脓规,即通過“輸入-輸出-實施”三個階段的行動來實現(xiàn)自我能力的證明,進而成功入職AI PM险领。
1侨舆、輸入
主要進行三個方面的輸入,分別是技術(shù)通識绢陌、產(chǎn)品通識挨下、行業(yè)通識,知識來源渠道主要有以下幾個方面:
? ? ? ? 一是社群分享:飯團下面、Q群复颈、知乎、人人都是產(chǎn)品經(jīng)理等;?
? ? ? ? 二是自媒體:AI100耗啦、AI科技大本營凿菩、傅盛、hanniman帜讲、黑智衅谷、甲子光年、AI那點事似将、新智元获黔、集智俱樂部等;
? ? ? ? 三是近期要看的書:科學的極致在验、走進2050玷氏、終極算法、皇帝新腦等腋舌;
? ? ? ? 四是一些行業(yè)分析報告和搜集到各種會議的PPT盏触;
? ? ? ? 五是相關(guān)領(lǐng)域的一些知識,如認知科學块饺、神經(jīng)學赞辩、心理學、哲學宗教等授艰。
2辨嗽、輸出
在AI方面,主要輸出方向有三個淮腾,一是自己在AI PM的學習成長方面的計劃感悟糟需,二是針對CV或語音識別方面輸出一篇技術(shù)報告或應用場景分析,三是針對自動駕駛領(lǐng)域輸出一篇學習報告或應用場景的分析報告来破。
在產(chǎn)品方面篮灼,會總結(jié)自己之前學習到的產(chǎn)品知識,輸出自己的方法論徘禁。
3诅诱、實施
整體計劃表安排如下:
主要的學習內(nèi)容是飯團的“AI產(chǎn)品經(jīng)理大本營”中的歷史文章,其次會每周完成一本書的閱讀,然后每天吸收相關(guān)公眾號的知識,在每周末進行相關(guān)知識的整理輸出裸诽。
二查刻、AI技術(shù)通識
AI本質(zhì)是機器從我們喂養(yǎng)的數(shù)據(jù)中擬合出適合的函數(shù),當有新的數(shù)據(jù)需要預測的時候,通過這個函數(shù)去預測出新數(shù)據(jù)對應的結(jié)果。
主要模型其實就是最終擬合出的函數(shù)Y=f(X,W,b),f(·)就是擬合的函數(shù)大年,X是輸入變量,W是權(quán)重,b是偏差翔试,Y是輸出變量轻要。
對于數(shù)據(jù)集來說,一般分為訓練集垦缅、驗證集和測試集冲泥,會用訓練集來訓練算法模型,用驗證集對模型進行驗證和在開發(fā)過程中調(diào)參壁涎,最后用測試集測試模型是否會產(chǎn)生欠擬合和過擬合等問題凡恍,在沒有特別要求時,可以將驗證集和測試集合為一個數(shù)據(jù)集用于測試模型和調(diào)整參數(shù)怔球。
對于AI來說嚼酝,其主要框架分為基礎設施層、技術(shù)算法層竟坛、應用層革半,如下去所示:
2.1機器學習
2.1.1監(jiān)督學習
ⅰ)定義:從標記的數(shù)據(jù)中尋找規(guī)律流码,然后預測新數(shù)據(jù)
ⅱ)解決問題:回歸和分類
ⅲ)主要算法:
① K近鄰
② 樸素貝葉斯
③ 邏輯回歸
④ 決策樹
⑤ 隨機森林
⑥ 線性支持向量機
ⅳ)應用場景:
① 基于規(guī)則的信用評估
② 新聞分類
③ 郵件過濾
④ 手寫識別
⑤ 情感分析
⑥ 文字廣告過濾
2.1.2無監(jiān)督學習
ⅰ)定義:讓機器自己識別給定數(shù)據(jù)中的特征延刘,進而能夠識別新數(shù)據(jù)
ⅱ)解決問題:關(guān)聯(lián)漫试、聚類和降維
ⅲ)主要算法:
① k均值
② 自編碼
③ 主成分分析
ⅳ)應用場景:用戶聚類、新聞聚類等
2.1.3半監(jiān)督學習
⒌饫怠)定義:從部分標記的數(shù)據(jù)中尋找規(guī)律驾荣,然后預測新數(shù)據(jù)
ⅱ)解決問題:垃圾信息過濾和視頻網(wǎng)站分析
ⅲ)主要算法:
① 半監(jiān)督SVM(支持向量機)
② 高斯模型
③ KNN模型
④ Self-trainning
⑤ Co-trainning
ⅳ)優(yōu)點:
① 相比無監(jiān)督學習會有較高的精度
② 相比有監(jiān)督學習可以大幅降低人工標記成本
2.1.4強化學習
ⅰ)定義:根據(jù)輸入環(huán)境參數(shù)確定要執(zhí)行的動作普泡,通過與環(huán)境交互來優(yōu)化目標函數(shù)播掷。在訓練時,對于正確的動作做出獎勵撼班,對錯誤的動作做出懲罰歧匈,訓練完成之后就用得到的模型進行預測
ⅱ)解決問題
① 自動直升機
② 機器人控制
③ 手機網(wǎng)絡路由
④ 市場決策
⑤ 工業(yè)控制
⑥ 高效網(wǎng)頁索引
ⅲ)學習理論
①理論一:agent需要理解環(huán)境、分析環(huán)境砰嘁,并且要推測出完成一個動作得到獎勵的概率件炉。該理論完全滿足馬爾科夫決策
②理論二:agent不需要理解環(huán)境、分析環(huán)境時矮湘,做出決策斟冕,該決策正確時獎勵,錯誤時不獎勵或懲罰缅阳。agent不會在動作時去計算是否得到獎勵的概率
ⅳ)主要算法:
①K-搖臂賭博機(單步強化學習任務)
? ? ? ε-貪心算法
? ? ? Softmax算法
②有模型學習(多步強化學習任務)
? ? ? 基于T步累積獎賞的策略評估算法
? ? ? 基于T步累積獎賞的策略迭代算
③免模型學習
? ? ? 蒙特卡羅強化學習:同策略和異策略
? ? ? 時序查分學習:Q-學習算法和Sarsa算法
④ 模仿學習
2.1.5遷移學習
⒖纳摺)定義:把已經(jīng)學到訓練好的模型參數(shù)遷移到新的模型來幫助并加快新模型訓練數(shù)據(jù)集
ⅱ)解決問題
① 終身學習
② 知識轉(zhuǎn)移
③ 歸納遷移
④ 多任務學習
⑤ 知識的鞏固
⑥上下文相關(guān)學習
⑦ 元學習
⑧ 增量學習
ⅲ)主要方法
① 樣本遷移法
② 特征遷移法
③ 模型遷移法
④ 關(guān)系遷移法
2.1.6深度學習
ⅰ)定義:多層神經(jīng)網(wǎng)絡
ⅱ)解決問題
① 預測學習
② 語音識別
③ 圖像識別
ⅲ)主要算法:CNN、RNN秀撇、CNN
ⅳ)優(yōu)點
① 擁有更好的表達能力超棺,可以表達更復雜函數(shù)的能力
② 處理未標記數(shù)據(jù),能夠識別更復雜的特征
ⅴ)缺點
① 使用監(jiān)督學習方法訓練神經(jīng)網(wǎng)絡時捌袜,可能有局部極值的問題
② 當使用反向傳播方法計算導數(shù)的時候说搅,隨著網(wǎng)絡的深度的增加,出現(xiàn)梯度彌散問題
③ 要花大量的精力調(diào)整參數(shù)虏等,如果不知道調(diào)參方法就無法復現(xiàn)結(jié)果
④ 本身是一個黑箱弄唧,并不能知到網(wǎng)絡到底做了什么
2.2語音識別(ASR)
ⅰ)概念:
① 研究內(nèi)容:將聲音轉(zhuǎn)化為文字
② 原理:輸入—編碼(特征提然羯馈)—解碼—輸出
③ 識別方式:
? ? 傳統(tǒng)識別:一般采用隱馬爾可夫模型HMM
? ? 端到端識別:一般采用深度神經(jīng)網(wǎng)絡DNN
ⅱ)遠場識別
① 語音激活檢測VAD:判斷什么時候有語音什么時候沒有語音
② 語音喚醒:通過關(guān)鍵詞喚醒語音設備
? ? 主要要求:a)喚醒響應時間要短
? ? ? ? ? ? ? ? ? ? ? ? b)功耗要低
? ? ? ? ? ? ? ? ? ? ? ? c)喚醒詞候引,技術(shù)上要求,一般最少3個音節(jié)
? ? ? ? ? ? ? ? ? ? ? ? d)喚醒效果敦跌。喊它它不答應這叫做漏報澄干,沒喊它它回應叫做誤報
ⅲ)麥克風陣列
① 背景:在各種復雜環(huán)境下,會有噪音柠傍、混響麸俘、人聲干擾、回聲等各種問題惧笛,需要麥克風陣列處理雜聲
② 作用:
? ? ? a)語音增強
? ? ? b)聲源定位
? ? ? c)去混響
? ? d) 聲源信號的提取和分離
③ 分類:
? ? 按陣列形狀分:線性从媚、環(huán)形、球形麥克風
? ? 按麥克風個數(shù)分:單麥患整、雙麥拜效、多麥
ⅳ)全雙工
? ? ? ? 主要支持多輪對話和多人對話,可插話和打斷
ⅴ)糾錯
①? 定義:對識別出的文字偏差進行糾錯各谚,還有理解用戶主動糾錯后的意圖
② 方式:a)本地為主:優(yōu)先從本地查找相關(guān)數(shù)據(jù)
? ? ? ? ? ? ? ? b)本地+云端:優(yōu)先在本地的音樂庫中去找相似度較高的歌曲名稱紧憾,然后到云端曲庫去找,最后再合在一起(排序)昌渤。
? ? ? ? ? ? ? ? c)云端為主:數(shù)據(jù)量太大赴穗,直接到云端搜索可能更方便
ⅵ)語音打斷
① 定義:用戶可通過語音打斷設備
② 問題:在設備自己說話的時候識別用戶的語音會受到很大的干擾,如何從中分辨出用戶的語音信號進行識別也對算法有較高的要求
2.3語音合成(TTS)
蛳ⅰ)研究內(nèi)容:是將文字轉(zhuǎn)化為語音(朗讀出來)的過程
ⅱ)實現(xiàn)方法
a)拼接法
1.定義:從事先錄制的大量語音中望抽,選擇基本單位(音節(jié)、音素)拼接而成履婉,為了連貫性常采用雙音子(一個因素的中央倒下一個因素的中央)作為單位
2.優(yōu)點:語音質(zhì)量較高
3.缺點:數(shù)據(jù)庫較大煤篙,一般需幾十小時的成品語料,企業(yè)級商用的話需5萬句費用在幾百萬
b)參數(shù)法:
1. 定義:根據(jù)統(tǒng)計模塊來產(chǎn)生每時每刻的語音參數(shù)毁腿,然后將參數(shù)轉(zhuǎn)化為波形辑奈,主要分三個模塊:前端處理苛茂,建模和聲碼器
a) 常見數(shù)據(jù):這句話的語氣語調(diào),節(jié)奏鸠窗,韻律邊界妓羊,重音,情感
b) 拼接法和參數(shù)法稍计,都有前端處理躁绸,區(qū)別在于后端聲學建模方法
2. 優(yōu)點:個性化的TTS大多是用參數(shù)法可節(jié)約時間成本
3. 缺點:質(zhì)量比拼接法差一些,因為受制于發(fā)生算法臣嚣,有損失
ⅲ)評判標準(評判TTS系統(tǒng)的好壞)
主觀測試:人為評測(人為來聽)
客觀測試:系統(tǒng)評測(機器評測)
ⅳ)瓶頸和機會
① 數(shù)據(jù)匱乏(可用的語音數(shù)據(jù))
② 人才匱乏:TTS人才相比于AI中的NLP和CV類人才太少
③ 產(chǎn)品化難度高
? ? ? ? 用戶預期場景較復雜
? ? ? ? 技術(shù)現(xiàn)在還有較多難點
? ? ? ? 細節(jié)設計還需較多斟酌
④ 商業(yè)化壓力
? ? ? ? 項目周期較長(這個需要長時間的數(shù)據(jù)和技術(shù)的積累與沉淀)
? ? ? ? 細分場景上的切入目前還處于早期階段净刮,試錯成本較高
2.4計算機視覺(CV)
ⅰ)定義:使用計算機以及相關(guān)設備對生物視覺的一種模擬
ⅱ)主要任務:通過對采集的圖片或視頻進行處理以獲得相應場景的三維信息硅则,讓計算機具有對周圍世界的空間物體進行傳感淹父、抽象、判斷的能力
ⅲ)研究內(nèi)容:圖像的恢復怎虫、圖像預處理暑认、根據(jù)特征信息進行基元的分割和關(guān)系的確定、模型匹配識別基元或代表實體得出結(jié)論
ⅳ)應用場景:
① 人臉識別
② 多目標追蹤
③ 光學符號識別
ⅴ)CV應用的處理過程
① 成像
1. 定義:模擬相機原理(提升照片的質(zhì)量)
2. 影響圖片因素
a)光照影響? ?
i. 從產(chǎn)品角度控制:可以通過提醒來改變用戶的使用場景大审;通過升級或變更硬件設施來提升產(chǎn)品的體驗
ii.從算法角度控制:利用算法對圖片進行處理來提升圖片的質(zhì)量
b) 模糊
i. 運動模糊:人體蘸际、車輛、攝像頭的移動造成
ii. 對焦模糊:攝像頭的距離徒扶、質(zhì)量和天氣等因素造成
iii. 低分辨率差值模糊:小圖放大和攝像頭硬件等設備造成
iv. 混合模糊:多重模糊存在
c) 噪聲捡鱼、分辨率
② 早期視覺
1. 定義:圖片的處理加工過程
2.主要技術(shù)
? ? 圖像分割
? ? 邊緣求取
? ? 運動和深度估計
? ? 圖像拼接
3. 目前問題
a) 結(jié)果不精確
b) 需要長時間的知識沉淀
③ 識別理解
1. 定義:把一張圖片對應到一個文字、一張照片或標簽
2. 標簽
a) 越精確對模型越有利酷愧,但數(shù)據(jù)就會越少
b) 主觀因素影響
c) 細分標簽
2.5自然語言理解(NLP)
ⅰ)定義:讓計算機理解缠诅、分析以及生成人類語言溶浴,是理解和處理文字的過程
ⅱ)過程
① NLU(自然語言理解)
② NLG(自然語言生成)
ⅲ)應用領(lǐng)域:
① 句法語義分析
② 信息抽取
③ 文本挖掘
④ 機器翻譯
⑤ 信息檢索
⑥問答系統(tǒng)、
⑦ 對話系統(tǒng)
ⅳ)難點:
① 語言歧義性管引,如去拉薩士败,不知道要干啥,是做火車還是飛機褥伴?
② 語言魯棒性谅将,如錯字、少字重慢、別稱饥臂、不連貫、噪音的識別
③ 知識依賴似踱,如七天隅熙,酒店名
④ 個性化語境稽煤,上下文、用戶畫像囚戚、多輪對話
ⅴ)解決方法
① 規(guī)則方法
② 統(tǒng)計方法
③ 深度學習
以上是對最近在飯團“AI產(chǎn)品經(jīng)理大本營”學習到的酵熙、關(guān)于AI技術(shù)的通識的學習和總結(jié)。