我的AI PM 成長之路

最近接觸了飯團的“AI產(chǎn)品經(jīng)理大本營”這個社群俺猿,從中學習到很多AI方面的知識护盈,現(xiàn)在總結(jié)梳理一下自己學習到的知識以及接下來的一些規(guī)劃。

一万皿、學習路線與規(guī)劃

對于學習,在我的認知里核行,有兩個因素最為重要:一個是目的牢硅,做事前必須先明確目的,這樣才能找到方向芝雪,才有動力堅持下去减余;第二個是抓手,即你要圍繞什么來制定學習計劃惩系、獲取資源來進行系統(tǒng)性的學習位岔,只有把這兩個因素都確定下來如筛,才能達到最大效率的學習。

對于我而言抒抬,目標就是畢業(yè)后成功入職AI PM的崗位杨刨,因此首先要對AI PM進行基本的了解,主要的渠道如下:

? ? ? ? 一是AI公司的AI PM的崗位職責和任職要求擦剑;二是從知乎妖胀、簡書以及人人都是產(chǎn)品經(jīng)理等產(chǎn)品網(wǎng)站上搜集到的與AI PM相關(guān)的知識;三是最近接觸到的飯團“AI產(chǎn)品經(jīng)理大本營”的社群惠勒。

在通過在以上渠道閱讀了大量資料后赚抡,主要確定了三個學習鍛煉的方向:一是產(chǎn)品方面知識和能力的學習培養(yǎng),這是一個PM最基本的要求纠屋;二是AI應用場景的分析涂臣,在AI技術(shù)商業(yè)化落地的過程中,對應用場景的理解分析基本上決定了產(chǎn)品是否能滿足用戶的需求售担,因此對應用場景的分析很重要赁遗;三是對AI技術(shù)的了解,不同與互聯(lián)網(wǎng)的PM灼舍,AI PM需要對技術(shù)有一定的了解吼和,這樣才能從整體上把控產(chǎn)品的生產(chǎn)流程,交付出能滿足用戶需求的產(chǎn)品骑素。

在產(chǎn)品方面炫乓,已經(jīng)在上學期閱讀學習了大量的資料,因此在這里主要做個簡要總結(jié)献丑,主要有兩點末捣,一個是輸入,一個是輸出创橄。

在輸入方面箩做,搜集并學習了如下的資料:一個是產(chǎn)品經(jīng)理方面的課程;二是網(wǎng)上提到的一些產(chǎn)品經(jīng)理方面的書籍妥畏,例如啟示錄邦邦、神一樣的產(chǎn)品經(jīng)理、用戶體驗要素醉蚁、簡約至上燃辖、增長黑客等;三是人人都是產(chǎn)品經(jīng)理网棍、PMCAFF等產(chǎn)品網(wǎng)站和微信公眾號黔龟,從中了解最新的產(chǎn)品知識和前輩們的思考;四是收藏了一些知名大牛的博客、知乎氏身,如俞軍巍棱、張小龍、純銀蛋欣、白鴉航徙、蘇杰等,研究他們是如何思考產(chǎn)品的陷虎;五是學習了梁寧老師的產(chǎn)品思維三十講課程捉偏。

在輸出方面,一是加入職景的產(chǎn)品思維打卡社群泻红,每周進行產(chǎn)品思維的鍛煉,并多次選入留言精選霞掺;二是輸出一篇小紅書的產(chǎn)品分析報告谊路,從產(chǎn)品、市場菩彬、用戶缠劝、功能、運營等方面對產(chǎn)品進行了全面的分析骗灶;三是參加360 Hackaday創(chuàng)新產(chǎn)品大賽西北賽區(qū)的比賽惨恭,設計了定位于禮物分享社區(qū)的產(chǎn)品,完成了整個產(chǎn)品設計流程耙旦,現(xiàn)已進入復賽脱羡,由于還在參賽中,還未有最終結(jié)果免都。

以上是上學期產(chǎn)品方面的學習總結(jié)锉罐,而接下來,主要的學習計劃則是AI方面的知識和能力積累绕娘,找到的抓手是飯團“AI產(chǎn)品經(jīng)理大本營”黃釗團長提倡的自我背書的方式脓规,即通過“輸入-輸出-實施”三個階段的行動來實現(xiàn)自我能力的證明,進而成功入職AI PM险领。

1侨舆、輸入

主要進行三個方面的輸入,分別是技術(shù)通識绢陌、產(chǎn)品通識挨下、行業(yè)通識,知識來源渠道主要有以下幾個方面:

? ? ? ? 一是社群分享:飯團下面、Q群复颈、知乎、人人都是產(chǎn)品經(jīng)理等;?

? ? ? ? 二是自媒體:AI100耗啦、AI科技大本營凿菩、傅盛、hanniman帜讲、黑智衅谷、甲子光年、AI那點事似将、新智元获黔、集智俱樂部等;

? ? ? ? 三是近期要看的書:科學的極致在验、走進2050玷氏、終極算法、皇帝新腦等腋舌;

? ? ? ? 四是一些行業(yè)分析報告和搜集到各種會議的PPT盏触;

? ? ? ? 五是相關(guān)領(lǐng)域的一些知識,如認知科學块饺、神經(jīng)學赞辩、心理學、哲學宗教等授艰。

2辨嗽、輸出

在AI方面,主要輸出方向有三個淮腾,一是自己在AI PM的學習成長方面的計劃感悟糟需,二是針對CV或語音識別方面輸出一篇技術(shù)報告或應用場景分析,三是針對自動駕駛領(lǐng)域輸出一篇學習報告或應用場景的分析報告来破。

在產(chǎn)品方面篮灼,會總結(jié)自己之前學習到的產(chǎn)品知識,輸出自己的方法論徘禁。

3诅诱、實施

整體計劃表安排如下:

主要的學習內(nèi)容是飯團的“AI產(chǎn)品經(jīng)理大本營”中的歷史文章,其次會每周完成一本書的閱讀,然后每天吸收相關(guān)公眾號的知識,在每周末進行相關(guān)知識的整理輸出裸诽。

二查刻、AI技術(shù)通識

AI本質(zhì)是機器從我們喂養(yǎng)的數(shù)據(jù)中擬合出適合的函數(shù),當有新的數(shù)據(jù)需要預測的時候,通過這個函數(shù)去預測出新數(shù)據(jù)對應的結(jié)果。

主要模型其實就是最終擬合出的函數(shù)Y=f(X,W,b),f(·)就是擬合的函數(shù)大年,X是輸入變量,W是權(quán)重,b是偏差翔试,Y是輸出變量轻要。

對于數(shù)據(jù)集來說,一般分為訓練集垦缅、驗證集和測試集冲泥,會用訓練集來訓練算法模型,用驗證集對模型進行驗證和在開發(fā)過程中調(diào)參壁涎,最后用測試集測試模型是否會產(chǎn)生欠擬合和過擬合等問題凡恍,在沒有特別要求時,可以將驗證集和測試集合為一個數(shù)據(jù)集用于測試模型和調(diào)整參數(shù)怔球。

對于AI來說嚼酝,其主要框架分為基礎設施層、技術(shù)算法層竟坛、應用層革半,如下去所示:

2.1機器學習

2.1.1監(jiān)督學習

ⅰ)定義:從標記的數(shù)據(jù)中尋找規(guī)律流码,然后預測新數(shù)據(jù)

ⅱ)解決問題:回歸和分類

ⅲ)主要算法:

① K近鄰

② 樸素貝葉斯

③ 邏輯回歸

④ 決策樹

⑤ 隨機森林

⑥ 線性支持向量機

ⅳ)應用場景:

① 基于規(guī)則的信用評估

② 新聞分類

③ 郵件過濾

④ 手寫識別

⑤ 情感分析

⑥ 文字廣告過濾

2.1.2無監(jiān)督學習

ⅰ)定義:讓機器自己識別給定數(shù)據(jù)中的特征延刘,進而能夠識別新數(shù)據(jù)

ⅱ)解決問題:關(guān)聯(lián)漫试、聚類和降維

ⅲ)主要算法:

① k均值

② 自編碼

③ 主成分分析

ⅳ)應用場景:用戶聚類、新聞聚類等

2.1.3半監(jiān)督學習

⒌饫怠)定義:從部分標記的數(shù)據(jù)中尋找規(guī)律驾荣,然后預測新數(shù)據(jù)

ⅱ)解決問題:垃圾信息過濾和視頻網(wǎng)站分析

ⅲ)主要算法:

① 半監(jiān)督SVM(支持向量機)

② 高斯模型

③ KNN模型

④ Self-trainning

⑤ Co-trainning

ⅳ)優(yōu)點:

① 相比無監(jiān)督學習會有較高的精度

② 相比有監(jiān)督學習可以大幅降低人工標記成本

2.1.4強化學習

ⅰ)定義:根據(jù)輸入環(huán)境參數(shù)確定要執(zhí)行的動作普泡,通過與環(huán)境交互來優(yōu)化目標函數(shù)播掷。在訓練時,對于正確的動作做出獎勵撼班,對錯誤的動作做出懲罰歧匈,訓練完成之后就用得到的模型進行預測

ⅱ)解決問題

① 自動直升機

② 機器人控制

③ 手機網(wǎng)絡路由

④ 市場決策

⑤ 工業(yè)控制

⑥ 高效網(wǎng)頁索引

ⅲ)學習理論

①理論一:agent需要理解環(huán)境、分析環(huán)境砰嘁,并且要推測出完成一個動作得到獎勵的概率件炉。該理論完全滿足馬爾科夫決策

②理論二:agent不需要理解環(huán)境、分析環(huán)境時矮湘,做出決策斟冕,該決策正確時獎勵,錯誤時不獎勵或懲罰缅阳。agent不會在動作時去計算是否得到獎勵的概率

ⅳ)主要算法:

①K-搖臂賭博機(單步強化學習任務)

? ? ? ε-貪心算法

? ? ? Softmax算法

②有模型學習(多步強化學習任務)

? ? ? 基于T步累積獎賞的策略評估算法

? ? ? 基于T步累積獎賞的策略迭代算

③免模型學習

? ? ? 蒙特卡羅強化學習:同策略和異策略

? ? ? 時序查分學習:Q-學習算法和Sarsa算法

④ 模仿學習

2.1.5遷移學習

⒖纳摺)定義:把已經(jīng)學到訓練好的模型參數(shù)遷移到新的模型來幫助并加快新模型訓練數(shù)據(jù)集

ⅱ)解決問題

① 終身學習

② 知識轉(zhuǎn)移

③ 歸納遷移

④ 多任務學習

⑤ 知識的鞏固

⑥上下文相關(guān)學習

⑦ 元學習

⑧ 增量學習

ⅲ)主要方法

① 樣本遷移法

② 特征遷移法

③ 模型遷移法

④ 關(guān)系遷移法

2.1.6深度學習

ⅰ)定義:多層神經(jīng)網(wǎng)絡

ⅱ)解決問題

① 預測學習

② 語音識別

③ 圖像識別

ⅲ)主要算法:CNN、RNN秀撇、CNN

ⅳ)優(yōu)點

① 擁有更好的表達能力超棺,可以表達更復雜函數(shù)的能力

② 處理未標記數(shù)據(jù),能夠識別更復雜的特征

ⅴ)缺點

① 使用監(jiān)督學習方法訓練神經(jīng)網(wǎng)絡時捌袜,可能有局部極值的問題

② 當使用反向傳播方法計算導數(shù)的時候说搅,隨著網(wǎng)絡的深度的增加,出現(xiàn)梯度彌散問題

③ 要花大量的精力調(diào)整參數(shù)虏等,如果不知道調(diào)參方法就無法復現(xiàn)結(jié)果

④ 本身是一個黑箱弄唧,并不能知到網(wǎng)絡到底做了什么

2.2語音識別(ASR)

ⅰ)概念:

① 研究內(nèi)容:將聲音轉(zhuǎn)化為文字

② 原理:輸入—編碼(特征提然羯馈)—解碼—輸出

③ 識別方式:

? ? 傳統(tǒng)識別:一般采用隱馬爾可夫模型HMM

? ? 端到端識別:一般采用深度神經(jīng)網(wǎng)絡DNN

ⅱ)遠場識別

① 語音激活檢測VAD:判斷什么時候有語音什么時候沒有語音

② 語音喚醒:通過關(guān)鍵詞喚醒語音設備

? ? 主要要求:a)喚醒響應時間要短

? ? ? ? ? ? ? ? ? ? ? ? b)功耗要低

? ? ? ? ? ? ? ? ? ? ? ? c)喚醒詞候引,技術(shù)上要求,一般最少3個音節(jié)

? ? ? ? ? ? ? ? ? ? ? ? d)喚醒效果敦跌。喊它它不答應這叫做漏報澄干,沒喊它它回應叫做誤報

ⅲ)麥克風陣列

① 背景:在各種復雜環(huán)境下,會有噪音柠傍、混響麸俘、人聲干擾、回聲等各種問題惧笛,需要麥克風陣列處理雜聲

② 作用:

? ? ? a)語音增強

? ? ? b)聲源定位

? ? ? c)去混響

? ? d) 聲源信號的提取和分離

③ 分類:

? ? 按陣列形狀分:線性从媚、環(huán)形、球形麥克風

? ? 按麥克風個數(shù)分:單麥患整、雙麥拜效、多麥

ⅳ)全雙工

? ? ? ? 主要支持多輪對話和多人對話,可插話和打斷

ⅴ)糾錯

①? 定義:對識別出的文字偏差進行糾錯各谚,還有理解用戶主動糾錯后的意圖

② 方式:a)本地為主:優(yōu)先從本地查找相關(guān)數(shù)據(jù)

? ? ? ? ? ? ? ? b)本地+云端:優(yōu)先在本地的音樂庫中去找相似度較高的歌曲名稱紧憾,然后到云端曲庫去找,最后再合在一起(排序)昌渤。

? ? ? ? ? ? ? ? c)云端為主:數(shù)據(jù)量太大赴穗,直接到云端搜索可能更方便

ⅵ)語音打斷

① 定義:用戶可通過語音打斷設備

② 問題:在設備自己說話的時候識別用戶的語音會受到很大的干擾,如何從中分辨出用戶的語音信號進行識別也對算法有較高的要求

2.3語音合成(TTS)

蛳ⅰ)研究內(nèi)容:是將文字轉(zhuǎn)化為語音(朗讀出來)的過程

ⅱ)實現(xiàn)方法

a)拼接法

1.定義:從事先錄制的大量語音中望抽,選擇基本單位(音節(jié)、音素)拼接而成履婉,為了連貫性常采用雙音子(一個因素的中央倒下一個因素的中央)作為單位

2.優(yōu)點:語音質(zhì)量較高

3.缺點:數(shù)據(jù)庫較大煤篙,一般需幾十小時的成品語料,企業(yè)級商用的話需5萬句費用在幾百萬

b)參數(shù)法:

1. 定義:根據(jù)統(tǒng)計模塊來產(chǎn)生每時每刻的語音參數(shù)毁腿,然后將參數(shù)轉(zhuǎn)化為波形辑奈,主要分三個模塊:前端處理苛茂,建模和聲碼器

a) 常見數(shù)據(jù):這句話的語氣語調(diào),節(jié)奏鸠窗,韻律邊界妓羊,重音,情感

b) 拼接法和參數(shù)法稍计,都有前端處理躁绸,區(qū)別在于后端聲學建模方法

2. 優(yōu)點:個性化的TTS大多是用參數(shù)法可節(jié)約時間成本

3. 缺點:質(zhì)量比拼接法差一些,因為受制于發(fā)生算法臣嚣,有損失

ⅲ)評判標準(評判TTS系統(tǒng)的好壞)

主觀測試:人為評測(人為來聽)

客觀測試:系統(tǒng)評測(機器評測)

ⅳ)瓶頸和機會

① 數(shù)據(jù)匱乏(可用的語音數(shù)據(jù))

② 人才匱乏:TTS人才相比于AI中的NLP和CV類人才太少

③ 產(chǎn)品化難度高

? ? ? ? 用戶預期場景較復雜

? ? ? ? 技術(shù)現(xiàn)在還有較多難點

? ? ? ? 細節(jié)設計還需較多斟酌

④ 商業(yè)化壓力

? ? ? ? 項目周期較長(這個需要長時間的數(shù)據(jù)和技術(shù)的積累與沉淀)

? ? ? ? 細分場景上的切入目前還處于早期階段净刮,試錯成本較高

2.4計算機視覺(CV)

ⅰ)定義:使用計算機以及相關(guān)設備對生物視覺的一種模擬

ⅱ)主要任務:通過對采集的圖片或視頻進行處理以獲得相應場景的三維信息硅则,讓計算機具有對周圍世界的空間物體進行傳感淹父、抽象、判斷的能力

ⅲ)研究內(nèi)容:圖像的恢復怎虫、圖像預處理暑认、根據(jù)特征信息進行基元的分割和關(guān)系的確定、模型匹配識別基元或代表實體得出結(jié)論

ⅳ)應用場景:

① 人臉識別

② 多目標追蹤

③ 光學符號識別

ⅴ)CV應用的處理過程

① 成像

1. 定義:模擬相機原理(提升照片的質(zhì)量)

2. 影響圖片因素

a)光照影響? ?

i. 從產(chǎn)品角度控制:可以通過提醒來改變用戶的使用場景大审;通過升級或變更硬件設施來提升產(chǎn)品的體驗

ii.從算法角度控制:利用算法對圖片進行處理來提升圖片的質(zhì)量

b) 模糊

i. 運動模糊:人體蘸际、車輛、攝像頭的移動造成

ii. 對焦模糊:攝像頭的距離徒扶、質(zhì)量和天氣等因素造成

iii. 低分辨率差值模糊:小圖放大和攝像頭硬件等設備造成

iv. 混合模糊:多重模糊存在

c) 噪聲捡鱼、分辨率

② 早期視覺

1. 定義:圖片的處理加工過程

2.主要技術(shù)

? ? 圖像分割

? ? 邊緣求取

? ? 運動和深度估計

? ? 圖像拼接

3. 目前問題

a) 結(jié)果不精確

b) 需要長時間的知識沉淀

③ 識別理解

1. 定義:把一張圖片對應到一個文字、一張照片或標簽

2. 標簽

a) 越精確對模型越有利酷愧,但數(shù)據(jù)就會越少

b) 主觀因素影響

c) 細分標簽

2.5自然語言理解(NLP)

ⅰ)定義:讓計算機理解缠诅、分析以及生成人類語言溶浴,是理解和處理文字的過程

ⅱ)過程

① NLU(自然語言理解)

② NLG(自然語言生成)

ⅲ)應用領(lǐng)域:

① 句法語義分析

② 信息抽取

③ 文本挖掘

④ 機器翻譯

⑤ 信息檢索

⑥問答系統(tǒng)、

⑦ 對話系統(tǒng)

ⅳ)難點:

① 語言歧義性管引,如去拉薩士败,不知道要干啥,是做火車還是飛機褥伴?

② 語言魯棒性谅将,如錯字、少字重慢、別稱饥臂、不連貫、噪音的識別

③ 知識依賴似踱,如七天隅熙,酒店名

④ 個性化語境稽煤,上下文、用戶畫像囚戚、多輪對話

ⅴ)解決方法

① 規(guī)則方法

② 統(tǒng)計方法

③ 深度學習

以上是對最近在飯團“AI產(chǎn)品經(jīng)理大本營”學習到的酵熙、關(guān)于AI技術(shù)的通識的學習和總結(jié)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末驰坊,一起剝皮案震驚了整個濱河市匾二,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌拳芙,老刑警劉巖察藐,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異态鳖,居然都是意外死亡转培,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進店門浆竭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來浸须,“玉大人,你說我怎么就攤上這事邦泄∩局希” “怎么了?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵顺囊,是天一觀的道長肌索。 經(jīng)常有香客問我,道長特碳,這世上最難降的妖魔是什么诚亚? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮午乓,結(jié)果婚禮上站宗,老公的妹妹穿的比我還像新娘。我一直安慰自己益愈,他們只是感情好梢灭,可當我...
    茶點故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蒸其,像睡著了一般敏释。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上摸袁,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天钥顽,我揣著相機與錄音,去河邊找鬼靠汁。 笑死耳鸯,一個胖子當著我的面吹牛湿蛔,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播县爬,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼阳啥,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了财喳?” 一聲冷哼從身側(cè)響起察迟,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎耳高,沒想到半個月后扎瓶,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡泌枪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年概荷,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片碌燕。...
    茶點故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡误证,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出修壕,到底是詐尸還是另有隱情愈捅,我是刑警寧澤,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布慈鸠,位于F島的核電站蓝谨,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏青团。R本人自食惡果不足惜譬巫,卻給世界環(huán)境...
    茶點故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望督笆。 院中可真熱鬧芦昔,春花似錦、人聲如沸胖腾。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽咸作。三九已至,卻和暖如春宵睦,著一層夾襖步出監(jiān)牢的瞬間记罚,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工壳嚎, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留桐智,地道東北人末早。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像说庭,于是被迫代替她去往敵國和親然磷。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,440評論 2 359

推薦閱讀更多精彩內(nèi)容