感想收獲 | 2017QCon全球軟件開發(fā)大會(上海)

總結(jié)

  • 平臺(數(shù)據(jù)/模型)是眾多公司通用的發(fā)展前后期必然需求
  • 應(yīng)對業(yè)務(wù)目標(biāo)/用戶流程的多種建模策略方式,在『線上電商』公司中是共通且模式化的隆判。不同的只是進展程度和技術(shù)細(xì)節(jié)犬庇。
  • 一些業(yè)務(wù)應(yīng)用方向和技術(shù)發(fā)展方向的思考。

分點收獲

1.模塊意識

需要有平臺/模塊系統(tǒng)意識侨嘀,目標(biāo)是為了減少重復(fù)低效人力投入臭挽。

詳解:通過參與多家公司關(guān)于數(shù)據(jù)挖掘/機器學(xué)習(xí)的主題分享演講,發(fā)現(xiàn)基本上每家公司都會有一個自己構(gòu)建的平臺(包括對接運營數(shù)據(jù)獲取平臺以及機器學(xué)習(xí)框架平臺)飒炎。大多數(shù)公司的歷史發(fā)展進程是從遇到重復(fù)問題框架多次發(fā)明輪子進而導(dǎo)致浪費人力埋哟,然后為了減少低效人力投入笆豁,進而抽取解決問題過程中可以自動系統(tǒng)化的部分郎汪,形成模塊。這里的模塊概念個人認(rèn)為非常重要闯狱,模塊可以理解為平臺的抽象煞赢。抽取重復(fù)低效部分讓系統(tǒng)去解決,其余的人力就可以投入到開拓性的任務(wù)中哄孤,進而產(chǎn)生更多的價值照筑。(比如:Paypal的SHIFU機器學(xué)習(xí)框架平臺)

借鑒/結(jié)論:數(shù)據(jù)分析平臺和機器學(xué)習(xí)平臺都是發(fā)展過程中至少現(xiàn)有階段的成熟經(jīng)驗。數(shù)據(jù)分析平臺用來支持運營的全套分析瘦陈,解放低效重復(fù)的數(shù)據(jù)類工作產(chǎn)生的低效人力投入凝危。而機器學(xué)習(xí)平臺的產(chǎn)生是由于大規(guī)模重復(fù)構(gòu)建模型的需求導(dǎo)致的必然結(jié)果。相比更重要的是中間階段:如何應(yīng)用數(shù)據(jù)產(chǎn)生業(yè)務(wù)價值晨逝。是連接數(shù)據(jù)分析平臺和機器學(xué)習(xí)平臺的橋梁蛾默。

2. 面對業(yè)務(wù)價值建模&用戶生命周期管理:

針對用戶建模和針對場景建模。

詳解:面對業(yè)務(wù)價值指的是捉貌,以改進業(yè)務(wù)為最終目標(biāo)的模型才是有效的模型支鸡。針對用戶生命周期冬念,針對每一個環(huán)節(jié)形成項目/指標(biāo)進行優(yōu)化。

借鑒/結(jié)論:在唯品會的策略中牧挣,其實可以抽象出來的通用并且比較顯然可以借鑒的策略有二急前。
其一,針對用戶建模瀑构。對于用戶的意愿進行預(yù)測裆针。具體的說,可能一種策略就是通過對用戶售前行為的預(yù)測寺晌,預(yù)測用戶對每種產(chǎn)品的意向程度据块,進行針對性的營銷和運營。
其二折剃,針對場景建模另假。可能的一種應(yīng)用策略是通過對用戶售后訂單資源的使用等情況怕犁,來預(yù)測推斷其是否有進一步的需求或者是是否會 產(chǎn)生流失的風(fēng)險边篮。




3. 一些可能的業(yè)務(wù)場景應(yīng)用方向的借鑒

攜程:構(gòu)建知識圖譜和用戶圖譜。

  1. 用來產(chǎn)生自助問答系統(tǒng)奏甫,解決信息查詢問題戈轿。
  2. 用來對用戶進行實時意向的分析和跟蹤推薦。
  3. 用作工單的智能分配阵子。


4.開發(fā)技術(shù)方向的思考

模型構(gòu)建工具的選擇

  1. 參考了幾家公司的模型構(gòu)建工具選擇思杯,普遍的一個共有選項是H2O,從實踐意義上證明H2O還是有一定優(yōu)勢的挠进。結(jié)合效果上說色乾,選擇H2O會更理想

    1. H2O優(yōu)點:訓(xùn)練效果好,可擴展领突,配置簡單可與hadoop結(jié)合

    2. 缺點:初始數(shù)據(jù)的導(dǎo)入比較慢暖璧,模型的調(diào)試需要豐富的經(jīng)驗

特征和模型選擇

  1. 參考Paypal的經(jīng)驗,在小數(shù)據(jù)量(1M)時君旦,采用簡單的LR和人工特征工程會比較合適澎办。在中等數(shù)據(jù)量(幾百萬)時,采用集成學(xué)習(xí)和自動特征抽取的方式比較合適金砍。在大數(shù)據(jù)量(數(shù)億)時局蚀,采用DNN會效果更好(這點在Andrew的深度學(xué)習(xí)課程上也進行過效果曲線的介紹)

羊毛出在豬身上,打標(biāo)簽的方式思考

  1. 背景:流利說借用戶的學(xué)習(xí)語音和學(xué)習(xí)視頻對中國人的英語視頻進行打標(biāo)簽恕稠,超低成本的獲取了海量的帶標(biāo)簽的訓(xùn)練數(shù)據(jù)琅绅。
  2. 借鑒意義:在用戶的屬性標(biāo)簽上,是否也能設(shè)置按鍵根據(jù)用戶的行為來自動為其打上標(biāo)簽谱俭,以減少人工(客服等方式)打標(biāo)簽的成本奉件。

5. 業(yè)務(wù)粘性的一點個人思考

google在2015年10月份開源了其深度學(xué)習(xí)流式框架Tensorflow宵蛀,緊隨其后,2016年年底左右百度也同樣開源了深度學(xué)習(xí)框架PaddlePaddle县貌。其他AT等相繼也開源了深度學(xué)習(xí)框架术陶。但開源的算法其實并不會直接帶來公司的競爭收益。而google的一個做法是開發(fā)了專門用于TF框架運行的TPU煤痕,其訓(xùn)練的效率是傳統(tǒng)GPU之上幾倍梧宫。雖然不確定TPU的出世背后的故事,但從效果來看摆碉,如果一家公司采用了TF框架塘匣,想要在訓(xùn)練和使用上更加有效率,則在云平臺的選擇上巷帝,集合了TPU的google cloud顯然會是更好的選擇忌卤。
免費的算法,收費的硬件楞泼,這樣的互聯(lián)網(wǎng)模式可能會在AI這個角度上增加云平臺對于用戶的粘性驰徊。類比來看,百度對于國內(nèi)其他公司一直有AI算法優(yōu)勢堕阔,但技術(shù)上的優(yōu)勢一直沒有體現(xiàn)到產(chǎn)品變現(xiàn)上棍厂。如果在能打開paddlepaddle的前提下效仿google軟硬件結(jié)合,在云平臺的用戶粘性上應(yīng)該會是很大的優(yōu)勢超陆。相應(yīng)的牺弹,AT等擁有云平臺企業(yè)的軟硬結(jié)合策略也會對平臺用戶粘性產(chǎn)生正面影響。

附件分享

  1. 攜程度假智能云客服平臺
  2. PayPal 風(fēng)險控制建模之路
  3. O2O 推薦廣告 CTR 預(yù)估實踐
  4. 唯品金融機器學(xué)習(xí)實踐
  5. 【海外】Tensorflow 與深度學(xué)習(xí)最新進展:GPU 性能優(yōu)化时呀、內(nèi)置圖編譯框架 Xla张漂、AutoML
  6. AI 將如何打造教育新常態(tài)
  7. 大規(guī)模機器學(xué)習(xí)平臺的架構(gòu)與實際應(yīng)用
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市退唠,隨后出現(xiàn)的幾起案子鹃锈,更是在濱河造成了極大的恐慌荤胁,老刑警劉巖瞧预,帶你破解...
    沈念sama閱讀 216,692評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異仅政,居然都是意外死亡垢油,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,482評論 3 392
  • 文/潘曉璐 我一進店門圆丹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來滩愁,“玉大人,你說我怎么就攤上這事辫封∠跬鳎” “怎么了廉丽?”我有些...
    開封第一講書人閱讀 162,995評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長妻味。 經(jīng)常有香客問我正压,道長,這世上最難降的妖魔是什么责球? 我笑而不...
    開封第一講書人閱讀 58,223評論 1 292
  • 正文 為了忘掉前任焦履,我火速辦了婚禮,結(jié)果婚禮上雏逾,老公的妹妹穿的比我還像新娘嘉裤。我一直安慰自己,他們只是感情好栖博,可當(dāng)我...
    茶點故事閱讀 67,245評論 6 388
  • 文/花漫 我一把揭開白布屑宠。 她就那樣靜靜地躺著,像睡著了一般仇让。 火紅的嫁衣襯著肌膚如雪侨把。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,208評論 1 299
  • 那天妹孙,我揣著相機與錄音秋柄,去河邊找鬼。 笑死蠢正,一個胖子當(dāng)著我的面吹牛骇笔,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播嚣崭,決...
    沈念sama閱讀 40,091評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼笨触,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了雹舀?” 一聲冷哼從身側(cè)響起芦劣,我...
    開封第一講書人閱讀 38,929評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎说榆,沒想到半個月后虚吟,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,346評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡签财,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,570評論 2 333
  • 正文 我和宋清朗相戀三年串慰,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片唱蒸。...
    茶點故事閱讀 39,739評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡邦鲫,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出神汹,到底是詐尸還是另有隱情庆捺,我是刑警寧澤古今,帶...
    沈念sama閱讀 35,437評論 5 344
  • 正文 年R本政府宣布,位于F島的核電站滔以,受9級特大地震影響沧卢,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜醉者,卻給世界環(huán)境...
    茶點故事閱讀 41,037評論 3 326
  • 文/蒙蒙 一但狭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧撬即,春花似錦立磁、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,677評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至粒竖,卻和暖如春颅崩,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蕊苗。 一陣腳步聲響...
    開封第一講書人閱讀 32,833評論 1 269
  • 我被黑心中介騙來泰國打工沿后, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人朽砰。 一個月前我還...
    沈念sama閱讀 47,760評論 2 369
  • 正文 我出身青樓尖滚,卻偏偏與公主長得像,于是被迫代替她去往敵國和親瞧柔。 傳聞我的和親對象是個殘疾皇子漆弄,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,647評論 2 354

推薦閱讀更多精彩內(nèi)容