data scientist是個(gè)啥--配合datacamp上的課(沒(méi)有一個(gè)編程題)

屏幕快照 2019-06-30 01.12.08.png

比起直接問(wèn)顧客對(duì)你的新產(chǎn)品感興趣嗎。應(yīng)該問(wèn) 和老產(chǎn)品比起來(lái)怎么樣次泽,或者問(wèn) 和競(jìng)爭(zhēng)對(duì)手的同質(zhì)產(chǎn)品比起來(lái)竿秆,新產(chǎn)品怎么樣传趾。

tabular - relational

屏幕快照 2019-06-30 11.42.45.png

這三個(gè)再加一個(gè)stacked bar chart

用什么做一個(gè)dashboard?


be consistent across an organization

cluster就是server

data analytics + machine learning + deep learning 是三個(gè)東西

data science workflow: data collection comes first, --> exploration and visualization, then experimentation and prediction(包括分類和預(yù)測(cè),a linear regression to estimate也是的负蚊。

OKR stands for Objective/Key Result 目標(biāo)和結(jié)果

Add Transparency to Company KPIs:
不是說(shuō)增加透明度神妹,要理解為增加信息的一目了然颓哮〖易保可以做newsletter和dashboard

Persona和Profile
可以有好幾個(gè)persona/ profile(用戶角色、用戶畫(huà)像)冕茅,賣汽車的比如主婦的需求可以和白領(lǐng)類似伤极,那么他們算一個(gè)persona
1 .用戶角色不是用戶細(xì)分
我們關(guān)注的是用戶如何看待、使用產(chǎn)品姨伤,如何與產(chǎn)品互動(dòng)哨坪,這是一個(gè)相對(duì)連續(xù)的過(guò)程,人口屬性特征并不是影響用戶行為的主要因素乍楚。根據(jù)使用当编、需求來(lái)聚類劃分。
可以探索的方向有:動(dòng)機(jī)徒溪、能力(被阻礙的點(diǎn))忿偷、環(huán)境、來(lái)自他人的影響臊泌、persona之間的關(guān)系(四象限圖鲤桥, 又稱矩陣圖)
2.用戶角色不是平均用戶
3.用戶角色不是真實(shí)用戶**

regular job: A/B test, dashboard
偷時(shí)間的job: ad-hoc requests (一次性的,某個(gè)時(shí)間節(jié)點(diǎn)的渠概,不用更新的)

A/B test

The less sensitive our tests,(Minimum Detectable Effect越胁璧省) the smaller the sample size we need.
the baseline conversion increases(和原來(lái)比,提升效果更明顯), it becomes easier to reach significance

(ml就是用來(lái)做預(yù)測(cè)的) machine learning is a set of method for making predictions on existing data (with labels and features)

有監(jiān)督的學(xué)習(xí)就是有l(wèi)abels & features:
case study: subscribe or churn(訂了又退訂)(結(jié)果就是labels)

  1. training data
  2. find features (影響因素)
  3. 得到一個(gè)model 先用test data測(cè)試
  4. 然后做prediction播揪。 如果這個(gè)人不會(huì)churn贮喧,那可以把它計(jì)入下個(gè)月的revenue;如果他要churn猪狈,就reach out and offer a special promotion

無(wú)監(jiān)督的學(xué)習(xí):例子clustering (聚類)
無(wú)監(jiān)督學(xué)習(xí)use data only with features 比如customer category

  1. select features define # of clusters
  2. use clusters to solve business problems (在聯(lián)系前面有監(jiān)督的學(xué)習(xí)塞淹,對(duì)不同的clusters可以分別做預(yù)測(cè)~)

Special topics in ML

  1. time series forecasting (把時(shí)間看做一個(gè)feature,有監(jiān)督的學(xué)習(xí))
    商業(yè)問(wèn)題像 seasonality 就是時(shí)間序列預(yù)測(cè)的一個(gè)應(yīng)用
    Topic 2: NLP 自然語(yǔ)言處理 (根據(jù)具體問(wèn)題罪裹,從text提取信息饱普,去創(chuàng)造features)

data-intensive的事情machine learning做不了,要用deep learning做(涉及到神經(jīng)元)状共。一般應(yīng)用于{{ language learning(比如從會(huì)議紀(jì)要中自動(dòng)總結(jié)概要) 和 image classification }}
Anything involving a physical device is probably an IoT problem 物聯(lián)網(wǎng)

Deep Learning and Explainable AI:
Deep Learning 又叫做 神經(jīng)網(wǎng)絡(luò),

  1. It requires much much more data than traditional ML.

  2. Best used in less structured input 比如文本和圖像

  3. can give high accurate predictions (predictive)套耕。但人們不知道,為什么做出這個(gè)假設(shè)來(lái)峡继。(DL 缺乏解釋力度冯袍,用來(lái)講清楚what)
    網(wǎng)路說(shuō)的 Deep learning能做一切數(shù)據(jù)挖掘有關(guān)的事情

    Explainable AI 可以講清楚影響因素,講清楚why leads to such results。傳統(tǒng)ML 也可以解釋為啥康愤。AI 讓計(jì)算機(jī)自己動(dòng)手儡循,ML 訓(xùn)練計(jì)算機(jī)動(dòng)手。
    又有人說(shuō) DL is part of ML is part of AI

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末征冷,一起剝皮案震驚了整個(gè)濱河市择膝,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌检激,老刑警劉巖肴捉,帶你破解...
    沈念sama閱讀 212,599評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異叔收,居然都是意外死亡齿穗,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,629評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)饺律,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)窃页,“玉大人,你說(shuō)我怎么就攤上這事复濒〔甭簦” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 158,084評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵芝薇,是天一觀的道長(zhǎng)胚嘲。 經(jīng)常有香客問(wèn)我,道長(zhǎng)洛二,這世上最難降的妖魔是什么馋劈? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,708評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮晾嘶,結(jié)果婚禮上妓雾,老公的妹妹穿的比我還像新娘。我一直安慰自己垒迂,他們只是感情好械姻,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,813評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著机断,像睡著了一般楷拳。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上吏奸,一...
    開(kāi)封第一講書(shū)人閱讀 50,021評(píng)論 1 291
  • 那天欢揖,我揣著相機(jī)與錄音,去河邊找鬼奋蔚。 笑死她混,一個(gè)胖子當(dāng)著我的面吹牛烈钞,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播坤按,決...
    沈念sama閱讀 39,120評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼毯欣,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了臭脓?” 一聲冷哼從身側(cè)響起酗钞,我...
    開(kāi)封第一講書(shū)人閱讀 37,866評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎谢鹊,沒(méi)想到半個(gè)月后算吩,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體留凭,經(jīng)...
    沈念sama閱讀 44,308評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡佃扼,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,633評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蔼夜。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片兼耀。...
    茶點(diǎn)故事閱讀 38,768評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖求冷,靈堂內(nèi)的尸體忽然破棺而出瘤运,到底是詐尸還是另有隱情,我是刑警寧澤匠题,帶...
    沈念sama閱讀 34,461評(píng)論 4 333
  • 正文 年R本政府宣布拯坟,位于F島的核電站,受9級(jí)特大地震影響韭山,放射性物質(zhì)發(fā)生泄漏郁季。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,094評(píng)論 3 317
  • 文/蒙蒙 一钱磅、第九天 我趴在偏房一處隱蔽的房頂上張望梦裂。 院中可真熱鬧,春花似錦盖淡、人聲如沸年柠。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,850評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)冗恨。三九已至,卻和暖如春味赃,著一層夾襖步出監(jiān)牢的瞬間掀抹,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,082評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工洁桌, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留渴丸,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,571評(píng)論 2 362
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像谱轨,于是被迫代替她去往敵國(guó)和親戒幔。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,666評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容

  • 前言 《四柱特訓(xùn)班講義》一書(shū)土童,是筆者根據(jù)2003年春舉辦的四柱特訓(xùn)班講課記錄的基礎(chǔ)上整理出來(lái)的诗茎。它是以《四柱詳真》...
    小狐貍娃娃閱讀 11,797評(píng)論 1 29
  • 禪意自在閱讀 71評(píng)論 0 0
  • 生活不止有籃球與妥協(xié),還有詩(shī)和遠(yuǎn)方的田野献汗。 這句話用在拉里·桑德斯的身上在確切不過(guò)了敢订。 拉里-桑德斯在兩年前選擇離...
    籃球行為大賞閱讀 532評(píng)論 4 8
  • 近日,著名主持人吳昕受邀出席了巴黎時(shí)裝周罢吃,并攜手法國(guó)時(shí)尚品牌ETAM拍攝街拍大片楚午,在巴黎街頭演繹最新秋冬時(shí)髦單品。...
    精品lifestyle閱讀 196評(píng)論 0 0
  • 今天是2016年的最后一天除夕之夜尿招,這一天除了鋪天蓋地的微信好友發(fā)來(lái)的祝福信息矾柜,還有準(zhǔn)備年夜飯的忙碌,今年同往年不...
    熊雪瑩閱讀 308評(píng)論 0 1