讀書筆記| 面向數(shù)據(jù)科學(xué)家的實(shí)用統(tǒng)計(jì)學(xué)

date: 2019-03-13 17:11:37
title: 讀書筆記| 面向數(shù)據(jù)科學(xué)家的實(shí)用統(tǒng)計(jì)學(xué)

mind

  • 老生常談, 關(guān)注「原書名」, 可以幫助你很好的了解這本書到底要講啥: 「Practical Statistics for Data Scientists: 50 Essential Concepts」
  • 關(guān)于術(shù)語: 數(shù)據(jù)科學(xué) = 統(tǒng)計(jì)學(xué) + 計(jì)算機(jī)科學(xué) + 信息技術(shù) + 一些特定領(lǐng)域的研究, 「術(shù)語滿天飛」是常態(tài), 而我一向的觀點(diǎn)認(rèn)為 -- 術(shù)語是一道無形的墻, 看似很難, 實(shí)則只是「知道就很簡單, 不知道以為很難」. 同時(shí), 它們也代表著這個(gè)領(lǐng)域的知識儲備.
  • 數(shù)據(jù)科學(xué)從業(yè)者的參考書: 實(shí)用統(tǒng)計(jì)學(xué)術(shù)語 + 數(shù)據(jù)挖掘行為和實(shí)踐. 同理, 非數(shù)據(jù)科學(xué)從業(yè)者, 更多的是了解概念, 加深對數(shù)據(jù)科學(xué)的印象, 以及嘗試 run 一下示例.
  • 代碼使用 R 語言: 語言都是圖靈完備的, R 語言能實(shí)現(xiàn)的, 作為數(shù)據(jù)分析的大戶 Python 語言也一定可以. 但是能熟練使用 R 語言的人就不那么多了. 雖然 docker run 一個(gè) R 語言環(huán)境很簡單, 面對起代碼來還是有 「熟悉度」 帶來的不小障礙

note

本書并非又一本統(tǒng)計(jì)學(xué)教程, 也不是機(jī)器學(xué)習(xí)手冊. 它運(yùn)用清晰的解釋和豐富的示例, 將實(shí)用的統(tǒng)計(jì)學(xué)術(shù)語與當(dāng)下的數(shù)據(jù)挖掘行為和實(shí)踐聯(lián)系起來. 對數(shù)據(jù)科學(xué)從業(yè)者來說, 這都是一本非常出色的參考書.

  • 為什么探索性數(shù)據(jù)分析是數(shù)據(jù)科學(xué)關(guān)鍵的第一步
  • 隨機(jī)抽樣如何降低偏差, 生成高質(zhì)量數(shù)據(jù)集
  • 實(shí)驗(yàn)設(shè)計(jì)原則如何針對問題生成確定性答案
  • 如何使用回歸方法估計(jì)結(jié)果并檢測異常
  • 用于預(yù)測記錄所屬類別的主要分析分類方法
  • 從數(shù)據(jù)中「學(xué)習(xí)」的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法
  • 從未標(biāo)記數(shù)據(jù)中提取有意義信息的無監(jiān)督學(xué)習(xí)方法

如果你不知道自己在尋找什么, 那么努力尋找吧, 終會發(fā)現(xiàn)它. -- Yogi Berra
為此, 人們提出了統(tǒng)計(jì)假設(shè)檢驗(yàn)方法, 目的是使研究人員免受隨機(jī)性的愚弄.
正則化是一種通過修改的代價(jià)函數(shù)去 「懲罰」 模型復(fù)雜度(聯(lián)想一下奧卡姆剃刀原理)的技術(shù).

均值回歸現(xiàn)象
女士品茶 -- 費(fèi)舍爾 -- 數(shù)理統(tǒng)計(jì)學(xué)簡史(數(shù)理統(tǒng)計(jì)學(xué)史上相對有趣的故事)
提出假設(shè) -> 設(shè)計(jì)實(shí)驗(yàn) -> 收集數(shù)據(jù) -> 推斷/結(jié)論
樸素貝葉斯算法
冷啟動(dòng)問題

EDA, 探索性數(shù)據(jù)分析
estimate 估計(jì)量
metric 度量

EX

統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ): 數(shù)據(jù)挖掘/推理和預(yù)測
統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ) ed2
統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論: 基于 R 應(yīng)用
數(shù)據(jù)挖掘: 實(shí)用機(jī)器學(xué)習(xí)工具與技術(shù)
數(shù)理統(tǒng)計(jì)學(xué)簡史
百萬大決定: 世界是如何運(yùn)作的?

PS: 還有許多論文 , 由于沒有受過專門的研究訓(xùn)練, 對論文的處理能力還處在捉襟見肘階段, 只羅列了部分參考書籍.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市拇囊,隨后出現(xiàn)的幾起案子象浑,更是在濱河造成了極大的恐慌芋浮,老刑警劉巖份汗,帶你破解...
    沈念sama閱讀 212,718評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件纸型,死亡現(xiàn)場離奇詭異船老,居然都是意外死亡永品,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來泞莉,“玉大人洁墙,你說我怎么就攤上這事〗洳疲” “怎么了?”我有些...
    開封第一講書人閱讀 158,207評論 0 348
  • 文/不壞的土叔 我叫張陵捺弦,是天一觀的道長饮寞。 經(jīng)常有香客問我,道長列吼,這世上最難降的妖魔是什么幽崩? 我笑而不...
    開封第一講書人閱讀 56,755評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮寞钥,結(jié)果婚禮上慌申,老公的妹妹穿的比我還像新娘。我一直安慰自己理郑,他們只是感情好蹄溉,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,862評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著您炉,像睡著了一般柒爵。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上赚爵,一...
    開封第一講書人閱讀 50,050評論 1 291
  • 那天棉胀,我揣著相機(jī)與錄音,去河邊找鬼冀膝。 笑死唁奢,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的窝剖。 我是一名探鬼主播麻掸,決...
    沈念sama閱讀 39,136評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼枯芬!你這毒婦竟也來了论笔?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,882評論 0 268
  • 序言:老撾萬榮一對情侶失蹤千所,失蹤者是張志新(化名)和其女友劉穎狂魔,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體淫痰,經(jīng)...
    沈念sama閱讀 44,330評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡最楷,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,651評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片籽孙。...
    茶點(diǎn)故事閱讀 38,789評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡烈评,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出犯建,到底是詐尸還是另有隱情讲冠,我是刑警寧澤,帶...
    沈念sama閱讀 34,477評論 4 333
  • 正文 年R本政府宣布适瓦,位于F島的核電站竿开,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏玻熙。R本人自食惡果不足惜否彩,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,135評論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望嗦随。 院中可真熱鬧列荔,春花似錦、人聲如沸枚尼。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,864評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽署恍。三九已至悬而,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間锭汛,已是汗流浹背笨奠。 一陣腳步聲響...
    開封第一講書人閱讀 32,099評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留唤殴,地道東北人般婆。 一個(gè)月前我還...
    沈念sama閱讀 46,598評論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像朵逝,于是被迫代替她去往敵國和親蔚袍。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,697評論 2 351

推薦閱讀更多精彩內(nèi)容