數(shù)據(jù)分析的基礎(chǔ)概念和模型 |《深入淺出數(shù)據(jù)分析》

這本書(shū)目前豆瓣評(píng)分7.6襟诸,理論上我不想拿8.0以下的書(shū)入門(mén)(最好是8.5以上)绞惦。所以猶豫了很久,但是讀完發(fā)現(xiàn)這本書(shū)作為入門(mén)是很好的借帘。如書(shū)中所說(shuō)蜘渣,這本書(shū)關(guān)注的是假設(shè)和建模范圍的事情,能清楚地解釋概念肺然、模型蔫缸,且能講得通俗有趣,已經(jīng)很不錯(cuò)了际起。豆瓣評(píng)分低大概是覺(jué)得太淺吧拾碌。

圖片發(fā)自簡(jiǎn)書(shū)App

核心概念

  • 創(chuàng)建模型時(shí),務(wù)必要規(guī)定假設(shè)中的各種變量的相互關(guān)系街望。不要假定兩個(gè)變量是不相關(guān)的校翔。# 變量間關(guān)系
  • 定義主觀意愿?# 約束條件定義什么 容易忽略的約束條件
    例如某廠生產(chǎn)橡皮鴨和橡皮魚(yú)灾前,求問(wèn)怎樣的產(chǎn)量組合能獲得最大利潤(rùn)防症。約束條件容易考慮橡膠量、生產(chǎn)時(shí)間哎甲、利潤(rùn)蔫敲,容易忽略人們對(duì)兩種產(chǎn)品的購(gòu)買(mǎi)意愿。例如魚(yú)的利潤(rùn)小但暢銷烧给,若追求利潤(rùn)最大而生產(chǎn)很多魚(yú)但賣不出去燕偶,依然無(wú)法利潤(rùn)最大喝噪。
  • 散點(diǎn)圖可判斷因果關(guān)系础嫡,體現(xiàn)關(guān)系,但不能直接反映為什么兩者有關(guān)
  • 因果關(guān)系通常是網(wǎng)狀的,不是線性的
  • 隨機(jī)事件

模型

最優(yōu)化模型

  • 用途:給定約束條件下榴鼎,求怎樣的變量組合得到最優(yōu)解
  • excel -> solver

貝葉斯規(guī)則

  • 用途:可以把新信息整合到已知信息中伯诬,修正主觀概率:即在已有一個(gè)假設(shè)的概率時(shí),新證據(jù)出現(xiàn)時(shí)巫财,該假設(shè)還成立的概率盗似。關(guān)鍵是求(估算):假設(shè)成立的條件下,新證據(jù)出現(xiàn)的概率

回歸

  • 用途:線性回歸平项、非線性等
  • 均方根差表示散點(diǎn)和回歸線的差異赫舒,即線性回歸的誤差區(qū)間。

工具

散點(diǎn)圖

  • 判斷因果關(guān)系闽瓢。y軸結(jié)果接癌,x軸原因

證偽法

  • 用途:

1 用于幾種假設(shè)都沒(méi)有強(qiáng)烈證據(jù)支持的時(shí)候。區(qū)別于滿意法扣讼,即挑一個(gè)覺(jué)得證據(jù)多的假設(shè)為真缺猛。這有可能忽略該假設(shè)反面證據(jù),或者漏掉其他假設(shè)的支持證據(jù)椭符。( which is 大多數(shù)人決策會(huì)使用的方法)

2 對(duì)一種未知情況做判斷荔燎,可以提出幾種具體假設(shè)再證偽。
例如 iPhone 何時(shí)發(fā)布

啟發(fā)法與最優(yōu)解

  • 用途:其中一種:別人用啟發(fā)法來(lái)決策销钝、給任務(wù)時(shí)有咨,如果無(wú)法量化結(jié)果,可以選擇說(shuō)服對(duì)方換一種啟發(fā)法蒸健。

直方圖

  • 數(shù)據(jù)點(diǎn)在數(shù)值范圍內(nèi)的分布摔吏。(有多少人薪資在15k+,多少在30k+...)

軟件

  • excel: 可以分隔數(shù)據(jù)(例如以分隔符隔開(kāi)時(shí))
  • R軟件
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末纵装,一起剝皮案震驚了整個(gè)濱河市征讲,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌橡娄,老刑警劉巖诗箍,帶你破解...
    沈念sama閱讀 218,122評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異挽唉,居然都是意外死亡滤祖,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)瓶籽,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)匠童,“玉大人,你說(shuō)我怎么就攤上這事塑顺√狼螅” “怎么了俏险?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,491評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)扬绪。 經(jīng)常有香客問(wèn)我竖独,道長(zhǎng),這世上最難降的妖魔是什么挤牛? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,636評(píng)論 1 293
  • 正文 為了忘掉前任莹痢,我火速辦了婚禮,結(jié)果婚禮上墓赴,老公的妹妹穿的比我還像新娘竞膳。我一直安慰自己,他們只是感情好诫硕,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布顶猜。 她就那樣靜靜地躺著,像睡著了一般痘括。 火紅的嫁衣襯著肌膚如雪长窄。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,541評(píng)論 1 305
  • 那天纲菌,我揣著相機(jī)與錄音挠日,去河邊找鬼。 笑死翰舌,一個(gè)胖子當(dāng)著我的面吹牛嚣潜,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播椅贱,決...
    沈念sama閱讀 40,292評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼懂算,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了庇麦?” 一聲冷哼從身側(cè)響起计技,我...
    開(kāi)封第一講書(shū)人閱讀 39,211評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎山橄,沒(méi)想到半個(gè)月后垮媒,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,655評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡航棱,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評(píng)論 3 336
  • 正文 我和宋清朗相戀三年睡雇,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片饮醇。...
    茶點(diǎn)故事閱讀 39,965評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡它抱,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出朴艰,到底是詐尸還是另有隱情观蓄,我是刑警寧澤混移,帶...
    沈念sama閱讀 35,684評(píng)論 5 347
  • 正文 年R本政府宣布,位于F島的核電站蜘腌,受9級(jí)特大地震影響沫屡,放射性物質(zhì)發(fā)生泄漏饵隙。R本人自食惡果不足惜撮珠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望金矛。 院中可真熱鬧芯急,春花似錦、人聲如沸驶俊。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,894評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)饼酿。三九已至榕酒,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間故俐,已是汗流浹背想鹰。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,012評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留药版,地道東北人辑舷。 一個(gè)月前我還...
    沈念sama閱讀 48,126評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像槽片,于是被迫代替她去往敵國(guó)和親何缓。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容