分析工具會簡化實(shí)際情況雏亚,在數(shù)據(jù)和假設(shè)正確的情況下,只要工具可靠摩钙,分析以創(chuàng)建最有用的模型為目標(biāo)罢低。——《深入淺出數(shù)據(jù)分析》
1.優(yōu)化和證偽:兩種截然不同的分析思路
1.1優(yōu)化法
優(yōu)化法是針對最優(yōu)化問題的分析方法胖笛,以目標(biāo)函數(shù)為模型奕短,針對假設(shè)變化必須修改模型宜肉。
目標(biāo)函數(shù)=目標(biāo)變量+決策變量+約束條件,其中決策變量是優(yōu)化時(shí)可控因素的可靠數(shù)據(jù)翎碑,約束條件則是不可控因素的可靠數(shù)據(jù),一般包括決策變量參數(shù)和可行區(qū)域之斯。
1.2假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)的核心是證偽日杈。
假設(shè)檢驗(yàn)的思路是剔除無法證實(shí)的假設(shè),對無法證偽的假設(shè)評級佑刷。
通過觀察診斷性確定有效證據(jù)莉擒,評估假設(shè)完成評級。
2.優(yōu)秀數(shù)據(jù)圖形的特征
三個(gè)特征可以評價(jià)數(shù)據(jù)圖形優(yōu)劣:
一是圖形體現(xiàn)了數(shù)據(jù)瘫絮,尤其是體現(xiàn)了和目標(biāo)有關(guān)的數(shù)據(jù)涨冀。
二是圖形對數(shù)據(jù)作了正確的比較,數(shù)據(jù)只有相互比較才會有意義麦萤。
三是圖形展示了多個(gè)變量的情況鹿鳖。
3.貝葉斯規(guī)則:精確整合新信息
貝葉斯規(guī)則提供了一種將新信息整合到分析中的精確方法。
新信息改變了基礎(chǔ)概率壮莹,新的條件概率建構(gòu)到基礎(chǔ)概率和條件概率上翅帜。
基礎(chǔ)概率謬誤是指存在基礎(chǔ)概率數(shù)據(jù)卻選擇忽略導(dǎo)致決策錯(cuò)誤,避免基本概率謬誤的唯一辦法是務(wù)必將其整合到分析中命满。