統(tǒng)計(jì)推斷概述

什么是統(tǒng)計(jì)推斷

對(duì)于要做統(tǒng)計(jì)推斷的人來(lái)講绿满,這個(gè)問(wèn)題似乎顯得多余内地,他們往往關(guān)心怎樣做統(tǒng)計(jì)推斷。這也許可以窺得發(fā)展中國(guó)家在經(jīng)濟(jì)增長(zhǎng)中的一個(gè)弊端:知其然碰缔,不知其所以然账劲。因?yàn)閯e人已經(jīng)做出來(lái)了嘛,我管那么多干嘛手负,先做出來(lái)再講涤垫!然而,核心科技我們還是要掌握的竟终。

我們經(jīng)常講概率統(tǒng)計(jì)蝠猬,概率統(tǒng)計(jì),這并不是一個(gè)詞而是一個(gè)有著繼承關(guān)系的短語(yǔ)统捶∮苈可以說(shuō)一個(gè)是理論基礎(chǔ)一個(gè)是應(yīng)用科學(xué)柄粹,當(dāng)然這里我們主要關(guān)注的是這個(gè)應(yīng)用科學(xué):統(tǒng)計(jì)學(xué)。

概率論是推理性的匆绣,由概率分布推斷樣本性質(zhì)驻右,如大數(shù)定律、中心極限定理崎淳。統(tǒng)計(jì)是歸納性的堪夭,由樣本信息反推概率分布,如概率分布參數(shù)的點(diǎn)估計(jì)拣凹、區(qū)間估計(jì)森爽,以及線性回歸。一張圖很好地區(qū)別了概率與統(tǒng)計(jì):

在數(shù)據(jù)分析中使用了兩種主要的統(tǒng)計(jì)方法:描述性統(tǒng)計(jì)嚣镜,使用諸如均值標(biāo)準(zhǔn)偏差指標(biāo)對(duì)樣本中的數(shù)據(jù)進(jìn)行匯總爬迟,以及推論統(tǒng)計(jì),從隨機(jī)變化的數(shù)據(jù)中得出結(jié)論(例如菊匿,觀察誤差付呕,抽樣變異)。其中描述性統(tǒng)計(jì)一般用來(lái)做探索性數(shù)據(jù)分析跌捆,所謂的推論統(tǒng)計(jì)徽职,就是今天我們主要講的統(tǒng)計(jì)推斷,其意思就是用統(tǒng)計(jì)學(xué)的方法來(lái)推斷疹蛉。統(tǒng)計(jì)推斷(區(qū)別于貝葉斯推斷活箕,這里主要基于頻率推斷)主要可以分為兩大類:一類是參數(shù)估計(jì)問(wèn)題;另一類是假設(shè)檢驗(yàn)問(wèn)題可款。其中假設(shè)檢驗(yàn)又可分為參數(shù)檢驗(yàn)與非參數(shù)檢驗(yàn)育韩。

至于怎么推斷的:

在講述統(tǒng)計(jì)的時(shí)候離不開(kāi)概率,而在講述這兩者的時(shí)候闺鲸,就離不開(kāi)幾個(gè)基本的概念:

  • 總體(population):包含所研究的全部個(gè)體(數(shù)據(jù))的集合筋讨。
  • 樣本(sample):從總體中抽取的一部分元素的集合。
  • 參數(shù)(parameter):用來(lái)描述總體特征的概括性數(shù)字度量摸恍。
  • 統(tǒng)計(jì)量(statistic):用來(lái)描述樣本的概括性數(shù)字度量悉罕。
  • 置信區(qū)間(Confidence interval)以統(tǒng)計(jì)量的置信上限和置信下限為上下界構(gòu)成的區(qū)間

在做統(tǒng)計(jì)的時(shí)候,我們手里有的就是樣本信息立镶,在這里要注意樣本的兩重性: 樣本既可看成具體的數(shù), 又可以看成隨機(jī)變量 (或隨機(jī)向量). 在完成抽樣后壁袄,它是具體的數(shù);在實(shí)施抽樣前媚媒,它被看成隨機(jī)變量. 因?yàn)樵趯?shí)施具體抽樣之前無(wú)法預(yù)料抽樣的結(jié)果, 只能預(yù)料它可能取值的范圍, 故可把它看成一個(gè)隨機(jī)變量嗜逻,因此才有概率分布可言。

對(duì)理論工作者, 更重視樣本是隨機(jī)變量這一點(diǎn)缭召,而對(duì)應(yīng)用工作者雖則將樣本看成具體的數(shù)字栈顷, 但仍不可忽視樣本是隨機(jī)變量 (或隨機(jī)向量) 這一背景逆日。否則,樣本就是一堆雜亂無(wú)章毫無(wú)規(guī)律可言的數(shù)字萄凤,無(wú)法進(jìn)行任何統(tǒng)計(jì)處理室抽。 樣本既然是隨機(jī)變量 (或隨機(jī)向量),就有分布而言靡努,就可以應(yīng)用概率論的知識(shí)坪圾, 這樣才存在統(tǒng)計(jì)推斷問(wèn)題。

統(tǒng)計(jì)學(xué)的目的是試圖找到可能產(chǎn)生我們所觀測(cè)到的數(shù)據(jù)背后的概率分布惑朦,而統(tǒng)計(jì)推斷是建立在這個(gè)分布之上的神年。尋找一個(gè)模型一般有兩步:對(duì)一個(gè)模型(分布)的初步猜想以及對(duì)未知模型參數(shù)的估計(jì)⌒朽停可見(jiàn)統(tǒng)計(jì)學(xué)的三大要素:模型、策略垛耳、算法栅屏。

為什么要做統(tǒng)計(jì)推斷

為了那些未被觀察到的樣本總體,為了抉擇堂鲜。

怎樣做統(tǒng)計(jì)推斷

獲得有效數(shù)據(jù)后, 統(tǒng)計(jì)推斷問(wèn)題可以按照如下的步驟進(jìn)行:

  1. 確定用于統(tǒng)計(jì)推斷的合適統(tǒng)計(jì)量;
  2. 尋求統(tǒng)計(jì)量的精確分布; 在統(tǒng)計(jì)量的精確分布難以求出的情形,
    可考慮利用中心極限定理或其它極限定理找出統(tǒng)計(jì)量的極限分
    布.
  3. 基于該統(tǒng)計(jì)量的精確分布或極限分布, 求出統(tǒng)計(jì)推斷問(wèn)題的精
    確解或近似解.
  4. 根據(jù)統(tǒng)計(jì)推斷結(jié)果對(duì)問(wèn)題作出解釋.

假設(shè)檢驗(yàn)的一般步驟:

  1. 將實(shí)際問(wèn)題提煉為統(tǒng)計(jì)問(wèn)題
  2. 建立假設(shè)
  3. 確定顯著性水平α
  4. 驗(yàn)證前提條件
  5. 確定檢驗(yàn)統(tǒng)計(jì)量
  6. 確定拒絕域
  7. 根據(jù)樣本計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值并進(jìn)行判斷

求最大似然函數(shù)估計(jì)值的一般步驟

(1)寫出似然函數(shù)栈雳;
(2)對(duì)似然函數(shù)取對(duì)數(shù),并整理缔莲;
(3)求導(dǎo)數(shù)哥纫,令導(dǎo)數(shù)為0,得到似然方程痴奏;
(4)解似然方程蛀骇,得到的參數(shù)即為所求


參考:
統(tǒng)計(jì)推斷概述
概率論與統(tǒng)計(jì)學(xué)的關(guān)系是什么?
“魯棒性”的出現(xiàn)與譯者的偷懶
第五章: 數(shù)理統(tǒng)計(jì)的基本概念與抽樣分布
「統(tǒng)計(jì)學(xué)」「統(tǒng)計(jì)推斷」「統(tǒng)計(jì)學(xué)習(xí)」有什么區(qū)別读拆?
統(tǒng)計(jì)學(xué)的現(xiàn)實(shí)意義是什么?
統(tǒng)計(jì)學(xué)(三):簡(jiǎn)單統(tǒng)計(jì)推斷
假設(shè)檢驗(yàn)之三:假設(shè)檢驗(yàn)的基本步驟
用簡(jiǎn)單方法學(xué)會(huì)----參數(shù)估計(jì)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末擅憔,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子檐晕,更是在濱河造成了極大的恐慌暑诸,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件辟灰,死亡現(xiàn)場(chǎng)離奇詭異个榕,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)芥喇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門西采,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人乃坤,你說(shuō)我怎么就攤上這事苛让」得铮” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵狱杰,是天一觀的道長(zhǎng)瘦材。 經(jīng)常有香客問(wèn)我,道長(zhǎng)仿畸,這世上最難降的妖魔是什么食棕? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮错沽,結(jié)果婚禮上簿晓,老公的妹妹穿的比我還像新娘。我一直安慰自己千埃,他們只是感情好憔儿,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著放可,像睡著了一般谒臼。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上耀里,一...
    開(kāi)封第一講書(shū)人閱讀 49,111評(píng)論 1 285
  • 那天蜈缤,我揣著相機(jī)與錄音,去河邊找鬼冯挎。 笑死底哥,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的房官。 我是一名探鬼主播趾徽,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼翰守!你這毒婦竟也來(lái)了附较?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤潦俺,失蹤者是張志新(化名)和其女友劉穎拒课,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體事示,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡早像,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了肖爵。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片卢鹦。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出冀自,到底是詐尸還是另有隱情揉稚,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布熬粗,位于F島的核電站搀玖,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏驻呐。R本人自食惡果不足惜灌诅,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望含末。 院中可真熱鬧猜拾,春花似錦、人聲如沸佣盒。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)肥惭。三九已至宋雏,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間务豺,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工嗦明, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留笼沥,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓娶牌,卻偏偏與公主長(zhǎng)得像奔浅,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子诗良,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容