參加寫作馬拉松感覺就是在進(jìn)行整理工作昔善。
寫的內(nèi)容是關(guān)于統(tǒng)計(jì)學(xué)中零假設(shè)檢驗(yàn)、貝葉斯學(xué)派和似然函數(shù)之間的關(guān)系畔乙,關(guān)于零假設(shè)檢驗(yàn)就涉及到了關(guān)于樣本君仆、方差齊性、一類錯(cuò)誤和二類錯(cuò)誤牲距、統(tǒng)計(jì)檢驗(yàn)力返咱、置信區(qū)間、效應(yīng)量牍鞠;貝葉斯學(xué)派就涉及到了先驗(yàn)概率咖摹、后驗(yàn)概率、樣本信息难述;似然函數(shù)就涉及到了正態(tài)分布萤晴、模型之間的數(shù)據(jù)比較吐句;
對(duì)這些概念舉例,關(guān)于測(cè)謊店读、機(jī)器學(xué)習(xí)蕴侧、人格測(cè)驗(yàn)的一些具體內(nèi)容;然后繼續(xù)具體下去两入,如何控制變量,會(huì)出現(xiàn)的問題敲才,如何應(yīng)對(duì)內(nèi)容等等內(nèi)容裹纳;
事先搭好一個(gè)框架,然后根據(jù)框架往里面填紧武,類似于選擇好房間的置物位置剃氧;把衣服全部拿出來;然后分大類阻星,分小類朋鞍,一個(gè)個(gè)填好;
自己知道整理的內(nèi)在邏輯妥箕,看的賞心悅目滥酥,心里舒坦,這就是我參加完半馬的感受畦幢。
就是這樣坎吻。
截取一段內(nèi)容,湊夠1500字:
為什么要使用統(tǒng)計(jì)推斷來減少對(duì)自己對(duì)愚弄呢宇葱?
首先瘦真,愚弄自己指的是什么?
對(duì)于存在的事實(shí)我們拒絕接受黍瞧,對(duì)于不存在的事實(shí)我們反而會(huì)相信他存在诸尽。
前者的情況可以舉什么例子呢?
比如別人指出我們的缺點(diǎn)印颤,英語(yǔ)口語(yǔ)能力不行您机,但是指出者反而覺得自我感覺良好;比如一個(gè)實(shí)驗(yàn)中明明沒有顯著性差異膀哲,但是因?yàn)楹臀覀円罁?jù)的理論有悖往产,我們無法接受;比如站崗時(shí)某宪,明明沒有敵人仿村,但是因?yàn)橛幸恍┰胍艉妥约簝?nèi)心標(biāo)準(zhǔn)的影響,我們往往會(huì)認(rèn)為實(shí)際上是有人兴喂。對(duì)于存在的事實(shí)我們拒絕接受蔼囊,同樣也是統(tǒng)計(jì)學(xué)中的假陰性事件焚志。比如明明實(shí)驗(yàn)處理是有效果的,但是我們卻因?yàn)閷?shí)驗(yàn)設(shè)計(jì)畏鼓,樣本原因以及統(tǒng)計(jì)方法的不恰當(dāng)酱酬,導(dǎo)致無法檢測(cè)出來。這也就犯了二類錯(cuò)誤云矫。
后者的情況可以舉什么例子呢膳沽?
對(duì)于不存在的事實(shí)我們反而會(huì)相信他存在?明明沒有治療作用的保健品我們卻會(huì)相信让禀;明明沒有直接證明孩子是殺父兇手挑社,我們卻認(rèn)為他有罪,這在電影《十二怒漢》中有明顯的表達(dá)巡揍;明明不合理的辯論痛阻,我們卻因?yàn)檗q論者本身使用的技巧(背景相干謬誤、人身攻擊)而被說服腮敌;明明沒有任何作用的綠豆阱当,我們卻因?yàn)橄嘈帕止獬5脑挾ハ嘈拧Uf到這糜工,這也在另一個(gè)方面提出了一個(gè)新的視角弊添,就是人是如何被說服的呢?被所謂的“眼見為實(shí)”啤斗,被情感的煽動(dòng)而影響表箭?被信息不對(duì)稱而導(dǎo)致無法認(rèn)清事實(shí)真相。
有人畏懼看到真相钮莲,但是無論真相如何免钻,看到事實(shí)才能更把問題更好地解決,否則一開始就跑錯(cuò)了方向崔拥;
而不存在的事實(shí)我們認(rèn)為出現(xiàn)了這是虛驚一場(chǎng)极舔,這是誤報(bào),這也是統(tǒng)計(jì)學(xué)上所說的一類錯(cuò)誤链瓦;
因?yàn)槿吮旧淼撵`活拆魏,惰性以及環(huán)境的影響,讓我們思
考一個(gè)問題慈俯,我們?nèi)绾螠p少對(duì)自己的愚弄呢渤刃?
這門課程的老師為我們介紹了統(tǒng)計(jì)推斷所指出的三條路,當(dāng)然我相信這只是一個(gè)視角贴膘,如果還需要補(bǔ)充卖子,我覺得實(shí)際生活中,我們可能會(huì)形成對(duì)一個(gè)人的穩(wěn)定的相信程度刑峡,然后借鑒這個(gè)人的觀點(diǎn)去對(duì)我們的認(rèn)識(shí)進(jìn)行修正洋闽。這似乎也是貝葉斯學(xué)派的核心思想玄柠,難道沒有其他路了嗎?或者這存在這非常巨大的哲學(xué)背景诫舅?我可能需要多次反復(fù)學(xué)習(xí)之后羽利,會(huì)有進(jìn)一步的收獲。
那么不愚弄自己刊懈,首先我們應(yīng)該會(huì)面對(duì)的是一個(gè)模糊的問題这弧,不太了解的領(lǐng)域,那么首先就是要去澄清這個(gè)問題虚汛,這個(gè)問題的提出是我們?cè)撟龅牡毖纭jP(guān)于這個(gè)問題,Neyman-Pearson主要完善了這方面的工作泽疆。
在具體的統(tǒng)計(jì)過程中,我們的流程是:
1/明確虛無假設(shè)和備擇假設(shè)的具體玲献;
2/然后選擇相應(yīng)假設(shè)的統(tǒng)計(jì)指標(biāo)殉疼,設(shè)置我們可以相信這一假設(shè)時(shí)統(tǒng)計(jì)指標(biāo)的范圍,比如數(shù)據(jù)出現(xiàn)多大程度時(shí)我們可以接受這個(gè)假設(shè)的證據(jù)捌年?比如數(shù)據(jù)所呈現(xiàn)的分布其均值與另一個(gè)假設(shè)的均值有什么差異瓢娜,關(guān)于這一點(diǎn)我們可以之后再談。
3/那么接下來就是選擇樣本和收集數(shù)據(jù)的過程礼预;關(guān)于樣本和數(shù)據(jù)類型可以進(jìn)行如下思考內(nèi)容
1眠砾、多少組樣本
1.1 單樣本,如果知道總體數(shù)據(jù)托酸,可進(jìn)行單樣本t檢驗(yàn)
1.2 雙樣本褒颈,可以進(jìn)行t檢驗(yàn)
1.3 多樣本,可以進(jìn)行單因素方差分析
1.3.1 如果是多個(gè)因素的多樣本励堡,那么就需要進(jìn)行兩因素谷丸、三因素方差分析過程。
2应结、每組樣本是否相同
這里的每組樣本是否相同刨疼,主要是考察兩點(diǎn):
2.1 方差齊性,如果方差不齊鹅龄,就需要分析方差不齊的原因揩慕,如果是因?yàn)閿?shù)據(jù)的異常或缺失扮休,那么統(tǒng)計(jì)學(xué)上會(huì)有其他方法進(jìn)行相關(guān)的糾正迎卤,比如說數(shù)據(jù)轉(zhuǎn)換,根據(jù)標(biāo)準(zhǔn)差或人為設(shè)定的一個(gè)范圍剔除異常值肛炮,比如運(yùn)用樣本均數(shù)代替缺失值以及誤差值止吐,或者是截尾均值
2.2 每組樣本數(shù)量是否相同宝踪,比如一個(gè)實(shí)驗(yàn)有三個(gè)組,第一個(gè)組10個(gè)人碍扔,第二個(gè)組8個(gè)人瘩燥,第三個(gè)組5個(gè)人,那么就需要考慮調(diào)和均數(shù)的方法不同。這里本身也有很大的一塊可以補(bǔ)充
3厉膀、每組樣本之間是獨(dú)立的還是配對(duì)的
牽扯到是使用獨(dú)立樣本t檢驗(yàn),還是配對(duì)樣本t檢驗(yàn)二拐,是使用重復(fù)測(cè)量方差分析還是單因素方差分析服鹅,當(dāng)然應(yīng)該還要根據(jù)數(shù)據(jù)的類型進(jìn)行考慮,如果是稱名數(shù)據(jù)或是順序數(shù)據(jù)百新,那么就需要考慮非參數(shù)統(tǒng)計(jì)的方法企软;
4、既然談到了數(shù)據(jù)類型饭望,那么就在此也補(bǔ)充這個(gè)內(nèi)容
4.1 分為四種數(shù)據(jù)類型:
稱名數(shù)據(jù)——數(shù)據(jù)只是提供了一個(gè)物品的名稱仗哨,并沒有提供與其他物品的關(guān)系,比如我叫“陳東濠”铅辞,并沒有提供我和父母之間的關(guān)系厌漂,無法進(jìn)行更多推斷;比如這場(chǎng)馬拉松比賽中斟珊,我們知道誰(shuí)誰(shuí)誰(shuí)完成了半馬苇倡,誰(shuí)誰(shuí)誰(shuí)完成了全馬,但僅僅只是知道而已囤踩,不能進(jìn)行下一步的推測(cè)旨椒,當(dāng)然如果你說你是超能力,天賦異稟能夠看到名字就知道一個(gè)人的前世今生堵漱,那我們就不在這個(gè)領(lǐng)域談钩乍。這個(gè)領(lǐng)域主要還是基于事實(shí)數(shù)據(jù)來進(jìn)行推理的過程。但是稍微做下延伸怔锌,你會(huì)驚訝人的這種命名方式是和神奇的寥粹,我們?nèi)绾螐幕靵y的視覺圖像中看出一個(gè)個(gè)有著界限的物體,并且對(duì)它們進(jìn)行命名埃元。這里面涉及到的是知覺和語(yǔ)言之間的關(guān)系涝涤。有意思的現(xiàn)象就在于顏色詞的命名,因?yàn)槲矣X得領(lǐng)域基礎(chǔ)而又深刻岛杀,所以還是停下來收集了下相關(guān)的內(nèi)容給大家展示“世界上還沒有發(fā)現(xiàn)任何一種完全沒有色彩語(yǔ)碼的語(yǔ)言阔拳。Berlin和Kay通過跨文化比較的方式考差了98種語(yǔ)言的基本顏色詞,發(fā)現(xiàn)有11種顏色詞構(gòu)成了人類語(yǔ)言種色彩語(yǔ)碼系統(tǒng)的基本范疇,并且有嚴(yán)格的等級(jí)性:黑白紅黃綠藍(lán)>粉/橙/灰/紫”這里面涉及的內(nèi)容包括基本顏色范疇糊肠,范疇中的焦點(diǎn)顏色詞所代表的經(jīng)典顏色辨宠,和后面所派生出的顏色詞可以作為人類意識(shí)研究的側(cè)面進(jìn)行深入研究。其中Lakoff由此還提出了具身現(xiàn)象與語(yǔ)言認(rèn)知的關(guān)系货裹,這里面還牽扯到了沃爾夫和薩培爾提出的“語(yǔ)言決定論”嗤形,這一觀點(diǎn)認(rèn)為語(yǔ)言決定思維,一個(gè)人的思維形式是受他所沒有意識(shí)到的語(yǔ)言形式的那些不可抗拒的規(guī)律支配的弧圆。語(yǔ)言對(duì)于思維的認(rèn)識(shí)赋兵,毛總的導(dǎo)師不知道是不是也主要想解決這個(gè)理論問題呢?
順序數(shù)據(jù)——比如在這場(chǎng)馬拉松比賽中搔预,我們可以知道誰(shuí)先完成了比賽霹期,那么我們可以通過這個(gè)數(shù)據(jù)獲取了一下簡(jiǎn)單信息,比如說我在這個(gè)比賽中排名第13拯田,那么我就知道了你跟其他人的先后順序历造,如果再加上稱名數(shù)據(jù),那么我就可以說船庇,你比誰(shuí)誰(shuí)誰(shuí)差帕膜,你可以向誰(shuí)誰(shuí)誰(shuí)學(xué)習(xí),這種前后順序應(yīng)該也是根植在人類乃至生物的認(rèn)知基礎(chǔ)里面的溢十,你怎么知道誰(shuí)在前誰(shuí)在后,你可能說用手表可以知道前后达吞,你可以說空間位置前后张弛,誰(shuí)遮住誰(shuí),誰(shuí)比誰(shuí)小可以知道前后酪劫,但是關(guān)于前后的這個(gè)意識(shí)其實(shí)很復(fù)雜吞鸭,就問你一個(gè)問題,如何讓一個(gè)機(jī)器人在多變的外界環(huán)境中穩(wěn)定的得出誰(shuí)前誰(shuí)后覆糟?你知道這個(gè)有多難嗎刻剥?因?yàn)樗婕暗揭粋€(gè)將外界視覺信息進(jìn)行分析的過程,這個(gè)過程是我們意識(shí)不到的滩字。甚至在研究早期造虏,有人認(rèn)為是天賦的!但是隨著心理學(xué)的研究進(jìn)展麦箍,則發(fā)展出了三個(gè)主流觀點(diǎn)來進(jìn)行研究漓藕,
一個(gè)是心理物理學(xué)派,認(rèn)為外界生態(tài)提供了足夠的物理線索挟裂,我們只要讀取這些物理線索我們就可以判斷前后了享钞;
一個(gè)是推斷思路,也可以認(rèn)為是信息加工心理學(xué)學(xué)派的觀點(diǎn)诀蓉,認(rèn)為知覺這個(gè)過程栗竖,存在著一系列的信息加工過程暑脆,視覺感覺層面的信息輸入,之后知覺的實(shí)現(xiàn)狐肢,這個(gè)過程可能包含選擇添吗,編碼,加工处坪,提取的過程根资,之后存儲(chǔ)在語(yǔ)音環(huán)路上,以及記憶存儲(chǔ)區(qū)同窘,因?yàn)檫@種穩(wěn)定的前后知覺是如此的穩(wěn)定玄帕,它們是否儲(chǔ)存在一個(gè)長(zhǎng)時(shí)記憶里內(nèi)?這其實(shí)隱含著一個(gè)機(jī)器比喻想邦。
一個(gè)是生理學(xué)的視角裤纹,認(rèn)為是外界的刺激和內(nèi)在的生理器官有著映射關(guān)系,類似的情況是丧没,某年的諾貝爾生理學(xué)獎(jiǎng)獲得者在貓的大腦細(xì)胞中發(fā)現(xiàn)了對(duì)方向鹰椒、大小、動(dòng)作方位敏感的細(xì)胞呕童;
好像還有一個(gè)另外的思路漆际,就是通過電腦建模的方式來與實(shí)際人類實(shí)驗(yàn)數(shù)據(jù)進(jìn)行比較,這也是檢驗(yàn)的理論方式之一夺饲,通過各個(gè)理論思路去建模然后擬合之后奸汇,看下那個(gè)理論的建模數(shù)據(jù)和實(shí)際結(jié)果匹配。
等距數(shù)據(jù)——如果可以量化每個(gè)參加馬拉松人的分?jǐn)?shù)往声,那么這就是屬于等距數(shù)據(jù)擂找。等距數(shù)據(jù)已經(jīng)可以進(jìn)入科學(xué)研究的神圣殿堂了。這個(gè)似乎進(jìn)入了心理學(xué)的領(lǐng)域浩销,相比與前一個(gè)刺激強(qiáng)度贯涎,你主觀上感覺兩倍于之前的刺激強(qiáng)度,心理物理法在這個(gè)領(lǐng)域有了大量穩(wěn)定和可重復(fù)的研究?jī)?nèi)容慢洋。他的研究?jī)?nèi)容關(guān)注的是我們是否有著穩(wěn)定的與外界物理信息的對(duì)應(yīng)關(guān)系塘雳。這讓我又想到了知覺編碼領(lǐng)域的關(guān)于集群編碼的現(xiàn)象,為什么人們是只見森林而不見數(shù)目的呢普筹?
等比數(shù)據(jù)——如果能夠設(shè)定絕對(duì)零度那么就可以認(rèn)為是進(jìn)入了科學(xué)的神圣殿堂粉捻,這個(gè)所謂的絕對(duì)零度是基于物理的參考數(shù)據(jù)。比如說絕對(duì)零度的物理標(biāo)識(shí)
由此還對(duì)應(yīng)了相關(guān)的測(cè)量工具斑芜,順序數(shù)據(jù)所對(duì)應(yīng)的測(cè)量工具好像沒有肩刃,因?yàn)闋砍兜焦ぞ咧缶托枰蟹€(wěn)定的結(jié)構(gòu),否則這個(gè)工具本身的說服力是很差的,也就是說信度較差盈包。
4. 根據(jù)樣本數(shù)據(jù)計(jì)算拒絕區(qū)域
5.計(jì)算統(tǒng)計(jì)檢驗(yàn)量沸呐;我們需要計(jì)算抽樣樣本數(shù)據(jù)的均值,標(biāo)準(zhǔn)差等等描述性統(tǒng)計(jì)指標(biāo)呢燥,在這個(gè)過程中崭添,我們可能還要談到數(shù)據(jù)的缺失值和異常值問題,這些我們?cè)诖酥皇瞧饌€(gè)頭叛氨,后續(xù)會(huì)進(jìn)行補(bǔ)充呼渣。
6/利用相關(guān)的集中趨勢(shì)指標(biāo)和差異分布指標(biāo)進(jìn)行推斷統(tǒng)計(jì),其中選擇什么樣的統(tǒng)計(jì)推斷指標(biāo)寞埠,就需要考慮實(shí)驗(yàn)設(shè)計(jì)的具體情況屁置,也可以根據(jù)我們搜集到的數(shù)據(jù)類型進(jìn)行考慮: