受?統(tǒng)計之都?推薦文章“如何學習統(tǒng)計學乾吻,或我的學習之路——初學者寫給初學者”(胡江堂髓梅,2008-11-20)啟發(fā),“……在統(tǒng)計學習方面绎签,你可以一開始就把自己的努力建立在一個較高的水平上:讀安德森或林德枯饿。”诡必,踏上經(jīng)典閱讀之路奢方。
本讀書筆記選編自:《商務與經(jīng)濟統(tǒng)計學》(原書第12版),David R.Anderson等爸舒,辛辛那提大學蟋字,機械業(yè)出版社。
第一章 數(shù)據(jù)與統(tǒng)計資料
1.1 ? ?開宗明義
關(guān)于本書:概念性介紹統(tǒng)計學及其各種應用方面的知識扭勉。
關(guān)于統(tǒng)計學:研究不確定性現(xiàn)象數(shù)量規(guī)律的方法論科學鹊奖。收集、分析涂炎、表述和解釋數(shù)據(jù)的科學與藝術(shù)忠聚。
關(guān)于商務統(tǒng)計學:統(tǒng)計學在商務和經(jīng)濟中的應用,即在商務和經(jīng)濟活動中唱捣,幫助管理者理解變化两蟀,做出科學正確的決策。舉例:會計震缭、財務赂毯、市場營銷、生產(chǎn)(質(zhì)量管理)拣宰、經(jīng)濟党涕、信息系統(tǒng)等。
1.2~1.3 ? ?數(shù)據(jù)與數(shù)據(jù)來源
數(shù)據(jù)集:個體(數(shù)據(jù)實體)徐裸、變量(特征描述)遣鼓、觀測值(測量值)
四種測量尺度:決定了數(shù)據(jù)中的信息量,包括:1)名義尺度(可標記類別)重贺、2)順序尺度(可區(qū)分等級)、3)間隔尺度(可數(shù)值排序)回懦、4)比率尺度(存在有意義的數(shù)值比)气笙,是初級到高級的“層級遞進”。
分類型和數(shù)值型數(shù)據(jù):為了統(tǒng)計分析的目的怯晕,對數(shù)據(jù)的進一步劃分為分類型數(shù)據(jù)和數(shù)值型數(shù)據(jù)潜圃。分類型數(shù)據(jù)用上述1)2)度量,數(shù)值型數(shù)據(jù)用上述3)4)度量舟茶。注意谭期,當數(shù)據(jù)是數(shù)值型時堵第,算術(shù)運算才有意義,同時有更多的統(tǒng)計分析方法可供選擇隧出。
1.4? ? 描述統(tǒng)計
描述統(tǒng)計:將數(shù)據(jù)以表格踏志、圖形、數(shù)值形式匯總的統(tǒng)計方法胀瞪。如表格匯總针余、圖形匯總(條形圖、直方圖)凄诞、平均數(shù)圆雁、中位數(shù)等。
1.5~1.6 ? ?統(tǒng)計推斷帆谍、計算機與統(tǒng)計數(shù)據(jù)
基本概念:總體伪朽、樣本、普查汛蝙、抽樣調(diào)查
統(tǒng)計推斷:利用樣本數(shù)據(jù)對總體特征進行估算和假設(shè)檢驗驱负。例如,計算抽樣數(shù)據(jù)的平均値患雇,推斷所有燈泡的平均使用壽命跃脊。
大量數(shù)據(jù)處理,需要使用計算機進行分析苛吱。
1.7 ? ?數(shù)據(jù)挖掘
數(shù)據(jù)挖掘:研究從大數(shù)據(jù)中開發(fā)有用的決策信息的方法酪术。例如,電商的關(guān)聯(lián)產(chǎn)品推薦等翠储。常用的數(shù)據(jù)挖掘方法有:多元回歸绘雁、邏輯回歸、人工智能援所、機器學習等庐舟。
1.8 ? ?統(tǒng)計實踐的道德準則
統(tǒng)計研究中的不道德行為:不正確的抽樣,不恰當?shù)臄?shù)據(jù)分析住拭,誤導性的圖表繪制挪略,不恰當?shù)褪褂媒y(tǒng)計摘要,統(tǒng)計結(jié)果片面解釋
要保持公平滔岳、謹慎杠娱、客觀、中立的態(tài)度谱煤。同時也應注意到他人在統(tǒng)計過程中的不道德行為的可能性摊求。
1.9????本章小結(jié)
第二章 描述統(tǒng)計學一:表格法和圖形法
2.1 ? ?匯總分類變量數(shù)據(jù)
頻數(shù)分布:一種數(shù)據(jù)的表格匯總,表示在幾個互不重疊組別中的每一組項目的個數(shù)(即頻數(shù))刘离。如對一份飲料購買樣本數(shù)據(jù)做頻數(shù)匯總室叉,出現(xiàn)的頻數(shù)越高表明其越受歡迎睹栖。
相對頻數(shù)分布:組的相對頻數(shù)=組的頻數(shù)/n,總和為1茧痕;其分布即數(shù)據(jù)的表格匯總野来。
百分比頻數(shù)分布:百分比頻數(shù)=相對頻數(shù)x100,總和為100凿渊;其分布即數(shù)據(jù)的表格匯總梁只。
條形圖、餅形圖(略):建議吧頻數(shù)較小的組合合并為“其他”埃脏。
2.2????匯總?數(shù)量型數(shù)據(jù)
頻數(shù)分布的定義適用于數(shù)量型數(shù)據(jù)搪锣。確定其頻數(shù)分布組時,有三個必要步驟:1)確定互不重疊的組數(shù)彩掐;2)確定的寬度构舟;3)確定組限。
實際操作:1)確定組數(shù):一般5~20組堵幽。2)確定組寬:近似組寬=(數(shù)據(jù)最大值-數(shù)據(jù)最小值)/組數(shù)狗超;3)確定組限:必須使每一個數(shù)據(jù)值只屬于一組。4)組中值:上下限的中間值
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 2018.06.09 ? ? ?to be continued