數(shù)據(jù)的圖標展示
品質(zhì)數(shù)據(jù)整理與展示
頻數(shù)分布灵迫,分類數(shù)據(jù)圖示(條形——帕累托圖照雁,餅圖——環(huán)形圖)蚕愤,順序數(shù)據(jù)(累計頻數(shù))
數(shù)值型數(shù)據(jù)整理與展示
1數(shù)據(jù)分組
按變量分組與按組距分組:
基礎知識:上組限與下組限,組距的求得=(max-min)/組數(shù)饺蚊,組數(shù)一般[5,15]萍诱,上組限不在內(nèi)原則,組中值的取得=(下限+上限)/2污呼,用組中值代表一組數(shù)據(jù)的關鍵假設裕坊,各組數(shù)據(jù)在本組均勻分布在組中值兩側呈對稱分布
2圖示
分組數(shù)據(jù)采用直方圖
未分組采用莖葉圖和箱線圖(離群點用〇表示)
時間序列:線圖
多變量:散點,氣泡燕酷,雷達
數(shù)據(jù)的概括性度量
集中度測量
分類數(shù)據(jù):眾數(shù)籍凝;順序數(shù)據(jù):中位數(shù)和分位數(shù)周瞎;數(shù)值型數(shù)據(jù):平均數(shù)(加權,簡單平均饵蒂,幾何平均声诸,用于計算平均比率)
眾數(shù)與中位數(shù),平均值的比較:
左偏與右偏對應三者之間的關系應當是中位始終不變退盯,左偏均值降眾數(shù)升彼乌,右偏反之。
離散度測量
分類數(shù)據(jù):異眾比率
非眾數(shù)組的頻率占到總頻數(shù)的比率
順序數(shù)據(jù):四分位差
上四分位-下四分位渊迁,越小囤攀,意味著越兩者離中位數(shù)越接近,即集中度更高
數(shù)據(jù)值型數(shù)據(jù):方差與標準差
極差=max-min
平均差:平均絕對離差
方差:未分組與分組宫纬,注意樣本方差的自由度為樣本數(shù)-1(從向量角度,任何一個n維向量可以由n-1個向量表示)
標準差:具有量綱
標準分數(shù):z=(變量值-均值)/標準差膏萧,消除量綱差異
切比雪夫不等式:至少有(1-1/k^2)的數(shù)據(jù)落在±k個標準差之內(nèi)漓骚,其中k大于1
相對離散程度:離散系數(shù)
離散系數(shù)又稱變異系數(shù):標準差與均值的比。
偏態(tài)與峰態(tài)度量
偏態(tài)系數(shù)sk榛泛,1<sk或sk<-1蝌蹂,高度偏態(tài);0.5<sk<1或-1<sk<-0.5曹锨,中等偏態(tài)孤个;接近0對稱性越高。正值為右偏沛简,反之為左偏
峰態(tài)系數(shù)k齐鲤,k>0,尖峰分布椒楣,k<0给郊,扁平分布,參照標準正太