數(shù)據(jù)分析的前提是數(shù)據(jù)的搜集與加工處理
1.1 數(shù)據(jù)分組與變量數(shù)列
1.1.1 數(shù)據(jù)分組
數(shù)據(jù)分組 就是對某一變量不同取值祥诽,按照其自身變動特點和研究需要劃分成不同的組別泡一,以便更好地研究該變量分布特征及變動規(guī)律
變量
類型
- 離散變量:指變量值可以按一定順序一一列舉府阀,通常以整數(shù)位取值的變量
- 連續(xù)變量:在一定區(qū)間內(nèi)可以任意取值的變量叫連續(xù)變量, 其數(shù)值是連續(xù)不斷的, 相鄰兩個數(shù)值可作無限分割,即可取無限個數(shù)值。
分組
- 單項分組
若變量是離散型變量,且取值只有不多的幾個
做法:將變量的不同取值作為一組的組別,變量有多少個不同取值就劃分多少組 - 組距分組
若變量是連續(xù)型變量喉磁, 或者是取值較多的離散型變量
做法:將變量的全部取值按照其大小順序劃分成若干個不同的數(shù)值區(qū)間
1.1.2 變量數(shù)列
變量數(shù)列是指在對變量取值進行分組的基礎(chǔ)上,將各組不同的變量值與其變量值出現(xiàn)的次數(shù)排列成的數(shù)列
由于對變量分組有單項分組和組距分組兩種不同的方法官脓,因而分組后形成的變量數(shù)列也有單項數(shù)列和組距數(shù)列兩種
兩個要素
- 由不同變量所劃分的組协怒,稱為組別
- 各組變量值出現(xiàn)的次數(shù),亦稱頻數(shù)
各組次數(shù)與總次數(shù)之比叫比率卑笨,又稱頻率
在變量數(shù)列中孕暇,由不同變量取值組成的組別表示變量的變動幅度,而頻數(shù)和頻率則表示相對應(yīng)的變量值對其平均水平的作用程度。頻數(shù)(頻率)愈大的組所對應(yīng)的變量值對其平均水平的作用也愈大 ;反之妖滔, 頻數(shù)(頻率)愈小的組所對應(yīng)的變量值對其平均水平的作用也愈小隧哮。因此,在變量數(shù)列的條件下座舍,當對變量值求算術(shù)平均數(shù)時沮翔,頻數(shù)和頻率均作為權(quán)數(shù),頻數(shù)看做為絕對權(quán)數(shù)簸州,用f表示 ;頻率看做為相對權(quán)數(shù)鉴竭,用
1.2 分布中心的測度
1.3 離散程度的測度
1.4 偏度與峰度
1.5 兩個變量的相關(guān)關(guān)系
字符ddd
(簡短文字添加代碼框)
Tab dddd
或四個空格(大段文字添加代碼框歧譬,每行前添加)
@requires_authorization
def somefunc(param1='', param2=0):
'''A docstring'''
if param1 > param2: # interesting
print 'Greater'
return (param2 - param1 + 1) or None
class SomeClass:
pass
>>> message = '''interpreter
... prompt'''
left | center | right |
---|---|---|
aaaa | bbbbbb | ccccc |
a | b | c |
內(nèi)部嵌套
內(nèi)部嵌套2
標題1
科學公式 TeX(KaTeX)
ddd
- Item 1
- Item 2
- Item 1
- Item 1
- Item 1
- 嵌套列表1
- 嵌套列表1a
- 嵌套列表1b
- 嵌套列表1ai
- 嵌套列表1aix
- 嵌套列表2