第一章 數(shù)據(jù)分析的基礎(chǔ)

數(shù)據(jù)分析的前提是數(shù)據(jù)的搜集與加工處理

1.1 數(shù)據(jù)分組與變量數(shù)列

1.1.1 數(shù)據(jù)分組

數(shù)據(jù)分組 就是對某一變量不同取值祥诽,按照其自身變動特點和研究需要劃分成不同的組別泡一,以便更好地研究該變量分布特征及變動規(guī)律

變量

類型

  • 離散變量:指變量值可以按一定順序一一列舉府阀,通常以整數(shù)位取值的變量
  • 連續(xù)變量:在一定區(qū)間內(nèi)可以任意取值的變量叫連續(xù)變量, 其數(shù)值是連續(xù)不斷的, 相鄰兩個數(shù)值可作無限分割,即可取無限個數(shù)值。

分組

  • 單項分組
    若變量是離散型變量,且取值只有不多的幾個
    做法:將變量的不同取值作為一組的組別,變量有多少個不同取值就劃分多少組
  • 組距分組
    若變量是連續(xù)型變量喉磁, 或者是取值較多的離散型變量
    做法:將變量的全部取值按照其大小順序劃分成若干個不同的數(shù)值區(qū)間

1.1.2 變量數(shù)列

變量數(shù)列是指在對變量取值進行分組的基礎(chǔ)上,將各組不同的變量值與其變量值出現(xiàn)的次數(shù)排列成的數(shù)列
由于對變量分組有單項分組和組距分組兩種不同的方法官脓,因而分組后形成的變量數(shù)列也有單項數(shù)列和組距數(shù)列兩種

兩個要素
  1. 由不同變量所劃分的組协怒,稱為組別
  2. 各組變量值出現(xiàn)的次數(shù),亦稱頻數(shù)

各組次數(shù)與總次數(shù)之比叫比率卑笨,又稱頻率

在變量數(shù)列中孕暇,由不同變量取值組成的組別表示變量的變動幅度,而頻數(shù)和頻率則表示相對應(yīng)的變量值對其平均水平的作用程度。頻數(shù)(頻率)愈大的組所對應(yīng)的變量值對其平均水平的作用也愈大 ;反之妖滔, 頻數(shù)(頻率)愈小的組所對應(yīng)的變量值對其平均水平的作用也愈小隧哮。因此,在變量數(shù)列的條件下座舍,當對變量值求算術(shù)平均數(shù)時沮翔,頻數(shù)和頻率均作為權(quán)數(shù),頻數(shù)看做為絕對權(quán)數(shù)簸州,用f表示 ;頻率看做為相對權(quán)數(shù)鉴竭,用\frac{f}{\sum f}


1.2 分布中心的測度


1.3 離散程度的測度


1.4 偏度與峰度


1.5 兩個變量的相關(guān)關(guān)系


字符ddd(簡短文字添加代碼框)
Tab dddd或四個空格(大段文字添加代碼框歧譬,每行前添加)

@requires_authorization
def somefunc(param1='', param2=0):
    '''A docstring'''
    if param1 > param2: # interesting
        print 'Greater'
    return (param2 - param1 + 1) or None
class SomeClass:
    pass
>>> message = '''interpreter
... prompt'''
left center right
aaaa bbbbbb ccccc
a b c

內(nèi)部嵌套

內(nèi)部嵌套2

標題1

科學公式 TeX(KaTeX)
ddd

  • Item 1
  • Item 2
  1. Item 1
  2. Item 1
  3. Item 1
  • 嵌套列表1
    • 嵌套列表1a
    • 嵌套列表1b
    • 嵌套列表1ai
      • 嵌套列表1aix
  • 嵌套列表2

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末岸浑,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子瑰步,更是在濱河造成了極大的恐慌矢洲,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,816評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件缩焦,死亡現(xiàn)場離奇詭異读虏,居然都是意外死亡,警方通過查閱死者的電腦和手機袁滥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評論 3 385
  • 文/潘曉璐 我一進店門盖桥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人题翻,你說我怎么就攤上這事揩徊。” “怎么了嵌赠?”我有些...
    開封第一講書人閱讀 158,300評論 0 348
  • 文/不壞的土叔 我叫張陵塑荒,是天一觀的道長。 經(jīng)常有香客問我姜挺,道長齿税,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,780評論 1 285
  • 正文 為了忘掉前任炊豪,我火速辦了婚禮凌箕,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘词渤。我一直安慰自己牵舱,他們只是感情好,可當我...
    茶點故事閱讀 65,890評論 6 385
  • 文/花漫 我一把揭開白布掖肋。 她就那樣靜靜地躺著仆葡,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上沿盅,一...
    開封第一講書人閱讀 50,084評論 1 291
  • 那天把篓,我揣著相機與錄音,去河邊找鬼腰涧。 笑死韧掩,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的窖铡。 我是一名探鬼主播疗锐,決...
    沈念sama閱讀 39,151評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼费彼!你這毒婦竟也來了滑臊?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,912評論 0 268
  • 序言:老撾萬榮一對情侶失蹤箍铲,失蹤者是張志新(化名)和其女友劉穎雇卷,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體颠猴,經(jīng)...
    沈念sama閱讀 44,355評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡关划,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,666評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了翘瓮。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贮折。...
    茶點故事閱讀 38,809評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖资盅,靈堂內(nèi)的尸體忽然破棺而出调榄,到底是詐尸還是另有隱情,我是刑警寧澤律姨,帶...
    沈念sama閱讀 34,504評論 4 334
  • 正文 年R本政府宣布振峻,位于F島的核電站,受9級特大地震影響择份,放射性物質(zhì)發(fā)生泄漏扣孟。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,150評論 3 317
  • 文/蒙蒙 一荣赶、第九天 我趴在偏房一處隱蔽的房頂上張望凤价。 院中可真熱鬧,春花似錦拔创、人聲如沸利诺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽慢逾。三九已至立倍,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間侣滩,已是汗流浹背口注。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留君珠,地道東北人寝志。 一個月前我還...
    沈念sama閱讀 46,628評論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像策添,于是被迫代替她去往敵國和親材部。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,724評論 2 351