學(xué)習(xí)R噩茄,一方面來源于身邊師兄的耳濡目染,一直對其充滿了向往和好奇复颈;另一方面巢墅,確實(shí)也見識(shí)過用R畫出來的圖表,完全不是matlab之類數(shù)據(jù)分析軟件能達(dá)到的美觀券膀。所以帶著這樣的一種心情,開始學(xué)習(xí)R驯遇。
看的是《R語言實(shí)戰(zhàn)》芹彬,一直覺得實(shí)例驅(qū)動(dòng)才是最快最扎實(shí)的學(xué)習(xí)方法。當(dāng)然除了看書之外還得做筆記叉庐,寫下一些重點(diǎn)抑或是心得舒帮。
那就開始吧~
要思考的是?
如何才能成功地處理陡叠、分析和理解數(shù)據(jù)玩郊?書中的作者是這么說的:
1. 獲取數(shù)據(jù):從各種數(shù)據(jù)源將數(shù)據(jù)導(dǎo)入程序;
2. 整理數(shù)據(jù):編碼缺失值、修復(fù)或刪除錯(cuò)誤數(shù)據(jù)枉阵、將變量轉(zhuǎn)換成更方便的格式;
3. 注釋數(shù)據(jù):以記住每段數(shù)據(jù)的含義;
4. 總結(jié)數(shù)據(jù):通過描述性統(tǒng)計(jì)量了解數(shù)據(jù)的概況;
5. 數(shù)據(jù)可視化:一圖勝千言;
6. 數(shù)據(jù)建模:解釋數(shù)據(jù)間的關(guān)系,檢驗(yàn)假設(shè);
7. 整理結(jié)果:創(chuàng)建具有出版水平的表格和圖形译红。
該有怎樣的心態(tài)?
學(xué)習(xí)之前一直聽師兄們說R有多難多難兴溜,看作者寫的序言也是一遍遍強(qiáng)調(diào)自己學(xué)R有多少次“想得太過簡單”侦厚。
如果你問兩個(gè)統(tǒng)計(jì)學(xué)家該如何分析一個(gè)數(shù)據(jù)集耻陕,你會(huì)得到三個(gè)答案。反過來說刨沦,每個(gè)答案都能讓你更好地理解數(shù)據(jù)集诗宣。
對于一個(gè)問題,也許沒有唯一最好的解決方法想诅,但是無論如何都需要自己不斷嘗試不斷親身去體會(huì)召庞。
R是交互式的,最好的學(xué)習(xí)方法就是自己嘗試来破。
所以話不多說篮灼,開始吧!