函數(shù)或者命令不會(huì)用時(shí)奈偏,除了百度/谷歌搜索以外萍膛,用這個(gè)命令查看幫助:?read.table血崭,調(diào)出對應(yīng)的幫助文檔雨让,翻到example部分研究一下雇盖。
向量
1.標(biāo)量和向量的區(qū)分
標(biāo)量:一個(gè)元素組成的變量
向量:多個(gè)元素組成的變量
2.從向量中提取元素
根據(jù)元素位置
根據(jù)值
數(shù)據(jù)框
讀取本地?cái)?shù)據(jù)
1.需要載入的文件,記得一定要放在工作目錄里
read.table(file = '2.txt',sep = '\t',header = T)
2.header=TRUE代表讀入數(shù)據(jù)時(shí)將第一行作為列名(若是FALSE則相反栖忠,不使用文件中第一行作為列名)崔挖,也可以簡寫問header=T(或是header=F)
3.多數(shù)情況下, seq 參數(shù)用來指定字符的分隔符號(hào)庵寞。不僅用輸出狸相,也用在輸入,也用在字符串的合并與拆分上捐川。
csv 文件是用逗號(hào)分隔的脓鹃,故而 sep = ","
tsv 文件是用制表符分隔的,故而 sep = "\t"
常用的分隔符還有空格 sep = " "
分隔符是任意的古沥,可根據(jù)具體情況指定的将谊。
在輸入的時(shí)候,原內(nèi)容是用什么符號(hào)分隔的渐白,sep就要保持一致尊浓,否則可能無法正確讀取。在輸出時(shí)雖說分隔符是可以任意指定纯衍,但也要遵循一個(gè)原則栋齿,就是分隔符號(hào)不要與待輸出內(nèi)容中的字符有重復(fù)。否則輸出后的文件襟诸,重新讀取的時(shí)候該分隔符并不能有效正確分開瓦堵,可能出錯(cuò)。
設(shè)置行名和列名
1.colnames(X)[1]<-"bioplanet"##有的公司返回?cái)?shù)據(jù)歌亲,左上角第一格為空菇用,R會(huì)自動(dòng)補(bǔ)為x,用這個(gè)命令來修改
2.X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)##最后row.names的意思是修改第一列為行名
數(shù)據(jù)框的導(dǎo)出
write.table(X,file = "yu.txt",sep = ",",quote=F)
quote:字符串是否使用引號(hào)表示,默認(rèn)為TRUE陷揪,也就是使用引號(hào)表示
變量的保存與重新加載
save.image()
load("test.RData")
提取元素
X$列名#也可以提取列(優(yōu)秀寫法惋鸥,而且這個(gè)命令還優(yōu)秀到不用寫括號(hào)的地步,并且支持Tab自動(dòng)補(bǔ)全哦悍缠,不過只能提取一列)
直接使用數(shù)據(jù)框中的變量
將數(shù)據(jù)框名添加到搜索環(huán)境中:attach(a)
做完后將a刪除出搜索環(huán)境 detach(a)
局限性:兩個(gè)以上數(shù)據(jù)框的列名有沖突時(shí)卦绣,同時(shí)attach會(huì)報(bào)錯(cuò)。
附加題目
save(X,file="test.RData")這句代碼如果報(bào)錯(cuò)object X not found飞蚓,是為什么滤港,應(yīng)該怎么解決?
答:運(yùn)行X