Data-導(dǎo)入數(shù)據(jù)2

從TXT | CSV文件讀取數(shù)據(jù):R基本函數(shù)


在前面荚斯,我們描述了R編程的要點(diǎn)和準(zhǔn)備數(shù)據(jù)的一些最佳實(shí)踐哭靖。

在本文中,您將學(xué)習(xí)如何將.txt(制表符分隔值)和.csv(逗號分隔值)文件格式的數(shù)據(jù)導(dǎo)入R寒波。


預(yù)備任務(wù)

啟動RStudio:運(yùn)行RStudio并設(shè)置工作目錄

準(zhǔn)備數(shù)據(jù):準(zhǔn)備數(shù)據(jù)的最佳實(shí)踐

用于導(dǎo)入數(shù)據(jù)的R基本函數(shù)

R base函數(shù)read.table()是一個通用函數(shù)吹害,可用于讀取表格式的文件均函。數(shù)據(jù)將作為數(shù)據(jù)框?qū)搿?/p>

請注意亿虽,根據(jù)文件格式的不同,read.table()的幾種變體可以使您的生活更輕松苞也,包括read.csv()洛勉、read.csv2()、read.delim()和read.delim2()如迟。

read.csv():用于讀取“逗號分隔符”文件(“.csv”)收毫。

read.csv2():用于使用逗號“,”作為小數(shù)點(diǎn)和分號“氓涣;”作為字段分隔符的文件牛哺。

read.delim():用于讀取“制表符分隔符”文件(“.txt”)。默認(rèn)情況下劳吠,點(diǎn)(“.”)用作小數(shù)點(diǎn)引润。

read.delim2():用于讀取“制表符分隔值”文件(“.txt”)。默認(rèn)情況下痒玩,逗號(“淳附,”)用作小數(shù)點(diǎn)。

這些函數(shù)的簡化格式如下:

#將表格數(shù)據(jù)讀入R

read.table(file, header = FALSE, sep = "", dec = ".")

#讀取“逗號分隔值”文件(“.csv”)

read.csv(file, header = FALSE, sep = ",", dec = ".",...)

#或者使用read.csv2,使用逗號作為小數(shù)點(diǎn)蠢古,使用分號作為字段分隔符奴曙。

read.csv2(file,header=TRUE草讶,sep=“洽糟;”,dec=“堕战,”坤溃,…)

#讀取制表符分隔的文件

read.delim(file,header=TRUE嘱丢,sep=“\t”薪介,dec=“.”,…)

read.delim2(file越驻,header=TRUE汁政,sep=“\t”道偷,dec=“,”记劈,…)

文件:包含要導(dǎo)入R的數(shù)據(jù)的文件的路徑勺鸦。

sep:字段分隔符字符∧磕荆“\t”用于制表符分隔的文件祝旷。

header:邏輯值。如果為TRUE嘶窄,read.table()假定文件有一個標(biāo)題行,因此第1行是每列的名稱距贷。如果不是這樣柄冲,可以添加參數(shù)header=FALSE。

dec:文件中用于小數(shù)點(diǎn)的字符忠蝗。


讀取本地文件

要導(dǎo)入本地.txt或.csv文件现横,語法如下:

#讀取一個名為“mtcars.txt”的txt文件

my_data<-read.delim(“mtcars.txt”)

#讀取一個名為“mtcars.csv”的csv文件

my_data<-read.csv(“mtcars.csv”)

上面的R代碼假設(shè)文件“mtcars.txt”或“mtcars.csv”在當(dāng)前工作目錄中。要知道當(dāng)前的工作目錄阁最,請在R控制臺中鍵入getwd()函數(shù)戒祠。

也可以使用函數(shù)file.choose()以交互方式選擇文件,如果您是R編程的初學(xué)者速种,我建議您這樣做:

#讀取txt文件

my_data<-read.delim(file.choose())

#讀取csv文件

my_data<-read.csv(file.choose())

如果在RStudio中使用上面的R代碼姜盈,系統(tǒng)會要求您選擇一個文件。

如果您的數(shù)據(jù)包含帶文本的列配阵,R可以假設(shè)列是一個因子或分組變量(例如:“good”馏颂、“good”、“bad”棋傍、“bad”救拉、“bad”)。如果不想將文本數(shù)據(jù)轉(zhuǎn)換為因子瘫拣,請在read.delim()亿絮、read.csv()和read.table()函數(shù)中添加stringsAsFactor=FALSE。在這種情況下麸拄,與文本文件中的字符串對應(yīng)的數(shù)據(jù)框列將是字符派昧。

例如:

my_data<-read.delim(file.choose(),

stringsAsFactor=FALSE)

如果字段分隔符是例如“|”感帅,則可以將常規(guī)函數(shù)read.table()與其他參數(shù)一起使用:

my_data<-read.table(file.choose()斗锭,

sep=“|”,header=TRUE失球,dec=“.”)

從internet讀取文件

可以使用函數(shù)read.delim()岖是、read.csv()和read.table()從web導(dǎo)入文件帮毁。

my_data<-read.delim(“http://www.sthda.com/upload/boxplot_format.txt”)


總結(jié)

導(dǎo)入本地.txt文件:read.delim(file.choose())

導(dǎo)入本地.csv文件:read.csv(file.choose())

從internet導(dǎo)入文件:如果是txt文件,則為read.delim(url)豺撑;如果是csv文件烈疚,則為read.csv(url)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市聪轿,隨后出現(xiàn)的幾起案子爷肝,更是在濱河造成了極大的恐慌,老刑警劉巖陆错,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件灯抛,死亡現(xiàn)場離奇詭異,居然都是意外死亡音瓷,警方通過查閱死者的電腦和手機(jī)对嚼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來绳慎,“玉大人纵竖,你說我怎么就攤上這事⌒臃撸” “怎么了靡砌?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長珊楼。 經(jīng)常有香客問我通殃,道長,這世上最難降的妖魔是什么亥曹? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任邓了,我火速辦了婚禮,結(jié)果婚禮上媳瞪,老公的妹妹穿的比我還像新娘骗炉。我一直安慰自己,他們只是感情好蛇受,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布句葵。 她就那樣靜靜地躺著,像睡著了一般兢仰。 火紅的嫁衣襯著肌膚如雪乍丈。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天把将,我揣著相機(jī)與錄音轻专,去河邊找鬼。 笑死察蹲,一個胖子當(dāng)著我的面吹牛请垛,可吹牛的內(nèi)容都是我干的催训。 我是一名探鬼主播,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼宗收,長吁一口氣:“原來是場噩夢啊……” “哼漫拭!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起混稽,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤采驻,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后匈勋,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體礼旅,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年洽洁,在試婚紗的時候發(fā)現(xiàn)自己被綠了各淀。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡诡挂,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出临谱,到底是詐尸還是另有隱情璃俗,我是刑警寧澤,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布悉默,位于F島的核電站城豁,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏抄课。R本人自食惡果不足惜唱星,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望跟磨。 院中可真熱鬧间聊,春花似錦、人聲如沸抵拘。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽僵蛛。三九已至尚蝌,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間充尉,已是汗流浹背飘言。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留驼侠,地道東北人姿鸿。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓谆吴,卻偏偏與公主長得像,于是被迫代替她去往敵國和親般妙。 傳聞我的和親對象是個殘疾皇子纪铺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容

  • 數(shù)據(jù)的導(dǎo)入 參考文章 在R語言中,常常用到導(dǎo)入數(shù)據(jù)的源文件是Excel文件碟渺,CSV文件鲜锚,文本文件等等。 導(dǎo)入csv...
    天涯清水閱讀 33,209評論 0 13
  • 在前一章中苫拍,我們描述了R編程的要點(diǎn)芜繁。在這里,您將學(xué)習(xí)如何將數(shù)據(jù)從txt绒极、csv骏令、Excel(xls、xlsx)導(dǎo)入...
    小白_加油閱讀 721評論 0 1
  • pyspark.sql模塊 模塊上下文 Spark SQL和DataFrames的重要類: pyspark.sql...
    mpro閱讀 9,446評論 0 13
  • 官網(wǎng) 中文版本 好的網(wǎng)站 Content-type: text/htmlBASH Section: User ...
    不排版閱讀 4,367評論 0 5
  • 思涵每日贈言:一滴水是平凡的垄提,它勢單力薄榔袋,隨時可能被熱氣蒸發(fā),然而就是這一滴平凡的水铡俐,如果是成千上萬地匯聚在一起凰兑,...
    魅力提升與成長閱讀 257評論 2 5