《學(xué)習(xí)小組Day6筆記--高乃林》
轉(zhuǎn)眼間就到了倒數(shù)第二天钉凌,入門到時入了腐魂,但離自己的理想預(yù)期還有很大的差距帐偎,慢慢來,先把作業(yè)做了蛔屹。
安裝dplyr包并加載削樊,然后再開始搞事情。
這么說兔毒,test取的是數(shù)據(jù)集里的(1,2,51,52,101漫贞,102列)。Mutate加了一列育叁,名稱為new的數(shù)據(jù)迅脐。
我自己搞了一個名稱為new1的數(shù)據(jù)。
但很明顯豪嗽,剛剛建立的new的一列谴蔑,并沒有保存下來,所以我建了新的new1的時候昵骤,new已經(jīng)不見了树碱。而且,連我剛剛創(chuàng)的new1也沒能保存变秦?成榜??見下圖
繼續(xù)往下走蹦玫,肯定有可以保存的方法的赎婚。
下面分別是篩選刘绣、排列、匯總的函數(shù)挣输,都是比較好理解的纬凤。不過多展示。
實(shí)用技能中的管道還好理解撩嚼,就是相當(dāng)于限定條件停士,比如下面代碼說的就是test數(shù)據(jù)中,根據(jù)species分組完丽,并計(jì)算每一組的Sepal.Length的mean恋技,和Sepal.Length的sd。
count統(tǒng)計(jì)某列的unique值逻族?蒙了一下蜻底。
但反應(yīng)過來了,就是test有6行聘鳞,每個species都有2行薄辅。
即是說不重復(fù)的species有2行。所以是n=2抠璃。
下一步就遇到了問題了站楚。
options(stringsAsFactors = F)函數(shù)不懂什么意思。查了一下:strings是“字符串”鸡典,F(xiàn)actors是“因子”源请。如名稱通常是字符串枪芒,而指標(biāo)是因子彻况。如果在建立數(shù)據(jù)框的時候,將字符串設(shè)置為因子舅踪,那么數(shù)據(jù)名稱就被“因子化”了纽甘。所以,不能將其字符因子化抽碌。但為什么呢悍赢??但會試試不加他會怎么樣货徙。
一步步走左权,跟教程的一樣,沒什么意思痴颊。
那么試試因子化會怎么樣呢赏迟?
好像也沒什么變化呀!4览狻锌杀!
剩下也沒什么好展示的了甩栈。
結(jié)束今天的學(xué)習(xí)。
留了兩個問題:①怎么保存新創(chuàng)的數(shù)據(jù)糕再?②options(stringsAsFactors = F)函數(shù)有什么用量没?自己先搜索解決。