2023-06-02

R語言summary函數(shù)的詳解

一晨缴、R語言summary函數(shù)模型

在R語言中译秦,summary()函數(shù)是一個(gè)重要的統(tǒng)計(jì)分析函數(shù),用于對一維統(tǒng)計(jì)特征進(jìn)行計(jì)算并作出摘要击碗。在R語言統(tǒng)計(jì)分析的各種數(shù)據(jù)表中筑悴,summary() 函數(shù)經(jīng)常用于數(shù)據(jù)預(yù)處理和探索性分析。

具體地說稍途,summary() 函數(shù)用于將向量阁吝、因子和數(shù)據(jù)框中的數(shù)據(jù)計(jì)算指定的統(tǒng)計(jì)特征。這些統(tǒng)計(jì)特征包括最小值晰房,最大值求摇,中位數(shù)射沟,平均值和四分位數(shù)等殊者。summary()函數(shù)的結(jié)果通常呈現(xiàn)為一個(gè)表格或列表。

# 一個(gè)簡單的例子:用summary函數(shù)統(tǒng)計(jì)向量的統(tǒng)計(jì)特征

vec <- rnorm(100)

summary(vec)

二验夯、R語言summary函數(shù)怎么用

summary() 函數(shù)的第一個(gè)參數(shù)可以是向量猖吴,矩陣、因子或數(shù)據(jù)框挥转。summary() 函數(shù)的行為因輸入類型的不同而不同海蔽。

向量:?如果輸入是向量,那么summary() 函數(shù)會計(jì)算它的最小值绑谣,最大值党窜,中位數(shù),平均值和四分位數(shù)等值借宵。在這些值中幌衣,僅計(jì)算有意義的值,并且忽略非數(shù)值。如果向量中包含無效值(例如NaN或NA)豁护,那么這些值在計(jì)算中也不會考慮哼凯。

矩陣:?如果輸入是矩陣,那么summary() 函數(shù)將每行都當(dāng)作一個(gè)向量并計(jì)算每一列的統(tǒng)計(jì)特征楚里。因此断部,輸出結(jié)果通常為每一列的統(tǒng)計(jì)特征表格

因子:?如果輸入是因子,那么summary() 函數(shù)將對因子級別進(jìn)行計(jì)數(shù)班缎,并將其呈現(xiàn)為表格蝴光。 輸出結(jié)果包含每個(gè)因子級別的計(jì)數(shù)。

數(shù)據(jù)框:?如果輸入是數(shù)據(jù)框达址,那么summary() 函數(shù)將按列計(jì)算每個(gè)列的統(tǒng)計(jì)特征盹靴。因此,輸出結(jié)果通常為每個(gè)列的統(tǒng)計(jì)特征表格徙邻。

三搁嗓、R語言names函數(shù)

在使用summary() 函數(shù)時(shí)可以添加names參數(shù),以重命名輸出結(jié)果中的變量右冻。names()函數(shù)與R語言中data.frame里面的列名類似装蓬,它可以用于給輸出結(jié)果的每個(gè)變量賦予新的名稱。這樣給每一個(gè)變量命名或者給部分變量命名纱扭,會使R語言程序閱讀和處理結(jié)果文件時(shí)更為容易牍帚。

#一個(gè)例子: 修改summary()函數(shù)輸出結(jié)果的命名

vec <- rnorm(100)

summary(vec, name = "MyVector")

四、R語言summary函數(shù)是什么意思

與R語言summary函數(shù)類似的是乳蛾,sum()函數(shù)是另一個(gè)廣泛使用的函數(shù)暗赶。盡管sum()函數(shù)也用于計(jì)算統(tǒng)計(jì)特征,但它的使用范圍更少肃叶。sum()函數(shù)計(jì)算向量蹂随、矩陣和數(shù)組的元素和。而r語言summary函數(shù)計(jì)算各種統(tǒng)計(jì)特征因惭。因此岳锁,它們在用途和輸出結(jié)果上有很大的區(qū)別。

五蹦魔、R語言summary函數(shù)各含義

summary() 函數(shù)的輸出結(jié)果有助于理解數(shù)據(jù)的范圍和分布激率。輸出結(jié)果包含了五條統(tǒng)計(jì)特征的值,這些特征用無色背景表示勿决。除此之外乒躺,如果數(shù)據(jù)中有空的或不適當(dāng)?shù)闹担@些值也可以用顏色表示低缩。常用的統(tǒng)計(jì)指標(biāo)及其含義如下:

Min(最小值):?最小觀測值嘉冒,即最小的可用數(shù)據(jù)點(diǎn)。

1Q(下四分位數(shù)):數(shù)據(jù)的下四分位數(shù)。四分位數(shù)是數(shù)據(jù)集的四個(gè)等分點(diǎn)健爬,將數(shù)據(jù)集分為四個(gè)等分控乾。在這種情況下,數(shù)據(jù)被分為四個(gè)部分娜遵,每個(gè)部分包含25%的數(shù)據(jù)蜕衡。

Median(中位數(shù)):?中位數(shù)是數(shù)據(jù)集的中心值。如果數(shù)據(jù)集有偶數(shù)個(gè)數(shù)據(jù)點(diǎn)设拟,則中位數(shù)有兩個(gè)慨仿。在這種情況下,兩個(gè)中位數(shù)的平均值被認(rèn)為是整個(gè)數(shù)據(jù)集的中位數(shù)纳胧。

Mean(平均數(shù)):?平均值是數(shù)據(jù)集中所有值的總和除以值的數(shù)量镰吆。在統(tǒng)計(jì)分析和數(shù)據(jù)科學(xué)中,平均值通常用來表示數(shù)據(jù)集的一般趨勢跑慕。

3Q(上四分位數(shù)):數(shù)據(jù)的上四分位數(shù)万皿。

Max(最大值):?最大觀測值,即可用數(shù)據(jù)所達(dá)到的最大值核行。

NA(無效值):?無效值表示缺少值或無效值牢硅。它們會影響數(shù)據(jù)集的總和和其他統(tǒng)計(jì)信息。

六芝雪、R語言summary函數(shù)用法

在R語言中减余,summary()函數(shù)被廣泛應(yīng)用于統(tǒng)計(jì)分析和數(shù)據(jù)探索。它可以幫助研究人員快速分析和理解數(shù)據(jù)集的特征惩系。summary() 函數(shù)的輸出結(jié)果可以讓研究人員快速了解數(shù)據(jù)的最小值位岔、最大值、中位數(shù)等重要信息堡牡。

七抒抬、R語言summary函數(shù)的功能

summary() 函數(shù)是一個(gè)強(qiáng)大的工具,它可以用來識別數(shù)據(jù)集中的異常值悴侵、探索數(shù)據(jù)集的分布瞧剖、縮短數(shù)據(jù)預(yù)處理的時(shí)間等。summary() 函數(shù)還可以被用于比較不同數(shù)據(jù)集之間的差異可免,例如,它可以用于比較兩個(gè)相同的變量的分布或數(shù)據(jù)集中的子集的分布做粤。

八浇借、R語言summary函數(shù)的決定系數(shù)

在統(tǒng)計(jì)分析中,匯總結(jié)果和決策根據(jù)其決定系數(shù)的大小怕品,選擇匯總方法和根據(jù)決定系數(shù)的大小調(diào)整匯總結(jié)果的顯示方式妇垢。

決定系數(shù)中參數(shù)的含義如下:

同步表中的R2:此項(xiàng)為最后公式的決定系數(shù),它反映自變量與應(yīng)變量之間的關(guān)系程度的強(qiáng)度。R2從0到1變化闯估。R2為1時(shí)灼舍,所有觀察值均在回歸曲線上,表明自變量完全解釋實(shí)變量的方差涨薪;當(dāng)R2趨向于0時(shí)骑素,自變量解釋的實(shí)變量的方差極小。

同步表中的RSE:均方根誤差是回歸直線到各觀察點(diǎn)的距離的平均值刚夺,RSE越小則回歸直線更符合觀察點(diǎn)數(shù)據(jù)献丑。

同步表中的F值:是估計(jì)的回歸方程的“合適性”指標(biāo),較大的F-值表示應(yīng)該拒絕H0假設(shè)侠姑,即表明所有自變量的系數(shù)不是零创橄。

同步表中的p值:是用于決定輕還是重要的關(guān)鍵,p-值很忻Ш臁(0.05以下)可能表示的是我們的結(jié)果具有顯著差異妥畏。p-值較大的情況下,我們無法排除這樣的假設(shè):"我們觀察到的結(jié)果只是由于原因純粹是由于隨機(jī)性/概率性"

九安吁、R語言summary函數(shù)在哪個(gè)包

R語言自帶的統(tǒng)計(jì)分析包中就包括了summary()函數(shù)咖熟,無需額外的包安裝,可以直接在命令行中調(diào)用柳畔。

十馍管、R語言summary函數(shù)回歸選取

在回歸分析中,使用summary() 函數(shù)可以幫助研究人員選擇最佳的回歸方程薪韩。summary() 函數(shù)可以計(jì)算回歸方程的統(tǒng)計(jì)指標(biāo)确沸,并計(jì)算決定系數(shù)以幫助確定最好的回歸方程。

下面是一個(gè)示例俘陷,展示了如何在 R 中使用簡單線性回歸方程進(jìn)行擬合罗捎,并使用 summary函數(shù)計(jì)算回歸統(tǒng)計(jì)指標(biāo)。

# 簡單線性回歸

model <- lm(y ~ x)

# 打印同步表

summary(model)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末拉盾,一起剝皮案震驚了整個(gè)濱河市桨菜,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌捉偏,老刑警劉巖倒得,帶你破解...
    沈念sama閱讀 218,036評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異夭禽,居然都是意外死亡霞掺,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評論 3 395
  • 文/潘曉璐 我一進(jìn)店門讹躯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來菩彬,“玉大人缠劝,你說我怎么就攤上這事∑睿” “怎么了惨恭?”我有些...
    開封第一講書人閱讀 164,411評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長耙旦。 經(jīng)常有香客問我脱羡,道長,這世上最難降的妖魔是什么母廷? 我笑而不...
    開封第一講書人閱讀 58,622評論 1 293
  • 正文 為了忘掉前任轻黑,我火速辦了婚禮,結(jié)果婚禮上琴昆,老公的妹妹穿的比我還像新娘氓鄙。我一直安慰自己,他們只是感情好业舍,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,661評論 6 392
  • 文/花漫 我一把揭開白布抖拦。 她就那樣靜靜地躺著,像睡著了一般舷暮。 火紅的嫁衣襯著肌膚如雪态罪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,521評論 1 304
  • 那天下面,我揣著相機(jī)與錄音复颈,去河邊找鬼。 笑死沥割,一個(gè)胖子當(dāng)著我的面吹牛耗啦,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播机杜,決...
    沈念sama閱讀 40,288評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼帜讲,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了椒拗?” 一聲冷哼從身側(cè)響起似将,我...
    開封第一講書人閱讀 39,200評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎蚀苛,沒想到半個(gè)月后在验,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,644評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡枉阵,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,837評論 3 336
  • 正文 我和宋清朗相戀三年译红,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片兴溜。...
    茶點(diǎn)故事閱讀 39,953評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡侦厚,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出拙徽,到底是詐尸還是另有隱情刨沦,我是刑警寧澤,帶...
    沈念sama閱讀 35,673評論 5 346
  • 正文 年R本政府宣布膘怕,位于F島的核電站想诅,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏岛心。R本人自食惡果不足惜来破,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,281評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望忘古。 院中可真熱鬧徘禁,春花似錦、人聲如沸髓堪。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,889評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽干旁。三九已至驶沼,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間争群,已是汗流浹背回怜。 一陣腳步聲響...
    開封第一講書人閱讀 33,011評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留换薄,地道東北人玉雾。 一個(gè)月前我還...
    沈念sama閱讀 48,119評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像专控,于是被迫代替她去往敵國和親抹凳。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,901評論 2 355

推薦閱讀更多精彩內(nèi)容