2023-06-02

R語言summary函數(shù)的詳解

一晨缴、R語言summary函數(shù)模型

在R語言中译秦，summary()函數(shù)是一個(gè)重要的統(tǒng)計(jì)分析函數(shù)，用于對一維統(tǒng)計(jì)特征進(jìn)行計(jì)算并作出摘要击碗。在R語言統(tǒng)計(jì)分析的各種數(shù)據(jù)表中筑悴，summary() 函數(shù)經(jīng)常用于數(shù)據(jù)預(yù)處理和探索性分析。

具體地說稍途，summary() 函數(shù)用于將向量阁吝、因子和數(shù)據(jù)框中的數(shù)據(jù)計(jì)算指定的統(tǒng)計(jì)特征。這些統(tǒng)計(jì)特征包括最小值晰房，最大值求摇，中位數(shù)射沟，平均值和四分位數(shù)等殊者。summary()函數(shù)的結(jié)果通常呈現(xiàn)為一個(gè)表格或列表。

# 一個(gè)簡單的例子：用summary函數(shù)統(tǒng)計(jì)向量的統(tǒng)計(jì)特征

vec <- rnorm(100)

summary(vec)

二验夯、R語言summary函數(shù)怎么用

summary() 函數(shù)的第一個(gè)參數(shù)可以是向量猖吴，矩陣、因子或數(shù)據(jù)框挥转。summary() 函數(shù)的行為因輸入類型的不同而不同海蔽。

向量：?如果輸入是向量，那么summary() 函數(shù)會計(jì)算它的最小值绑谣，最大值党窜，中位數(shù)，平均值和四分位數(shù)等值借宵。在這些值中幌衣，僅計(jì)算有意義的值，并且忽略非數(shù)值。如果向量中包含無效值（例如NaN或NA）豁护，那么這些值在計(jì)算中也不會考慮哼凯。

矩陣：?如果輸入是矩陣，那么summary() 函數(shù)將每行都當(dāng)作一個(gè)向量并計(jì)算每一列的統(tǒng)計(jì)特征楚里。因此断部，輸出結(jié)果通常為每一列的統(tǒng)計(jì)特征表格

因子：?如果輸入是因子，那么summary() 函數(shù)將對因子級別進(jìn)行計(jì)數(shù)班缎，并將其呈現(xiàn)為表格蝴光。輸出結(jié)果包含每個(gè)因子級別的計(jì)數(shù)。

數(shù)據(jù)框：?如果輸入是數(shù)據(jù)框达址，那么summary() 函數(shù)將按列計(jì)算每個(gè)列的統(tǒng)計(jì)特征盹靴。因此，輸出結(jié)果通常為每個(gè)列的統(tǒng)計(jì)特征表格徙邻。

三搁嗓、R語言names函數(shù)

在使用summary() 函數(shù)時(shí)可以添加names參數(shù)，以重命名輸出結(jié)果中的變量右冻。names（）函數(shù)與R語言中data.frame里面的列名類似装蓬，它可以用于給輸出結(jié)果的每個(gè)變量賦予新的名稱。這樣給每一個(gè)變量命名或者給部分變量命名纱扭，會使R語言程序閱讀和處理結(jié)果文件時(shí)更為容易牍帚。

#一個(gè)例子: 修改summary()函數(shù)輸出結(jié)果的命名

vec <- rnorm(100)

summary(vec, name = "MyVector")

四、R語言summary函數(shù)是什么意思

與R語言summary函數(shù)類似的是乳蛾，sum()函數(shù)是另一個(gè)廣泛使用的函數(shù)暗赶。盡管sum()函數(shù)也用于計(jì)算統(tǒng)計(jì)特征，但它的使用范圍更少肃叶。sum()函數(shù)計(jì)算向量蹂随、矩陣和數(shù)組的元素和。而r語言summary函數(shù)計(jì)算各種統(tǒng)計(jì)特征因惭。因此岳锁，它們在用途和輸出結(jié)果上有很大的區(qū)別。

五蹦魔、R語言summary函數(shù)各含義

summary() 函數(shù)的輸出結(jié)果有助于理解數(shù)據(jù)的范圍和分布激率。輸出結(jié)果包含了五條統(tǒng)計(jì)特征的值，這些特征用無色背景表示勿决。除此之外乒躺，如果數(shù)據(jù)中有空的或不適當(dāng)?shù)闹担@些值也可以用顏色表示低缩。常用的統(tǒng)計(jì)指標(biāo)及其含義如下：

Min（最小值）：?最小觀測值嘉冒，即最小的可用數(shù)據(jù)點(diǎn)。

1Q（下四分位數(shù)）：數(shù)據(jù)的下四分位數(shù)。四分位數(shù)是數(shù)據(jù)集的四個(gè)等分點(diǎn)健爬，將數(shù)據(jù)集分為四個(gè)等分控乾。在這種情況下，數(shù)據(jù)被分為四個(gè)部分娜遵，每個(gè)部分包含25%的數(shù)據(jù)蜕衡。

Median（中位數(shù)）：?中位數(shù)是數(shù)據(jù)集的中心值。如果數(shù)據(jù)集有偶數(shù)個(gè)數(shù)據(jù)點(diǎn)设拟，則中位數(shù)有兩個(gè)慨仿。在這種情況下，兩個(gè)中位數(shù)的平均值被認(rèn)為是整個(gè)數(shù)據(jù)集的中位數(shù)纳胧。

Mean（平均數(shù)）：?平均值是數(shù)據(jù)集中所有值的總和除以值的數(shù)量镰吆。在統(tǒng)計(jì)分析和數(shù)據(jù)科學(xué)中，平均值通常用來表示數(shù)據(jù)集的一般趨勢跑慕。

3Q（上四分位數(shù)）：數(shù)據(jù)的上四分位數(shù)万皿。

Max（最大值）：?最大觀測值，即可用數(shù)據(jù)所達(dá)到的最大值核行。

NA（無效值）：?無效值表示缺少值或無效值牢硅。它們會影響數(shù)據(jù)集的總和和其他統(tǒng)計(jì)信息。

六芝雪、R語言summary函數(shù)用法

在R語言中减余，summary()函數(shù)被廣泛應(yīng)用于統(tǒng)計(jì)分析和數(shù)據(jù)探索。它可以幫助研究人員快速分析和理解數(shù)據(jù)集的特征惩系。summary() 函數(shù)的輸出結(jié)果可以讓研究人員快速了解數(shù)據(jù)的最小值位岔、最大值、中位數(shù)等重要信息堡牡。

七抒抬、R語言summary函數(shù)的功能

summary() 函數(shù)是一個(gè)強(qiáng)大的工具，它可以用來識別數(shù)據(jù)集中的異常值悴侵、探索數(shù)據(jù)集的分布瞧剖、縮短數(shù)據(jù)預(yù)處理的時(shí)間等。summary() 函數(shù)還可以被用于比較不同數(shù)據(jù)集之間的差異可免，例如，它可以用于比較兩個(gè)相同的變量的分布或數(shù)據(jù)集中的子集的分布做粤。

八浇借、R語言summary函數(shù)的決定系數(shù)

在統(tǒng)計(jì)分析中，匯總結(jié)果和決策根據(jù)其決定系數(shù)的大小怕品，選擇匯總方法和根據(jù)決定系數(shù)的大小調(diào)整匯總結(jié)果的顯示方式妇垢。

決定系數(shù)中參數(shù)的含義如下：

同步表中的R2：此項(xiàng)為最后公式的決定系數(shù)，它反映自變量與應(yīng)變量之間的關(guān)系程度的強(qiáng)度。R2從0到1變化闯估。R2為1時(shí)灼舍，所有觀察值均在回歸曲線上，表明自變量完全解釋實(shí)變量的方差涨薪；當(dāng)R2趨向于0時(shí)骑素，自變量解釋的實(shí)變量的方差極小。

同步表中的RSE：均方根誤差是回歸直線到各觀察點(diǎn)的距離的平均值刚夺，RSE越小則回歸直線更符合觀察點(diǎn)數(shù)據(jù)献丑。

同步表中的F值：是估計(jì)的回歸方程的“合適性”指標(biāo)，較大的F-值表示應(yīng)該拒絕H0假設(shè)侠姑，即表明所有自變量的系數(shù)不是零创橄。

同步表中的p值：是用于決定輕還是重要的關(guān)鍵，p-值很忻Ш臁（0.05以下）可能表示的是我們的結(jié)果具有顯著差異妥畏。p-值較大的情況下，我們無法排除這樣的假設(shè)："我們觀察到的結(jié)果只是由于原因純粹是由于隨機(jī)性/概率性"

九安吁、R語言summary函數(shù)在哪個(gè)包

R語言自帶的統(tǒng)計(jì)分析包中就包括了summary()函數(shù)咖熟，無需額外的包安裝，可以直接在命令行中調(diào)用柳畔。

十馍管、R語言summary函數(shù)回歸選取

在回歸分析中，使用summary() 函數(shù)可以幫助研究人員選擇最佳的回歸方程薪韩。summary() 函數(shù)可以計(jì)算回歸方程的統(tǒng)計(jì)指標(biāo)确沸，并計(jì)算決定系數(shù)以幫助確定最好的回歸方程。

下面是一個(gè)示例俘陷，展示了如何在 R 中使用簡單線性回歸方程進(jìn)行擬合罗捎，并使用 summary函數(shù)計(jì)算回歸統(tǒng)計(jì)指標(biāo)。

# 簡單線性回歸

model <- lm(y ~ x)

# 打印同步表

summary(model)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末拉盾，一起剝皮案震驚了整個(gè)濱河市桨菜，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌捉偏，老刑警劉巖倒得，帶你破解...
沈念sama閱讀 218,036評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異夭禽，居然都是意外死亡霞掺，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,046評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門讹躯，熙熙樓的掌柜王于貴愁眉苦臉地迎上來菩彬，“玉大人缠劝，你說我怎么就攤上這事∑睿” “怎么了惨恭？”我有些...
開封第一講書人閱讀 164,411評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長耙旦。經(jīng)常有香客問我脱羡，道長，這世上最難降的妖魔是什么母廷？我笑而不...
開封第一講書人閱讀 58,622評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任轻黑，我火速辦了婚禮，結(jié)果婚禮上琴昆，老公的妹妹穿的比我還像新娘氓鄙。我一直安慰自己，他們只是感情好业舍，可當(dāng)我...
茶點(diǎn)故事閱讀 67,661評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布抖拦。她就那樣靜靜地躺著，像睡著了一般舷暮。火紅的嫁衣襯著肌膚如雪态罪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,521評論 1贊 304
城市分裂傳說
那天下面，我揣著相機(jī)與錄音复颈，去河邊找鬼。笑死沥割，一個(gè)胖子當(dāng)著我的面吹牛耗啦，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播机杜，決...
沈念sama閱讀 40,288評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼帜讲，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了椒拗？” 一聲冷哼從身側(cè)響起似将，我...
開封第一講書人閱讀 39,200評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎蚀苛，沒想到半個(gè)月后在验，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,644評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡枉阵，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,837評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年译红，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片兴溜。...
茶點(diǎn)故事閱讀 39,953評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡侦厚，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出拙徽，到底是詐尸還是另有隱情刨沦，我是刑警寧澤，帶...
沈念sama閱讀 35,673評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布膘怕，位于F島的核電站想诅，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏岛心。R本人自食惡果不足惜来破，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,281評論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望忘古。院中可真熱鬧徘禁，春花似錦、人聲如沸髓堪。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,889評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽干旁。三九已至驶沼，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間争群，已是汗流浹背回怜。一陣腳步聲響...
開封第一講書人閱讀 33,011評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留换薄，地道東北人玉雾。一個(gè)月前我還...
沈念sama閱讀 48,119評論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像专控，于是被迫代替她去往敵國和親抹凳。傳聞我的和親對象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,901評論 2贊 355

2023-06-02

推薦閱讀更多精彩內(nèi)容