統(tǒng)計(jì) | 用procomp包做PCA主成分分析

PCA

  1. 概念
    主成分分析:Principle Component Analysis
  2. 主成分分析就是降維,本來應(yīng)該有n個(gè)變量旋膳,通過PCA變成了n個(gè)主成分,而一般前面的幾個(gè)主成分就能解釋所有的數(shù)據(jù)了。

理解

  1. 得到PC
    每個(gè)sample研究10000gene(read counts)

考慮1個(gè)cell(sample)淮捆,單軸直線,1-D
考慮2個(gè)cell(sample)本股,x-y軸攀痊,2-D
考慮3個(gè)cell(sample),x-y-z拄显,3-D
...
200個(gè)cell苟径,200-D plot

這些維度中,有些維度的差異更大躬审,即對整體數(shù)據(jù)更具代表性棘街,更重要。每個(gè)維度提取差異方向承边,然后根據(jù)variation排序遭殉,得到200個(gè)PC。

PC1:差異最大的方向
PC2:差異第二大的方向
...
PC200:差異最小的方向

理解:PC1炒刁,2其實(shí)就是在sample中提出最具代表性(基因間差異最大)的兩個(gè)恩沽,并用來給gene加權(quán)重。

  1. 得到loading:每個(gè)gene 對某個(gè)PC的influence score
    gene1 PC1:gene1在PC1方向上的偏差(絕對值越大翔始,偏離中心越遠(yuǎn))
gene influence on PC1 Score
a high 10
b low 0.5
c high -14
... ... ...

實(shí)際表格:eigen vector

++ PC1 PC2 PC3 PC4 PC5 ...
Gene a .. .. .. .. .. ..
Gene b .. .. .. .. .. ..
Gene c .. .. .. .. .. ..
... ... ... .. .. .. ..
  1. PC plot:每個(gè)cell在各個(gè)PC的score
  • 針對每一個(gè)cell(sample)罗心,需要這個(gè)cell在PC1和PC2上的related 程度衡量的分?jǐn)?shù)。即其與PC1和PC2的pattern相近程度城瞎。從而從這兩個(gè)差異最大的方向來將所有sample進(jìn)行分類渤闷。
  • Cell 1 PC 1 Score = (read count * influence score on PC1)所有基因加和 = cell1中基因a的read count基因a在PC1 的loading score + cell1中基因b的read count基因b在PC1的loading score+基因c+基因d...

procomp

用于分析sample如何互相related

1.

pca<-procomp(t(data.matrix),scale=TRUE)
procomp需要行為sample是row,列為gene

2.結(jié)果

返回三個(gè)結(jié)果:
x
sdev
rotation

  1. x返回PCs(priciple components)脖镀。前兩列是PC1和PC2飒箭,10個(gè)sample,因此有10 PCs。
    x是10行10列弦蹂,10個(gè)sample肩碟,10個(gè)PC。每個(gè)數(shù)字表示某個(gè)sample的所有g(shù)ene的某個(gè)PC score加和凸椿。

  2. sdev:標(biāo)準(zhǔn)偏差來計(jì)算每個(gè)PC代表的variation削祈。



    計(jì)算每個(gè)PC的var的百分比。
    從百分比可以知道PC1和PC2的重要性有多少脑漫。另外因?yàn)镻C1比PC2重要髓抑,因此如果圖中兩個(gè)點(diǎn)的橫向距離和縱向距離一樣,那么它們也在PC1上的差異更大优幸。也就是橫向分類更顯著吨拍。

  3. rotation:即loading scores(每個(gè)基因?qū)Σ煌琍C的influence score)


    image.png

100genes,10PC

參考

  1. statquest-PCA
  2. link
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市网杆,隨后出現(xiàn)的幾起案子羹饰,更是在濱河造成了極大的恐慌,老刑警劉巖跛璧,帶你破解...
    沈念sama閱讀 218,036評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件严里,死亡現(xiàn)場離奇詭異,居然都是意外死亡追城,警方通過查閱死者的電腦和手機(jī)刹碾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來座柱,“玉大人迷帜,你說我怎么就攤上這事∩矗” “怎么了戏锹?”我有些...
    開封第一講書人閱讀 164,411評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長火诸。 經(jīng)常有香客問我锦针,道長,這世上最難降的妖魔是什么置蜀? 我笑而不...
    開封第一講書人閱讀 58,622評論 1 293
  • 正文 為了忘掉前任奈搜,我火速辦了婚禮,結(jié)果婚禮上盯荤,老公的妹妹穿的比我還像新娘馋吗。我一直安慰自己,他們只是感情好秋秤,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,661評論 6 392
  • 文/花漫 我一把揭開白布宏粤。 她就那樣靜靜地躺著脚翘,像睡著了一般。 火紅的嫁衣襯著肌膚如雪绍哎。 梳的紋絲不亂的頭發(fā)上来农,一...
    開封第一講書人閱讀 51,521評論 1 304
  • 那天,我揣著相機(jī)與錄音崇堰,去河邊找鬼备图。 笑死,一個(gè)胖子當(dāng)著我的面吹牛赶袄,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播抠藕,決...
    沈念sama閱讀 40,288評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼饿肺,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了盾似?” 一聲冷哼從身側(cè)響起敬辣,我...
    開封第一講書人閱讀 39,200評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎零院,沒想到半個(gè)月后溉跃,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,644評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡告抄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,837評論 3 336
  • 正文 我和宋清朗相戀三年撰茎,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片打洼。...
    茶點(diǎn)故事閱讀 39,953評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡龄糊,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出募疮,到底是詐尸還是另有隱情炫惩,我是刑警寧澤,帶...
    沈念sama閱讀 35,673評論 5 346
  • 正文 年R本政府宣布阿浓,位于F島的核電站他嚷,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏芭毙。R本人自食惡果不足惜筋蓖,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,281評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望稿蹲。 院中可真熱鬧扭勉,春花似錦、人聲如沸苛聘。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,889評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至唱捣,卻和暖如春两蟀,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背震缭。 一陣腳步聲響...
    開封第一講書人閱讀 33,011評論 1 269
  • 我被黑心中介騙來泰國打工赂毯, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人拣宰。 一個(gè)月前我還...
    沈念sama閱讀 48,119評論 3 370
  • 正文 我出身青樓党涕,卻偏偏與公主長得像,于是被迫代替她去往敵國和親巡社。 傳聞我的和親對象是個(gè)殘疾皇子膛堤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,901評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 什么是高通量測序? 高通量測序技術(shù)(High-throughput sequencing晌该,HTS)是對傳統(tǒng)Sang...
    翠湖心影閱讀 20,937評論 2 81
  • 4.12【今日話題】 迄今為止肥荔,除了父母之外,誰對你的影響最大朝群?為什么燕耿? 要說現(xiàn)實(shí)生活中的人的話,除了父母之外姜胖,對...
    小秦哥哥閱讀 139評論 2 2
  • 大伙兒誉帅,誰在露天KTV唱過歌? 就是右莱,1塊錢唱一首的——老板推著電視機(jī)堵第,VCD擺攤的——那種流動(dòng)式的唱攤。 當(dāng)年隧出,...
    王小二日記閱讀 318評論 0 0
  • 一個(gè)獨(dú)自尋父而意外失去生命的小女孩胀瞪,一個(gè)忠職的靈魂擺渡人针余。她不知前路如何,卻依舊堅(jiān)定前行凄诞,她時(shí)刻判斷著也時(shí)刻懷疑著...
    晨俊閱讀 516評論 2 4
  • 作為一名PPT愛好者帆谍,我經(jīng)常會(huì)關(guān)注這個(gè)領(lǐng)域里一些大牛的分享伪朽,從模板、圖片汛蝙、圖表烈涮、字體朴肺、配色到排版等,各路達(dá)人都分享...
    楊何閱讀 16,855評論 58 763