如何拿到 KEGG數(shù)據(jù)庫的 hsa04650 Natural killer cell mediated cytotoxicity這個(gè)通路的所有基因名字

  • KEGG 是了解高級功能和生物系統(tǒng)(如細(xì)胞育拨、 生物和生態(tài)系統(tǒng))谨履,從分子水平信息,尤其是大型分子數(shù)據(jù)集生成的基因組測序和其他高通量實(shí)驗(yàn)技術(shù)的實(shí)用程序數(shù)據(jù)庫資源至朗, 由日本京都大學(xué)生物信息學(xué)中心的Kanehisa實(shí)驗(yàn)室于1995年建立屉符。是國際最常用的生物信息數(shù)據(jù)庫之一剧浸,以“理解生物系統(tǒng)的高級功能和實(shí)用程序資源庫”著稱锹引。

  • 小練習(xí):如何拿到 KEGG數(shù)據(jù)庫的 hsa04650 Natural killer cell mediated cytotoxicity(自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性)這個(gè)通路的所有基因名字矗钟。(hsa04650:Homo sapiens智人)

兩種辦法,第一谷歌嫌变,通過網(wǎng)頁方式瀏覽得到吨艇,第二種辦法,使用R包和代碼來做腾啥。


第一種辦法:網(wǎng)頁瀏覽


1东涡、谷歌直接搜索:hsa04650

image.png

2、點(diǎn)開此條網(wǎng)址(https://www.genome.jp/dbget-bin/www_bget?hsa04650
image.png

3倘待、直接翻到gene這個(gè)條目下即可看到答案疮跑。
image.png


第二種方法:使用R包和代碼:


思路:看一下網(wǎng)頁答案可知,我們的目標(biāo)是得到Gene條目形成的一個(gè)矩陣凸舵,并提取出第二列的基因(縮寫)


image.png

參考文章: http://www.bio-info-trainee.com/3533.html
看一下這篇文章:

library(clusterProfiler)   #加載這個(gè)包祖娘,這個(gè)包有什么用呢?
# https://www.kegg.jp/dbget-bin/www_bget?pathway+hsa05169
# library(KEGG.db) library(KEGGREST)  #這兩個(gè)包有什么用呢啊奄?
?
kg=download_KEGG('hsa')     #直接提取渐苏,并未提示用哪個(gè)命令獲得。
head(kg[[1]])
head(kg[[2]])
ps=c('hsa04660','hsa04659',
     'hsa04658','hsa04657','hsa04662',
     'hsa04650')
  • clusterProfiler :This package implements methods to analyze and visualize functional profiles (GO and KEGG) of gene and gene clusters.(該軟件包是實(shí)現(xiàn)了分析和可視化基因和基因簇的功能譜(GO和KEGG)的方法菇夸。)
  • KEGGREST :A package that provides a client interface to the KEGG REST server. (一個(gè)為KEGG REST服務(wù)器提供客戶端接口的包琼富。)

確定方向,先安裝包:


老規(guī)矩三部曲(安裝bioconductor內(nèi)的包):
1庄新、source("http://bioconductor.org/biocLite.R")安裝BiocInstaller

2鞠眉、options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/") 切換鏡像

3、BiocInstaller::biocLite('KEGGREST')安裝bioconductor內(nèi)的包(KEGGREST就是bioconductor的包)

> source("http://bioconductor.org/biocLite.R")
Bioconductor version 3.7 (BiocInstaller 1.30.0), ?biocLite for help
A newer version of Bioconductor is available for this version of R, ?BiocUpgrade for
  help
> options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/") 
> BiocInstaller::biocLite('KEGGREST')
BioC_mirror: http://mirrors.ustc.edu.cn/bioc/
Using Bioconductor 3.7 (BiocInstaller 1.30.0), R 3.5.2 (2018-12-20).
Installing package(s) ‘KEGGREST’
also installing the dependency ‘png’

trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.5/png_0.1-7.zip'
Content type 'application/zip' length 292639 bytes (285 KB)
downloaded 285 KB

trying URL 'http://mirrors.ustc.edu.cn/bioc//packages/3.7/bioc/bin/windows/contrib/3.5/KEGGREST_1.20.2.zip'
Content type 'application/zip' length 124626 bytes (121 KB)
downloaded 121 KB

package ‘png’ successfully unpacked and MD5 sums checked
package ‘KEGGREST’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\300S\AppData\Local\Temp\Rtmp4wKPRV\downloaded_packages
Old packages: 'gplots', 'purrr'
Update all/some/none? [a/s/n]: 
a
trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.5/gplots_3.0.1.1.zip'
Content type 'application/zip' length 657011 bytes (641 KB)
downloaded 641 KB

trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.5/purrr_0.3.0.zip'
Content type 'application/zip' length 413820 bytes (404 KB)
downloaded 404 KB

package ‘gplots’ successfully unpacked and MD5 sums checked
package ‘purrr’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\300S\AppData\Local\Temp\Rtmp4wKPRV\downloaded_packages

了解包的使用:


命令:

> ?KEGGREST
No documentation for ‘KEGGREST’ in specified packages and libraries:
you could try ‘??KEGGREST’
> ??KEGGREST
image.png

點(diǎn)擊查看择诈,了解基本命令:

  • KEGG exposes a number of databases. To get an idea of what is available, run listDatabases() 顯示KEGGREST所包含的數(shù)據(jù)內(nèi)容
  • You can obtain the list of organisms available in KEGG with the keggList()function 得到可用的生物列表

> gs<-keggGet('hsa04650')
> View(gs)
image.png

網(wǎng)頁部分截圖:
image.png

目錄和網(wǎng)頁一樣凡蚜,但是可以明顯看出gs目前不是矩陣。把其變成矩陣再提取出來即可吭从。

image.png

光標(biāo)放在目錄旁朝蜘,發(fā)現(xiàn)一個(gè)圖標(biāo),點(diǎn)擊出現(xiàn)一行代碼涩金,enter運(yùn)行谱醇,得到該目錄內(nèi)容。


image.png

與網(wǎng)頁對比正確:


image.png
  • strsplit(x, split, fixed = FALSE, perl= FALSE, useBytes = FALSE)

參數(shù)x是要處理的字符串步做,
參數(shù)split是分割點(diǎn)副渴。
參數(shù)fixed為TRUE時(shí)采用精確查找;
參數(shù)perl為TRUE時(shí)采用Perl正則表達(dá)式全度;
參數(shù)fixed和perl都為FALSE時(shí)煮剧,使用POSIX1003.2擴(kuò)展正則表達(dá)式;
參數(shù)useBytes為TRUE時(shí),匹配過程是逐字節(jié)進(jìn)行的勉盅;

  • lapply(X, FUN, ...)
    lapply的返回值是和一個(gè)和X有相同的長度的list對象佑颇,這個(gè)list對象中的每個(gè)元素是將函數(shù)FUN應(yīng)用到X的每一個(gè)元素。其中X為List對象(該list的每個(gè)元素都是一個(gè)向量)草娜,其他類型的對象會被R通過函數(shù)as.list()自動轉(zhuǎn)換為list類型挑胸。

  • unlist就是把里面不同的類型的數(shù)據(jù)分解出來,在此將數(shù)字與字符分隔開宰闰。unlist(x)生成一個(gè)包含x所有元素的向量茬贵,作用是展平數(shù)據(jù)列表。

> lapply(a,function(x) strsplit(x,';'))
[[1]]
[[1]][[1]]
[1] "3105"


[[2]]
[[2]][[1]]
[1] "HLA-A"                                                    
[2] " major histocompatibility complex, class I, A [KO:K06751]"
...
> unlist(lapply(a,function(x) strsplit(x,';')[[1]][1]))
  [1] "3105"        "HLA-A"       "3106"        "HLA-B"       "3107"        "HLA-C"      
  [7] "3135"        "HLA-G"       "3133"        "HLA-E"       "3812"        "KIR3DL2"    
 [13] "3811"        "KIR3DL1"     "3803"        "KIR2DL2"     "3802"        "KIR2DL1"    

> b<- unlist(lapply(a,function(x) strsplit(x,';')[[1]][1]))
> b[1:length(b)%%2 ==0]  #length(b)為基因所在位置,取出位置為偶數(shù)的字符即基因名
  [1] "HLA-A"       "HLA-B"       "HLA-C"       "HLA-G"       "HLA-E"       "KIR3DL2"    
  [7] "KIR3DL1"     "KIR2DL2"     "KIR2DL1"     "KIR2DL3"     "KIR2DL4"     "KIR2DL5A"   
 [13] "KLRC1"       "KLRC2"       "KLRC3"       "KLRD1"       "PTPN6"       "PTPN11"     
 [19] "ICAM1"       "ICAM2"       "ITGAL"       "ITGB2"       "PTK2B"       "VAV3"       
 [25] "VAV1"        "VAV2"        "RAC1"        "RAC2"        "RAC3"        "PAK1"       
 [31] "MAP2K1"      "MAP2K2"      "MAPK1"       "MAPK3"       "TNF"         "CSF2"       
 [37] "IFNG"        "KIR2DS1"     "KIR2DS3"     "KIR2DS4"     "KIR2DS5"     "KIR2DS2"    
 [43] "NCR2"        "TYROBP"      "LCK"         "IGH"         "FCGR3A"      "FCGR3B"     
 [49] "NCR1"        "NCR3"        "FCER1G"      "CD247"       "ZAP70"       "SYK"        
 [55] "LCP2"        "LAT"         "PLCG1"       "PLCG2"       "SH3BP2"      "PIK3CA"     
 [61] "PIK3CD"      "PIK3CB"      "PIK3R1"      "PIK3R2"      "PIK3R3"      "FYN"        
 [67] "SHC1"        "SHC2"        "SHC3"        "SHC4"        "GRB2"        "SOS1"       
 [73] "SOS2"        "HRAS"        "KRAS"        "NRAS"        "ARAF"        "BRAF"       
 [79] "RAF1"        "MICB"        "MICA"        "ULBP1"       "ULBP2"       "ULBP3"      
 [85] "RAET1G"      "RAET1L"      "RAET1E"      "KLRK1"       "KLRC4-KLRK1" "HCST"       
 [91] "CD48"        "CD244"       "PPP3CA"      "PPP3CB"      "PPP3CC"      "PPP3R1"     
 [97] "PPP3R2"      "NFATC1"      "NFATC2"      "PRKCA"       "PRKCB"       "PRKCG"      
[103] "SH2D1B"      "SH2D1A"      "IFNGR1"      "IFNGR2"      "IFNA1"       "IFNA2"      
[109] "IFNA4"       "IFNA5"       "IFNA6"       "IFNA7"       "IFNA8"       "IFNA10"     
[115] "IFNA13"      "IFNA14"      "IFNA16"      "IFNA17"      "IFNA21"      "IFNB1"      
[121] "IFNAR1"      "IFNAR2"      "TNFSF10"     "TNFRSF10A"   "TNFRSF10B"   "FASLG"      
[127] "FAS"         "GZMB"        "PRF1"        "CASP3"       "BID"  

友情閱讀推薦:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蔚约,一起剝皮案震驚了整個(gè)濱河市奄妨,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌苹祟,老刑警劉巖砸抛,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異树枫,居然都是意外死亡直焙,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進(jìn)店門砂轻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來奔誓,“玉大人,你說我怎么就攤上這事搔涝〕梗” “怎么了?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵庄呈,是天一觀的道長蜕煌。 經(jīng)常有香客問我,道長诬留,這世上最難降的妖魔是什么斜纪? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任贫母,我火速辦了婚禮,結(jié)果婚禮上盒刚,老公的妹妹穿的比我還像新娘腺劣。我一直安慰自己,他們只是感情好伪冰,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著樟蠕,像睡著了一般贮聂。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上寨辩,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天吓懈,我揣著相機(jī)與錄音,去河邊找鬼靡狞。 笑死耻警,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的甸怕。 我是一名探鬼主播甘穿,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼梢杭!你這毒婦竟也來了温兼?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤武契,失蹤者是張志新(化名)和其女友劉穎募判,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體咒唆,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡届垫,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了全释。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片装处。...
    茶點(diǎn)故事閱讀 39,688評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖浸船,靈堂內(nèi)的尸體忽然破棺而出符衔,到底是詐尸還是另有隱情,我是刑警寧澤糟袁,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布判族,位于F島的核電站,受9級特大地震影響项戴,放射性物質(zhì)發(fā)生泄漏形帮。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望辩撑。 院中可真熱鬧界斜,春花似錦、人聲如沸合冀。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽君躺。三九已至峭判,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間棕叫,已是汗流浹背林螃。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留俺泣,地道東北人疗认。 一個(gè)月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像伏钠,于是被迫代替她去往敵國和親横漏。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評論 2 353