上周為了督促自己有效的學(xué)習(xí),立下了每周至少更一篇生信學(xué)習(xí)筆記的flag秕岛。
本打算從這周開始先寫一系列的生信基礎(chǔ)概念知識猜惋,沒想到很快就接到了大佬Jimmy老師的一個小任務(wù):如何拿到 KEGG數(shù)據(jù)庫的 hsa04650 Natural killer cell mediated cytotoxicity通路的所有基因名字。
經(jīng)過一下午的查資料锅尘,看代碼,終于理順了中間的相關(guān)知識布蔗,下面我將跟大家分享一下如何使用R語言找出hsa04650 Natural killer cell mediated cytotoxicity通路的所有基因名字藤违。
一、安裝R語言必須的包
首先纵揍,安裝“KEGGREST”包顿乒,第一次安裝時電腦顯示與當(dāng)前R語言版本不配,我的電腦是R-3.5.2版本泽谨,于是到官網(wǎng)下載了本地包璧榄,還是沒有安裝成功,最終bioconductor 的官網(wǎng)下載了安裝代碼吧雹,運行成功骨杂,其源代碼如下:
二、加載包雄卷,查看KEGG有哪些數(shù)據(jù)庫
其源代碼如下:
結(jié)果顯示這個包搓蚪,包含了KEGG數(shù)據(jù)庫的19個子數(shù)據(jù)庫,其中4個主要的數(shù)據(jù)庫為"pathway"丁鹉、"genes" 陕凹、"ligand"、 "brite"鳄炉,其他的子數(shù)據(jù)庫是在這4個數(shù)據(jù)庫的基礎(chǔ)上衍生出來的杜耙。
其中"pathway"數(shù)據(jù)庫提供發(fā)生在細(xì)胞內(nèi)各種反應(yīng)的人工繪制途徑圖,以網(wǎng)絡(luò)形式呈現(xiàn)拂盯。"genes" 數(shù)據(jù)庫存儲KEGG中注冊的已經(jīng)測序的基因組信息佑女。"ligand"數(shù)據(jù)庫可以查詢化合物、多糖以及酶促反應(yīng)等信息谈竿。
"brite"是將生物信息按等級層次分類歸納的數(shù)據(jù)庫团驱,其中所包含的KEGG、KO是用于同源性識別的系統(tǒng)空凸。其他的數(shù)據(jù)庫就先不講了嚎花,以后在學(xué)習(xí)中具體用到,在具體講解呀洲。
三紊选、返回信息表啼止,獲取 hsa04650 通路的信息
使用 organism 函數(shù)返回信息表;使用 keggGet 函數(shù)獲取人類基因信號通路 hsa04650 的信息兵罢,結(jié)果包括通路里面的基因献烦,基因間的聯(lián)系方式,以及鏈接等等卖词。其源代碼如下:
四巩那、提取出GENE對象,查找所有基因
接下來我們提取出GENE對象此蜈,因為GENE這一個對象就是包含基因name的數(shù)據(jù)框即横,并查找所有基因,其源代碼如下:
由于結(jié)果太大裆赵,筆記中只顯示了部分主要結(jié)果东囚。最后,想說的是我知道學(xué)習(xí)一個新知識很難顾瞪,但一旦開始做了舔庶,就會慢慢變的簡單,如果你覺的一個人很難堅持陈醒,跟和我們一起堅持學(xué)習(xí)惕橙,一起變的越來越好。
參考資料:
[1] 生信菜鳥團(tuán):http://www.bio-info-trainee.com/3533.html
[2]http://www.bioconductor.org/packages/release/bioc/html/KEGGREST.html
[3] https://blog.csdn.net/rojyang/article/details/82344002
[4]https://www.cnblogs.com/djx571/p/9634804.html https://www.docin.com/p371165058.htmlhttps://www.cnblogs.com/leezx/p/6221621.html?utm_source=itdadao&utm_medium=referral
[5]http://www.reibang.com/p/e8b8896f64e9