首先可以直接大小寫轉(zhuǎn)換:
dog <- "The quick brown dog"
str_to_upper(dog)
str_to_lower(dog)
str_to_title(dog)
str_to_sentence("the quick brown dog")
但是這樣還是存在很多例如 TP53 和 小鼠的Trp53直接轉(zhuǎn)換后不對(duì)應(yīng)的問題绳锅。
于是考慮到要同源轉(zhuǎn)換痹筛。但是看了很多教程壶辜,看完了還是干著急不能用泞坦。
自己根據(jù)之前的經(jīng)驗(yàn)結(jié)合一個(gè)小的文件肮蛹,
參考官網(wǎng)
mouse_human_genes = read.csv("http://www.informatics.jax.org/downloads/reports/HOM_MouseHumanSequence.rpt",sep="\t")
這個(gè)鏈接應(yīng)該是我在使用biomat的時(shí)候報(bào)錯(cuò)刻帚,根據(jù)報(bào)錯(cuò)地址獲取的潦嘶,然后就直接下載了這個(gè)文件,保存下來自己用崇众。
下載這個(gè)文件后掂僵,
下載到其人鼠同源基因文件航厚。內(nèi)容如下:
所做處理:
提取人鼠的同源基因名,根據(jù)第一列進(jìn)行匹配锰蓬,隨后inner_join,得到一個(gè)人鼠均有的同源基因文件幔睬,如下:
放在了代碼里了無套路自取,請(qǐng)給本文點(diǎn)個(gè)贊
內(nèi)有鼠對(duì)人一對(duì)多芹扭,和人對(duì)鼠一對(duì)多的情況出現(xiàn)麻顶。請(qǐng)注意篩選。
使用方法如下:
輸入數(shù)據(jù)是你的gene 向量
Reference <- read.csv('https://picgo-yxy.oss-cn-guangzhou.aliyuncs.com/img/mouse_human_gene_match.csv')
human→mouse
hmtran <- function(tmpdat){
tmpdat = data.frame(gene = tmpdat)
tmpdat$new <- Reference$Symbol[match(tmpdat$gene,Reference$SYMBOL)]
tmpdat <- na.omit(tmpdat)
return(tmpdat)
}
tmpgene = 你的基因向量
tmpgene = hmtran(tmpgene)
mouse→human
mhtran <- function(tmpdat){
tmpdat = data.frame(gene = tmpdat)
tmpdat$new <- Reference$SYMBOL[match(tmpdat$gene,Reference$Symbol)]
tmpdat <- na.omit(tmpdat)
return(tmpdat)
}
——————————————————————————————————————
2.0版本
Reference <- read.csv('https://picgo-yxy.oss-cn-guangzhou.aliyuncs.com/img/mouse_human_gene_match.csv')
hmtran <- function(tmpdat){
tmpdat1 = tmpdat
tmpdat = data.frame(gene = tmpdat)
tmpdat$new <- Reference$Symbol[match(tmpdat$gene,Reference$SYMBOL)]
tmpdat <- na.omit(tmpdat)
n = length(setdiff(tmpdat1,tmpdat$gene))
a = signif(n/length(tmpdat1),3)
tmp = paste(c(setdiff(tmpdat1,tmpdat$gene)),collapse = ' ')
print(paste0('There are ',a,'% genes fail to trans. They are |||',tmp))
return(tmpdat)
}
會(huì)顯示有多少基因沒被轉(zhuǎn)換到舱卡,心里有個(gè)數(shù)吧算是辅肾。
阿里云好像是根據(jù)流量收費(fèi)的,我不想交錢轮锥,苦逼碩士沒有錢矫钓,所以大家可以從下面下載,其實(shí)從上面的代碼直接讀進(jìn)R里面也可交胚,但是還是計(jì)流量份汗,誒,我這估計(jì)也不會(huì)有很多人看蝴簇,應(yīng)該不用很貴杯活。
文件這里也有一份,以前寫的一份教程熬词。
https://www.yuque.com/wuwuyuyu/kb/opzg6n?singleDoc# 《人鼠基因名轉(zhuǎn)化——同源轉(zhuǎn)化》
之前寫的很多都在里面旁钧,但是垃圾yvque,現(xiàn)在不讓免費(fèi)公開了互拾,煩死了歪今。