生信 xshell部分基本語法和推薦網(wǎng)站積累

生信學(xué)習(xí)是一個(gè)逐漸積累的過程歧斟,總是從零到有肴茄,由少成多晌畅,希望能不斷取得進(jìn)步。

在心情浮躁時(shí)寡痰,整理自己的所得所思抗楔,再出發(fā)。

【基本語法】

查看服務(wù)器硬盤存儲(chǔ)容量

df -lh

解壓文件?

tar -jxf xxxx.tar.bz2

解壓完成后拦坠,需要make release

關(guān)閉vim连躏,需要先按ESC,在輸入退出命令 :wq

實(shí)現(xiàn)Xshell斷開連接情況下Linux命令繼續(xù)執(zhí)行

1贞滨、將原命令語句改為:nohup 命令語句 &

2入热、回車執(zhí)行,再回車晓铆,窗口中會(huì)顯示一個(gè)進(jìn)程號

3勺良、如果中途想關(guān)閉,可執(zhí)行:kill -9 進(jìn)程號骄噪。如果想查看命令執(zhí)行情況尚困,可執(zhí)行:cat nohup.out

stringtie結(jié)果進(jìn)行定量,輸出deseq2輸入文件

python prepDE.py -i gtflist.txt -g gene_count.csv -t transcript.csv

linux內(nèi)查看轉(zhuǎn)錄子數(shù)量

cat stringtie_merged.gtf |grep 'transcript\>'|wc -l

查gff文件 NCBI—genome—輸入human-下載gff文件

查詢可執(zhí)行文件链蕊、全路徑模式調(diào)用命令 用cd打開程序所在的文件夾事甜,使用ls -l命令進(jìn)行查詢,如果為綠色且屬性為-rwxrwxr-x.則為可執(zhí)行文件滔韵,再輸入pwd 可執(zhí)行文件名稱逻谦, 即為可執(zhí)行文件路徑,之后再將路徑后加上可執(zhí)行文件的名稱奏属,即為在全路徑方式下調(diào)用命令。

如果命令無誤潮峦,會(huì)顯示

[1] 393

$ nohup: ignoring input and appending output to ‘nohup.out’

如果運(yùn)行結(jié)果成功會(huì)顯示

[3] Done nohup fastq-dump --defline-seq '@$sn[_$rn]/$ri' --split-3 ERR188383.1

$ nohup: ignoring input and appending output to ‘nohup.out’

復(fù)制和粘貼

由于在linux的Shell下囱皿,Ctrl+c是中斷當(dāng)前指令勇婴,這個(gè)快捷鍵和win系統(tǒng)下的復(fù)制快捷鍵沖突,在Xshell中嘱腥,提供了其它的快捷鍵來執(zhí)行這些操作:

復(fù)制:Ctrl+Insert

粘貼:Shift+Insert

將當(dāng)前Shell中的內(nèi)容復(fù)制到”記事本”中

箭頭上下 可以調(diào)換最近的命令耕渴,按住不動(dòng)可以進(jìn)行轉(zhuǎn)跳

shift和上下箭頭 可以上下調(diào)換視野內(nèi)容

alt+1/2 切換窗口

fastq-dump一般格式

fastq-dump /path/to/xxx.sra

加上--split-3之后, 會(huì)把原來雙端拆分成兩個(gè)文件,但是原來單端并不會(huì)保存成兩個(gè)文件. 還有你用--gzip就能輸出gz格式, 能夠節(jié)省空間的同時(shí)也不會(huì)給后續(xù)比對軟件造成壓力, 比對軟件都支持,就是時(shí)間要多一點(diǎn)齿兔。

hisat

hisat2-align-s --wrapper basic-0 -p 2 -x chrX -S ERR188104_chrX.sam -1 ERR188104.1_1.fastq -2 ERR188104.1_2.fastq &

成功后會(huì)顯示:

[1]+ Done nohup hisat2-align-s --wrapper basic-0 -p 2 -x chrX -S ERR188104_chrX.sam -1 ERR188104.1_1.fastq -2 ERR188104.1_2.fastq

錯(cuò)誤 情況比較多橱脸,按照正確的格式再次輸入即可

hisat2報(bào)錯(cuò)可能原因:


1、內(nèi)存可能不夠

2分苇、索引文件和fastq文件應(yīng)該在同一目錄下

除非要構(gòu)建含有外顯子和剪切位點(diǎn)的index添诉,若只是比對到基因組上的話,可以直接從hisat2官網(wǎng)下載參考基因組的index医寿,下載后會(huì)在一個(gè)文件夾中(人類的是hg19如果下載的hg19的栏赴,小鼠的是mm10),其中都是genome.123....ht2文件

使用hisat2比對時(shí)靖秩,最好把index.x.ht2须眷、.fq.gz文件、預(yù)存放.sam放到同一個(gè)文件夾下沟突,不然可能會(huì)出錯(cuò)花颗。。我也不知道為什么因?yàn)槲液懿?/p>

3惠拭,使用hisat2之前一定要hisat2?-h看清其中的命令介紹扩劝,不然你會(huì)吃大虧!??hisat2比對的一般參數(shù)如下

hisat2?–p?8?--dta?–x?hg19/genome?-1?sample_1.fq.gz?-2?sample_2.fq.gz?–S?sample.sam?-p?8一般多少核去運(yùn)行,這個(gè)看自己電腦的內(nèi)存求橄,我的16g選擇八核稍微有點(diǎn)點(diǎn)卡今野,--dta是報(bào)告,-x是你的標(biāo)識(shí)罐农,hg19是你的index存放目錄条霜,而genome是你的index文件前綴!這時(shí)候插一句,如果你沒有好好看清hisat2的要求涵亏,你可能就直接把hg19這個(gè)文件夾放到-x后面宰睡,或者將其中的genome.x.ht2利用正則表達(dá)式genome.*放到-x后面,再或者你可能利用cat?>?整個(gè)成一個(gè)genome气筋,這些都會(huì)導(dǎo)致hisat2不認(rèn)識(shí)你的index文件拆内,看清hisat2要求后,你就明白了宠默,人家只是想要index的前綴麸恍,所以你只需把hg19/genome放到-x后面就可以!

后面的-1?-2的fastq文件一定要寫對路徑,或者就像我說的把他們放到同一個(gè)文件夾下,我喜歡用aligned命名文件夾

這樣路徑不會(huì)錯(cuò)抹沪,并且hisat2不會(huì)抽風(fēng)的報(bào)錯(cuò)!

4刻肄,如果你的fastq文件很多,你可以在終端利用for...do...done寫一個(gè)簡單的循環(huán)for?i?in?’seq?xx?yy’?do?hisat2?-p?8?-?x?hg19/genome(你的所有index文件前綴)?-1?sample${i}1.fq.gz?-2?sample${i}2.fq.gz?-S?sample${i}.sam

如果你想在vim中寫一個(gè)sh的話融欧,注意別忘了配置PATH

5敏弃,不會(huì)的一定要多查多問,不要閉門造車噪馏,不然很浪費(fèi)時(shí)間!祝大家都成為生信高手!

https://bbs.csdn.net/topics/393548188報(bào)錯(cuò)可能原因來源鏈接

分割線內(nèi)的內(nèi)容摘錄自別人的分享麦到,也曾經(jīng)對自己有幫助。


$ less -SN 文件名 #打開sam文件

¥samtools view -h 文件名 #打開bam文件

R語言

顯示當(dāng)前工作目錄 getwd()

改變工作目錄 setwd("路徑")


【網(wǎng)站推薦】

conda

https://www.cnblogs.com/chester-cs/p/11188785.html?

Metascape使用教程

https://www.plob.org/article/13205.html

david

http://david.abcc.ncifcrf.gov/

cut 和sort用法

https://blog.csdn.net/weixin_33909059/article/details/92964950

執(zhí)行腳本的4種方法

https://www.cnblogs.com/baichuanhuihai/p/8107917.html

fastq-to-fasta轉(zhuǎn)換及fasta拆分欠肾、合并

https://www.cnblogs.com/ylHe/p/6545184.html? cat *.fasta > output.fasta

多種文件的合并

https://blog.csdn.net/Cassiel60/article/details/88574661

xshell中各項(xiàng)字符的含義:

http://www.docin.com/p-1223941533.html

http://www.docin.com/p-676835976.html

2種解釋不太一致瓶颠,但大意相同

hisat建立索引

http://www.bio-info-trainee.com/731.html RNA-seq比對軟件HISAT說明書 (失效)

http://www.reibang.com/p/479c7b576e6f RNA-seq(5):序列比對 Hisat2

https://ccb.jhu.edu/software/hisat2/index.shtml Hisat2 官網(wǎng)(英文)

http://www.reibang.com/p/681e02e7f9af 序列比對

http://www.biotrainee.com/thread-26-1-1.html bowtie算法原理探究

Linux系列-hisat2的比對率查看

https://mp.weixin.qq.com/s?src=11&timestamp=1594011701&ver=2443&signature=60PB7rI-oO3bN*ccf758xzNsbpT-aQ9-H8nYbR1u90zuB0mabaJjrVOJToTHkBuG99wxDeAwJ9nzkcH7ThiCte6slAkodT8kHX0uqlt*SjcbGwT3dcIyF717mfZUiFgO&new=1

linux shell數(shù)據(jù)重定向(輸入重定向與輸出重定向)詳細(xì)分析

https://blog.csdn.net/yellowd1/article/details/46280327

Xshell系列教程

http://c.biancheng.net/view/942.html

linux壓縮和解壓縮命令大全

https://jingyan.baidu.com/article/6d704a13f9981a28da51ca70.html

RNA-seq基礎(chǔ)知識(shí)

https://mp.weixin.qq.com/s?src=11&timestamp=1564018917&ver=1749&signature=OqapdZJ676SdybpGMg0J0SJG*vLofvh-gV6x81UuXIFX*LpdciNvPL4BkH0Uuag*Ilrz59u42V8HLqECyXqwUYVzvk1ScOdumk7XYoYVjd1eOxnyb-WyuEhpUPJYmXEo&new=1

(此鏈接打開顯示系統(tǒng)錯(cuò)誤,可以直接搜RNA-seq基礎(chǔ)知識(shí)董济,微信的鏈接基本就是這篇內(nèi)容)

陳潤生 生物信息學(xué)課程6

https://v.youku.com/v_show/id_XMzg4MDY2NDA0.html?spm=a2h0j.11185381.listitem_page1.5!16~A

RNA-seq數(shù)據(jù)分析---方法學(xué)文章的實(shí)戰(zhàn)練習(xí)

http://www.reibang.com/p/1f5d13cc47f8

xshell常用命令大全

https://www.cnblogs.com/qq350760546/p/7890680.html

https://www.cnblogs.com/the-tops/p/5604311.html

samtools用法詳解

https://wenku.baidu.com/view/f9ea992a0722192e4436f60e.html

https://www.cnblogs.com/OA-maque/p/4827146.html

http://blog.sina.com.cn/s/blog_c5a35e780102wtzp.html

http://www.reibang.com/p/53de170927a7

https://www.cnblogs.com/lmt921108/p/7446893.html

https://zhuanlan.zhihu.com/p/49760719

VIM用法

https://www.cnblogs.com/dalaoban/p/9381305.html

xshell 特殊字符含義

https://blog.csdn.net/lovemysea/article/details/79410111?

gffread和gffcompare官網(wǎng)

http://ccb.jhu.edu/software/stringtie/gff.shtml

運(yùn)行命令及結(jié)果

gffcompare-0.11.2/gffcompare -r genomic.gtf -G -o merged stringtie_merged.gtf

179920 reference transcripts loaded.

507 duplicate reference transcripts discarded.

8827 query transfrags loaded.

結(jié)果文件:merged.annotated.gtf (Test_Data中)

gffread使用

http://www.reibang.com/p/a27be34d335d

查看和修改PATH環(huán)境變量的辦法

https://www.cnblogs.com/fnlingnzb-learner/p/6845851.html

linux常用命令

https://zhuanlan.zhihu.com/p/26493141

https://www.cnblogs.com/yolanda-lee/p/4544573.html

安裝軟件命令集合

http://www.biotrainee.com/thread-856-1-1.html

linux必備操作

http://www.bio-info-trainee.com/2900.html

stringtie

每一個(gè)stringtie步驟均會(huì)產(chǎn)生6個(gè)文件步清,需要分別保存,再重新做stringtie步驟

參考教程 http://www.reibang.com/p/0e48facb3786

R程序?qū)W習(xí)

R語言教程 https://www.w3cschool.cn/r/

R常見問題解答 https://cran.r-project.org/doc/contrib/Liu-FAQ.pdf

GFF和GTF的區(qū)別虏肾,分別是對基因組和基因進(jìn)行注釋

http://www.reibang.com/p/48b5a0972301

Xshell 腳本的基本語法

https://blog.csdn.net/qq_18297675/article/details/52693464

https://blog.csdn.net/u012258978/article/details/54943116

Xshell for 循環(huán)

https://blog.csdn.net/qq_18312025/article/details/78278989

Xshell 遍歷循環(huán)

https://blog.csdn.net/wohu1104/article/details/90317728

https://blog.csdn.net/SunXiWang/article/details/78636827

批量重命名

https://mp.weixin.qq.com/s?src=11&timestamp=1578369400&ver=2081&signature=F5y6l92oNOEtbjfdoYsNMJlweTRfVqZ-g7xFsTC1hwnT16QqqZSR2mZDtRsUwz8QPNxMUTUGWn8MA9MSCor2yTt2e*iRpLauT0kNBQlVcRTPYFzg0tuKEfPOK*2XBhwb&new=1

字符串分割

http://www.reibang.com/p/0c25ef523d00

linux shell 中 %% *的含義

https://blog.csdn.net/qq_30130417/article/details/80911989

樣本表達(dá)量熱圖

http://www.reibang.com/p/bb3c55abafe4

http://www.reibang.com/p/3ff336a74d7a

http://www.biomarker.com.cn/archives/16573

http://www.biotrainee.com/thread-261-1-1.html

https://blog.csdn.net/sinat_38163598/article/details/72770404?locationNum=6

https://www.sogou.com/link?url=hedJjaC291P3yGwc7N55kLSc2ls_Ks2x7_LeYH63V1svvuYkpVi34zh3ZfoXRJBg

關(guān)于prefetch的用法

注意看參數(shù)說明廓啊,即prefetch,目前用到了--option-file 和-X 封豪,分別對應(yīng)批量下載和容量控制谴轮。

scp 不同服務(wù)器之間傳送文件

https://mp.weixin.qq.com/s?src=11&timestamp=1599012013&ver=2559&signature=Em4kY5GegGGAPe3XuimPrEK7EbcqzbeMrVDrtF-FEj0OJMRgqacRcQ8XTUkJTO*UB-iStRl9ibxR4mnwPF3IPrOig8sxB2caSZAMRYltIsDpyKlvTKi3tdkqM0HjE5IH&new=1


?R語言中數(shù)據(jù)提取與篩選

https://mp.weixin.qq.com/s?src=11&timestamp=1596420113&ver=2499&signature=qgMIQVlc2vvPh*1OAn6xk4jMXcTaask7VG6MiNW62ogcaRCCx4kRkzQQsHE3bd*jUu0AP2xlpwQuQVjcDC356cK1sUK-PxS*JfmAtAPk4EjKiHUzW9KQiO3cLWNzPqTz&new=1

WGCNA的介紹和范例

http://blog.genesino.com/2018/04/wgcna/

https://blog.csdn.net/LuohenYJ/article/details/103923939(含數(shù)據(jù)清洗)

轉(zhuǎn)錄組測序之差異基因挑選

https://mp.weixin.qq.com/s?src=11&timestamp=1597839680&ver=2532&signature=ZFLke55JzjwG7DdpEY-6SbdDnJzIHGNMhiKSP1CN9Fz51QKUSUBkgmfhzLB1ovtN9xJAwIHa*i9aWuGQ7OM81VhFpvvV7RHUciArgy6UHHYsV4WiWOge2q6E1*zcL77C&new=1

【初學(xué)時(shí)練習(xí)操作的文章】

Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown?
Published online 11 August 2016; doi:10.1038/nprot.2016.095

也有很多人在生信技能樹上學(xué)習(xí)和交流經(jīng)驗(yàn),也可以多瀏覽瀏覽吹埠,唯一注意的是第步,生信技能樹的網(wǎng)站http://www.biotrainee.com/的搜索框不能進(jìn)行搜索,如果需要查詢此網(wǎng)站內(nèi)是否有自己想要的內(nèi)容缘琅,需要在百度/搜狗/火狐等瀏覽器的搜索框內(nèi)輸入:

想了解的內(nèi)容的關(guān)鍵字 site:www.biotrainee.com
? ??

?附操作示例圖片粘都,例如查詢關(guān)于hisat的內(nèi)容,我輸入的內(nèi)容為hisat site:www.biotrainee.com

這種辦法也可以用在其他網(wǎng)站刷袍,例如知乎/bilibili/簡書等等翩隧,學(xué)習(xí)的寶藏真的很多,需要用合適的方式去尋找呻纹。

來源搜狗



總的來看堆生,還是吸收和借鑒別人的多,這也是學(xué)習(xí)的必經(jīng)之路雷酪,簡潔的語言淑仆,清晰的邏輯,了解大自然背后蘊(yùn)藏的生物規(guī)律哥力,都像一個(gè)個(gè)海邊的貝殼蔗怠,等待著更多人去發(fā)掘。?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市寞射,隨后出現(xiàn)的幾起案子最住,更是在濱河造成了極大的恐慌,老刑警劉巖怠惶,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異轧粟,居然都是意外死亡策治,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進(jìn)店門兰吟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來通惫,“玉大人,你說我怎么就攤上這事混蔼÷囊福” “怎么了?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵惭嚣,是天一觀的道長遵湖。 經(jīng)常有香客問我,道長晚吞,這世上最難降的妖魔是什么延旧? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮槽地,結(jié)果婚禮上迁沫,老公的妹妹穿的比我還像新娘。我一直安慰自己捌蚊,他們只是感情好集畅,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著缅糟,像睡著了一般挺智。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上溺拱,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天逃贝,我揣著相機(jī)與錄音,去河邊找鬼迫摔。 笑死沐扳,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的句占。 我是一名探鬼主播沪摄,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了杨拐?” 一聲冷哼從身側(cè)響起祈餐,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎哄陶,沒想到半個(gè)月后帆阳,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡屋吨,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年蜒谤,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片至扰。...
    茶點(diǎn)故事閱讀 39,779評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡鳍徽,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出敢课,到底是詐尸還是另有隱情阶祭,我是刑警寧澤,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布直秆,位于F島的核電站濒募,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏圾结。R本人自食惡果不足惜萨咳,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望疫稿。 院中可真熱鬧培他,春花似錦、人聲如沸遗座。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽途蒋。三九已至猛遍,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間号坡,已是汗流浹背懊烤。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留宽堆,地道東北人腌紧。 一個(gè)月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像畜隶,于是被迫代替她去往敵國和親壁肋。 傳聞我的和親對象是個(gè)殘疾皇子号胚,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,700評論 2 354