生信學(xué)習(xí)是一個(gè)逐漸積累的過程歧斟,總是從零到有肴茄,由少成多晌畅,希望能不斷取得進(jìn)步。
在心情浮躁時(shí)寡痰,整理自己的所得所思抗楔,再出發(fā)。
【基本語法】
查看服務(wù)器硬盤存儲(chǔ)容量
df -lh
解壓文件?
tar -jxf xxxx.tar.bz2
解壓完成后拦坠,需要make release
關(guān)閉vim连躏,需要先按ESC,在輸入退出命令 :wq
實(shí)現(xiàn)Xshell斷開連接情況下Linux命令繼續(xù)執(zhí)行
1贞滨、將原命令語句改為:nohup 命令語句 &
2入热、回車執(zhí)行,再回車晓铆,窗口中會(huì)顯示一個(gè)進(jìn)程號
3勺良、如果中途想關(guān)閉,可執(zhí)行:kill -9 進(jìn)程號骄噪。如果想查看命令執(zhí)行情況尚困,可執(zhí)行:cat nohup.out
stringtie結(jié)果進(jìn)行定量,輸出deseq2輸入文件
python prepDE.py -i gtflist.txt -g gene_count.csv -t transcript.csv
linux內(nèi)查看轉(zhuǎn)錄子數(shù)量
cat stringtie_merged.gtf |grep 'transcript\>'|wc -l
查gff文件 NCBI—genome—輸入human-下載gff文件
查詢可執(zhí)行文件链蕊、全路徑模式調(diào)用命令 用cd打開程序所在的文件夾事甜,使用ls -l命令進(jìn)行查詢,如果為綠色且屬性為-rwxrwxr-x.則為可執(zhí)行文件滔韵,再輸入pwd 可執(zhí)行文件名稱逻谦, 即為可執(zhí)行文件路徑,之后再將路徑后加上可執(zhí)行文件的名稱奏属,即為在全路徑方式下調(diào)用命令。
如果命令無誤潮峦,會(huì)顯示
[1] 393
$ nohup: ignoring input and appending output to ‘nohup.out’
如果運(yùn)行結(jié)果成功會(huì)顯示
[3] Done nohup fastq-dump --defline-seq '@$sn[_$rn]/$ri' --split-3 ERR188383.1
$ nohup: ignoring input and appending output to ‘nohup.out’
復(fù)制和粘貼
由于在linux的Shell下囱皿,Ctrl+c是中斷當(dāng)前指令勇婴,這個(gè)快捷鍵和win系統(tǒng)下的復(fù)制快捷鍵沖突,在Xshell中嘱腥,提供了其它的快捷鍵來執(zhí)行這些操作:
復(fù)制:Ctrl+Insert
粘貼:Shift+Insert
將當(dāng)前Shell中的內(nèi)容復(fù)制到”記事本”中
箭頭上下 可以調(diào)換最近的命令耕渴,按住不動(dòng)可以進(jìn)行轉(zhuǎn)跳
shift和上下箭頭 可以上下調(diào)換視野內(nèi)容
alt+1/2 切換窗口
fastq-dump一般格式
fastq-dump /path/to/xxx.sra
加上--split-3之后, 會(huì)把原來雙端拆分成兩個(gè)文件,但是原來單端并不會(huì)保存成兩個(gè)文件. 還有你用--gzip就能輸出gz格式, 能夠節(jié)省空間的同時(shí)也不會(huì)給后續(xù)比對軟件造成壓力, 比對軟件都支持,就是時(shí)間要多一點(diǎn)齿兔。
hisat
hisat2-align-s --wrapper basic-0 -p 2 -x chrX -S ERR188104_chrX.sam -1 ERR188104.1_1.fastq -2 ERR188104.1_2.fastq &
成功后會(huì)顯示:
[1]+ Done nohup hisat2-align-s --wrapper basic-0 -p 2 -x chrX -S ERR188104_chrX.sam -1 ERR188104.1_1.fastq -2 ERR188104.1_2.fastq
錯(cuò)誤 情況比較多橱脸,按照正確的格式再次輸入即可
hisat2報(bào)錯(cuò)可能原因:
1、內(nèi)存可能不夠
2分苇、索引文件和fastq文件應(yīng)該在同一目錄下
除非要構(gòu)建含有外顯子和剪切位點(diǎn)的index添诉,若只是比對到基因組上的話,可以直接從hisat2官網(wǎng)下載參考基因組的index医寿,下載后會(huì)在一個(gè)文件夾中(人類的是hg19如果下載的hg19的栏赴,小鼠的是mm10),其中都是genome.123....ht2文件
使用hisat2比對時(shí)靖秩,最好把index.x.ht2须眷、.fq.gz文件、預(yù)存放.sam放到同一個(gè)文件夾下沟突,不然可能會(huì)出錯(cuò)花颗。。我也不知道為什么因?yàn)槲液懿?/p>
3惠拭,使用hisat2之前一定要hisat2?-h看清其中的命令介紹扩劝,不然你會(huì)吃大虧!??hisat2比對的一般參數(shù)如下
hisat2?–p?8?--dta?–x?hg19/genome?-1?sample_1.fq.gz?-2?sample_2.fq.gz?–S?sample.sam?-p?8一般多少核去運(yùn)行,這個(gè)看自己電腦的內(nèi)存求橄,我的16g選擇八核稍微有點(diǎn)點(diǎn)卡今野,--dta是報(bào)告,-x是你的標(biāo)識(shí)罐农,hg19是你的index存放目錄条霜,而genome是你的index文件前綴!這時(shí)候插一句,如果你沒有好好看清hisat2的要求涵亏,你可能就直接把hg19這個(gè)文件夾放到-x后面宰睡,或者將其中的genome.x.ht2利用正則表達(dá)式genome.*放到-x后面,再或者你可能利用cat?>?整個(gè)成一個(gè)genome气筋,這些都會(huì)導(dǎo)致hisat2不認(rèn)識(shí)你的index文件拆内,看清hisat2要求后,你就明白了宠默,人家只是想要index的前綴麸恍,所以你只需把hg19/genome放到-x后面就可以!
后面的-1?-2的fastq文件一定要寫對路徑,或者就像我說的把他們放到同一個(gè)文件夾下,我喜歡用aligned命名文件夾
這樣路徑不會(huì)錯(cuò)抹沪,并且hisat2不會(huì)抽風(fēng)的報(bào)錯(cuò)!
4刻肄,如果你的fastq文件很多,你可以在終端利用for...do...done寫一個(gè)簡單的循環(huán)for?i?in?’seq?xx?yy’?do?hisat2?-p?8?-?x?hg19/genome(你的所有index文件前綴)?-1?sample${i}1.fq.gz?-2?sample${i}2.fq.gz?-S?sample${i}.sam
如果你想在vim中寫一個(gè)sh的話融欧,注意別忘了配置PATH
5敏弃,不會(huì)的一定要多查多問,不要閉門造車噪馏,不然很浪費(fèi)時(shí)間!祝大家都成為生信高手!
https://bbs.csdn.net/topics/393548188報(bào)錯(cuò)可能原因來源鏈接
分割線內(nèi)的內(nèi)容摘錄自別人的分享麦到,也曾經(jīng)對自己有幫助。
$ less -SN 文件名 #打開sam文件
¥samtools view -h 文件名 #打開bam文件
R語言
顯示當(dāng)前工作目錄 getwd()
改變工作目錄 setwd("路徑")
【網(wǎng)站推薦】
conda
https://www.cnblogs.com/chester-cs/p/11188785.html?
Metascape使用教程
https://www.plob.org/article/13205.html
david
http://david.abcc.ncifcrf.gov/
cut 和sort用法
https://blog.csdn.net/weixin_33909059/article/details/92964950
執(zhí)行腳本的4種方法
https://www.cnblogs.com/baichuanhuihai/p/8107917.html
fastq-to-fasta轉(zhuǎn)換及fasta拆分欠肾、合并
https://www.cnblogs.com/ylHe/p/6545184.html? cat *.fasta > output.fasta
多種文件的合并
https://blog.csdn.net/Cassiel60/article/details/88574661
xshell中各項(xiàng)字符的含義:
http://www.docin.com/p-1223941533.html
http://www.docin.com/p-676835976.html
2種解釋不太一致瓶颠,但大意相同
hisat建立索引
http://www.bio-info-trainee.com/731.html RNA-seq比對軟件HISAT說明書 (失效)
http://www.reibang.com/p/479c7b576e6f RNA-seq(5):序列比對 Hisat2
https://ccb.jhu.edu/software/hisat2/index.shtml Hisat2 官網(wǎng)(英文)
http://www.reibang.com/p/681e02e7f9af 序列比對
http://www.biotrainee.com/thread-26-1-1.html bowtie算法原理探究
Linux系列-hisat2的比對率查看
https://mp.weixin.qq.com/s?src=11×tamp=1594011701&ver=2443&signature=60PB7rI-oO3bN*ccf758xzNsbpT-aQ9-H8nYbR1u90zuB0mabaJjrVOJToTHkBuG99wxDeAwJ9nzkcH7ThiCte6slAkodT8kHX0uqlt*SjcbGwT3dcIyF717mfZUiFgO&new=1
linux shell數(shù)據(jù)重定向(輸入重定向與輸出重定向)詳細(xì)分析
https://blog.csdn.net/yellowd1/article/details/46280327
Xshell系列教程
http://c.biancheng.net/view/942.html
linux壓縮和解壓縮命令大全
https://jingyan.baidu.com/article/6d704a13f9981a28da51ca70.html
RNA-seq基礎(chǔ)知識(shí)
https://mp.weixin.qq.com/s?src=11×tamp=1564018917&ver=1749&signature=OqapdZJ676SdybpGMg0J0SJG*vLofvh-gV6x81UuXIFX*LpdciNvPL4BkH0Uuag*Ilrz59u42V8HLqECyXqwUYVzvk1ScOdumk7XYoYVjd1eOxnyb-WyuEhpUPJYmXEo&new=1
(此鏈接打開顯示系統(tǒng)錯(cuò)誤,可以直接搜RNA-seq基礎(chǔ)知識(shí)董济,微信的鏈接基本就是這篇內(nèi)容)
陳潤生 生物信息學(xué)課程6
https://v.youku.com/v_show/id_XMzg4MDY2NDA0.html?spm=a2h0j.11185381.listitem_page1.5!16~A
RNA-seq數(shù)據(jù)分析---方法學(xué)文章的實(shí)戰(zhàn)練習(xí)
http://www.reibang.com/p/1f5d13cc47f8
xshell常用命令大全
https://www.cnblogs.com/qq350760546/p/7890680.html
https://www.cnblogs.com/the-tops/p/5604311.html
samtools用法詳解
https://wenku.baidu.com/view/f9ea992a0722192e4436f60e.html
https://www.cnblogs.com/OA-maque/p/4827146.html
http://blog.sina.com.cn/s/blog_c5a35e780102wtzp.html
http://www.reibang.com/p/53de170927a7
https://www.cnblogs.com/lmt921108/p/7446893.html
https://zhuanlan.zhihu.com/p/49760719
VIM用法
https://www.cnblogs.com/dalaoban/p/9381305.html
xshell 特殊字符含義
https://blog.csdn.net/lovemysea/article/details/79410111?
gffread和gffcompare官網(wǎng)
http://ccb.jhu.edu/software/stringtie/gff.shtml
運(yùn)行命令及結(jié)果
gffcompare-0.11.2/gffcompare -r genomic.gtf -G -o merged stringtie_merged.gtf
179920 reference transcripts loaded.
507 duplicate reference transcripts discarded.
8827 query transfrags loaded.
結(jié)果文件:merged.annotated.gtf (Test_Data中)
gffread使用
http://www.reibang.com/p/a27be34d335d
查看和修改PATH環(huán)境變量的辦法
https://www.cnblogs.com/fnlingnzb-learner/p/6845851.html
linux常用命令
https://zhuanlan.zhihu.com/p/26493141
https://www.cnblogs.com/yolanda-lee/p/4544573.html
安裝軟件命令集合
http://www.biotrainee.com/thread-856-1-1.html
linux必備操作
http://www.bio-info-trainee.com/2900.html
stringtie
每一個(gè)stringtie步驟均會(huì)產(chǎn)生6個(gè)文件步清,需要分別保存,再重新做stringtie步驟
參考教程 http://www.reibang.com/p/0e48facb3786
R程序?qū)W習(xí)
R語言教程 https://www.w3cschool.cn/r/
R常見問題解答 https://cran.r-project.org/doc/contrib/Liu-FAQ.pdf
GFF和GTF的區(qū)別虏肾,分別是對基因組和基因進(jìn)行注釋
http://www.reibang.com/p/48b5a0972301
Xshell 腳本的基本語法
https://blog.csdn.net/qq_18297675/article/details/52693464
https://blog.csdn.net/u012258978/article/details/54943116
Xshell for 循環(huán)
https://blog.csdn.net/qq_18312025/article/details/78278989
Xshell 遍歷循環(huán)
https://blog.csdn.net/wohu1104/article/details/90317728
https://blog.csdn.net/SunXiWang/article/details/78636827
批量重命名
字符串分割
http://www.reibang.com/p/0c25ef523d00
linux shell 中 %% *的含義
https://blog.csdn.net/qq_30130417/article/details/80911989
樣本表達(dá)量熱圖
http://www.reibang.com/p/bb3c55abafe4
http://www.reibang.com/p/3ff336a74d7a
http://www.biomarker.com.cn/archives/16573
http://www.biotrainee.com/thread-261-1-1.html
https://blog.csdn.net/sinat_38163598/article/details/72770404?locationNum=6
https://www.sogou.com/link?url=hedJjaC291P3yGwc7N55kLSc2ls_Ks2x7_LeYH63V1svvuYkpVi34zh3ZfoXRJBg
關(guān)于prefetch的用法
注意看參數(shù)說明廓啊,即prefetch,目前用到了--option-file 和-X 封豪,分別對應(yīng)批量下載和容量控制谴轮。
scp 不同服務(wù)器之間傳送文件
https://mp.weixin.qq.com/s?src=11×tamp=1599012013&ver=2559&signature=Em4kY5GegGGAPe3XuimPrEK7EbcqzbeMrVDrtF-FEj0OJMRgqacRcQ8XTUkJTO*UB-iStRl9ibxR4mnwPF3IPrOig8sxB2caSZAMRYltIsDpyKlvTKi3tdkqM0HjE5IH&new=1
?R語言中數(shù)據(jù)提取與篩選
https://mp.weixin.qq.com/s?src=11×tamp=1596420113&ver=2499&signature=qgMIQVlc2vvPh*1OAn6xk4jMXcTaask7VG6MiNW62ogcaRCCx4kRkzQQsHE3bd*jUu0AP2xlpwQuQVjcDC356cK1sUK-PxS*JfmAtAPk4EjKiHUzW9KQiO3cLWNzPqTz&new=1
WGCNA的介紹和范例
http://blog.genesino.com/2018/04/wgcna/
https://blog.csdn.net/LuohenYJ/article/details/103923939(含數(shù)據(jù)清洗)
轉(zhuǎn)錄組測序之差異基因挑選
https://mp.weixin.qq.com/s?src=11×tamp=1597839680&ver=2532&signature=ZFLke55JzjwG7DdpEY-6SbdDnJzIHGNMhiKSP1CN9Fz51QKUSUBkgmfhzLB1ovtN9xJAwIHa*i9aWuGQ7OM81VhFpvvV7RHUciArgy6UHHYsV4WiWOge2q6E1*zcL77C&new=1
【初學(xué)時(shí)練習(xí)操作的文章】
Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown?
Published online 11 August 2016; doi:10.1038/nprot.2016.095
也有很多人在生信技能樹上學(xué)習(xí)和交流經(jīng)驗(yàn),也可以多瀏覽瀏覽吹埠,唯一注意的是第步,生信技能樹的網(wǎng)站http://www.biotrainee.com/的搜索框不能進(jìn)行搜索,如果需要查詢此網(wǎng)站內(nèi)是否有自己想要的內(nèi)容缘琅,需要在百度/搜狗/火狐等瀏覽器的搜索框內(nèi)輸入:
想了解的內(nèi)容的關(guān)鍵字 site:www.biotrainee.com
? ??
?附操作示例圖片粘都,例如查詢關(guān)于hisat的內(nèi)容,我輸入的內(nèi)容為hisat site:www.biotrainee.com
這種辦法也可以用在其他網(wǎng)站刷袍,例如知乎/bilibili/簡書等等翩隧,學(xué)習(xí)的寶藏真的很多,需要用合適的方式去尋找呻纹。
總的來看堆生,還是吸收和借鑒別人的多,這也是學(xué)習(xí)的必經(jīng)之路雷酪,簡潔的語言淑仆,清晰的邏輯,了解大自然背后蘊(yùn)藏的生物規(guī)律哥力,都像一個(gè)個(gè)海邊的貝殼蔗怠,等待著更多人去發(fā)掘。?