大家好草讶,現(xiàn)在已經(jīng)據(jù)五月底的生物技能樹培訓過去一個多月了砂客,不知到大家在重復上課所上內(nèi)容上有沒有遇到問題,遇到問題又是如何去解決的呢蔫劣?但是我在這個過程中卻遇到很多問題,碰到很多坑个从。相信大家都有過這種體驗脉幢,在以前上一些數(shù)據(jù)分析課時歪沃,同樣的代碼復制粘貼都能報錯,這也是特別絕望的嫌松。我在上課期間感覺遇到的問題遠不如下來自己操作碰到的多沪曙。再次非常感謝我們生物技能樹的崔青美老師,期間遇到好幾個問題都是在她的幫助下解決的萎羔。以下我就正式講述我整個遇坑找坑填平坑的經(jīng)歷啦液走。
一、在自己的新服務器上配置軟件
由于之前上課期間很多文件數(shù)據(jù)和軟件都是老師已經(jīng)共享到我們上課所用服務器上的贾陷,所以我在上課時安裝軟件什么的也基本是一氣呵成缘眶,并沒有遇到特別多的問題,有問題也是直接當場問了厲害的李師兄髓废,哈哈巷懈。但是自己私底下在自己租來練手的新的服務器上安裝這些軟件就遇到問題了。首先就是自己下載這些軟件真的特別慢慌洪,只有十多kb/s的速度很是讓人抓狂顶燕。后來我想的辦法就是,把老師配給我們服務器上的軟件先傳輸?shù)阶约弘娔X冈爹,然后在通過自己電腦上傳到我新的服務器上涌攻。其實用wget -c 也能下得比較快。老師配給我們的服務器速度是100kb/s左右频伤,和用wget -c的速度差不多恳谎,然而不加-c 直接用wget下真的賊慢,反正我電腦告訴我要下3天憋肖,或者用迅雷黃金會員下惠爽,這個很多時候速度還是很靠譜的!K埠摺;樗痢!
二坐慰、建立hg38的索引
在做mapping時较性,一個數(shù)據(jù)庫的索引是基礎。hg38這個數(shù)據(jù)有3.05G特別大结胀,網(wǎng)上直接下載很慢赞咙,大家要是下載可以參考我上面的建議。
我建的是bowtie2的庫糟港,bowtie2 --help 一下我沒看懂攀操,就參考的一些博客和視頻,他們寫的是 bowtie2-build hg38.fa hg38秸抚。代碼倒是超級簡單可是我的系統(tǒng)一直提醒我錯了K俸汀歹垫!這個建庫真的折磨我,后來實在沒辦法了我詢問了崔老師颠放,她發(fā)了我一個鏈接http://www.reibang.com/p/071c1757ded1
bowtie2-build /home/qmcui/database/reference/hg38/hg38.fa hg38 --threads 5 #增加自己的線程排惨,這串建庫代碼總共運行了6個多小時。
然后就對了碰凶。
三暮芭、操作中遇到的零碎卻致命的問題
1,弄清文件目錄
要清楚上課時每串代碼下面文件目錄里放的什么文件欲低,準確在分析時定位到自己的文件辕宏,隨時清楚自己現(xiàn)在所在什么文件目錄下。如果在分析過程中輸入一段代碼后系統(tǒng)提示找不到該文件砾莱,建議大家直接進入自己文件所在目錄下再輸入自己的代碼瑞筐,一般就不會錯。
2恤磷,使用軟件時報錯逼自己讀懂 軟件--help
3, 每生成的新文件野宜,最好用zcat 文件名|wc -l 查看是否有內(nèi)容或者問題
四扫步、在此分享一個我遇到問題后解決問題的過程
在做RNA-seq時,在mapping時我遇到了第一個報錯:
問過崔老師后匈子,她提示我在-x后記得加索引前綴河胎,開始我沒明白老師的意思,后來查了一些簡書和博客才明白虎敦。也就是我們建好的索引都有自己的文件名游岳,比如我們hisat2構建好索引后,會產(chǎn)生幾個新的文件(如:hg38.1.bt2)索引前綴也就是hg38其徙。以上的代碼就需要改成
:-x ./database/index/hg38胚迫。
我把改后的代碼運行了一次,然后還是報錯:
崔老師說提示memory是因為資源不夠唾那,我的電腦當時提交了12個線程访锻,電腦資源不夠了。于是我關閉了另一邊的運行(當時我開了另一個終端占用6個線程構建索引)闹获,結果還是報錯:
這時老師發(fā)了一個鏈接給我期犬,上課時講的運到問題的解決過程。我發(fā)現(xiàn)其實自己不知不覺中也是這樣去尋找自己錯誤的避诽。無耐基礎太薄龟虎,還是沒法通過這些步驟找到自己的問題。
最后崔老師讓我查看自己的對比文件字節(jié)沙庐。用 zcat 文件名|wc -l 命令
終于發(fā)現(xiàn)是自己在上一步過濾數(shù)據(jù)時鲤妥,進行了什么不對的操作導致我的2.fq.gz沒有內(nèi)容佳吞。最后我重新運行了上一步的代碼之后一切就正常了。
總之旭斥,在每新生成一個文件后一定要及時用ls -ltrh查看文件進程容达,不然上一步的問題在下一步找真的特別頭痛!垂券!
當遇到報錯時不要太緊張花盐,不要隔好幾天,甚至十天半個月也不想碰代碼菇爪。遇到報錯算芯,按照老師講的自己排除錯誤,實在還錯等一天凳宙,再來處理熙揍,有可能時網(wǎng)速問題,或者去咨詢一下專業(yè)的朋友或者老師氏涩。一定要學懂=烨簟!下面的查錯的鏈接附上http://www.reibang.com/p/2aecf90bf1f3
寫到最后:其實我自己開始沒有用培訓時老師所用的hisat2是尖,而是bowtie2,
我忽略了前者是對比RNA意系,后者對比DNA。自己的數(shù)據(jù)是RNA我卻用bowtie2饺汹,對比出來只有四百多點蛔添,哎!hisat2對比出來有上萬呢6荡恰迎瞧!所以大家一定要正確了解每個軟件的用途,不要像我牛頭對馬嘴逸吵,哈哈哈P坠琛!
我在老師培訓時的服務器上運行的是老師ppt上的扫皱,基本未改一字咏尝,也沒有出現(xiàn)過錯誤,然而自己的服務器上卻頻頻出錯啸罢,眼淚流下來编检。
我在用數(shù)據(jù)做hisat2對比的時候其實也報錯了,自己改了一下代碼扰才,做了嘗試但是一直提示:
希望有清楚的老師提點一下允懂。感謝!
最后再次感謝崔老師衩匣,生物技能樹的所有老師蕾总,以及參加培訓過程中遇到的每一個朋友粥航,我過去是個小白,到現(xiàn)在還算進門生百;從遇到錯誤一籌莫展递雀,到現(xiàn)在自己不僅能解決自己的問題,也能為朋友解決一些問題蚀浆。我感到自己有比較大的進步缀程。謝謝大家!市俊!