awk提取差異分析結(jié)果時(shí)候的一個(gè)小錯(cuò)誤

我有時(shí)候會(huì)對(duì)DIffBind的輸出結(jié)果進(jìn)行下修改孤里,然后放到deeptools-computeMatrix里面去。跟之前的HOMER一樣,computeMatrix要求的也是bed格式

chr1    3204562 3661579 NM_001011874 Xkr4   -
chr1    4481008 4486494 NM_011441    Sox17  -
chr1    4763278 4775807 NM_001177658 Mrpl15 -
chr1    4797973 4836816 NM_008866    Lypla1 +

然后我就正常按照awk的操作進(jìn)行了提取

awk -F "," 'BEGIN {OFS="\t"} $9 < -1 && $11 < 0.05 {print $1,$2,$3,$12,$5}' diff.csv | sed 's/\"http://g' | sort -k1,1 -k2,2n > test.bed

head -n 1 test.bed
Chr1    113 1134    peak_1  *

分別是提取Fold(即9) < -1 且 FDR(即11) < 0.05,然后提取1,2,3,12,5列膊畴,然后排下序
原諒我的不正規(guī)的bed格式……這里關(guān)系不太大

但當(dāng)我去使用computeMatrix的使用,總是會(huì)出現(xiàn)報(bào)錯(cuò)

computeMatrix reference-point -S a.bw -R ../test.bed -a 500 -b 500 --referencePoint center --binSize 10 -p 50 -o computerMatrix_Diff.gz

Traceback (most recent call last):
  File "/opt/biosoft/deepTools2.0/bin/computeMatrix", line 14, in <module>
    main(args)
  File "/opt/biosoft/deepTools2.0/lib/python2.7/site-packages/deeptools/computeMatrix.py", line 421, in main
    hm.computeMatrix(scores_file_list, args.regionsFileName, parameters, blackListFileName=args.blackListFileName, verbose=args.verbose, allArgs=args)
  File "/opt/biosoft/deepTools2.0/lib/python2.7/site-packages/deeptools/heatmapper.py", line 264, in computeMatrix
    verbose=verbose)
  File "/opt/biosoft/deepTools2.0/lib/python2.7/site-packages/deeptools/mapReduce.py", line 85, in mapReduce
    bed_interval_tree = GTF(bedFile, defaultGroup=defaultGroup, transcriptID=transcriptID, exonID=exonID, transcript_id_designator=transcript_id_designator, keepExons=keepExons)
  File "/opt/biosoft/deepTools2.0/lib/python2.7/site-packages/deeptoolsintervals/parse.py", line 595, in __init__
    self.parseBED(fp, line, 3, labelColumn)
  File "/opt/biosoft/deepTools2.0/lib/python2.7/site-packages/deeptoolsintervals/parse.py", line 362, in parseBED
    self.parseBEDcore(line, ncols)
  File "/opt/biosoft/deepTools2.0/lib/python2.7/site-packages/deeptoolsintervals/parse.py", line 225, in parseBEDcore
    if int(cols[1]) < 0:
ValueError: invalid literal for int() with base 10: 'start'

根據(jù)網(wǎng)上的Question: ValueError: invalid literal for int() with base 10: 'start' computeMatrix of deeptools 問(wèn)題病游,我認(rèn)為是我的bed有header唇跨,即可能還留有seqnames、start衬衬、end這種表頭轻绞。但剛才也看到了,我已經(jīng)head過(guò)了佣耐,并沒(méi)有表頭的殘留政勃。不過(guò)我也想到了是否是因?yàn)槲襰ort了一下,表頭到了最后一行去了兼砖,果不其然奸远。

tail -n 1 test.bed
seqnames    start   end feature_id  strand

但這就很奇怪了,我明明是設(shè)定了 $9 < -1 && $11 < 0.05 讽挟,照理說(shuō)并不會(huì)有錯(cuò)誤的懒叛,因?yàn)椴还苁荈old還是FDR,照理說(shuō)都是字符串耽梅,不應(yīng)該會(huì)<-1或者<0.05薛窥。然后我在網(wǎng)上一查,發(fā)現(xiàn)了一個(gè)比較坑爹的事情:awk greater than why show string value?
里面提到了如果你要比較混合類(lèi)型大小的話(huà),那么數(shù)字就會(huì)自動(dòng)轉(zhuǎn)換成字符串诅迷,然后字符串之間就會(huì)進(jìn)行比較了佩番。

When comparing operands of mixed types, numeric operands are converted to strings using the value of CONVFMT. ... CONVFMT's default value is "%.6g", which prints a value with at least six significant digits.

但我感覺(jué)不僅僅是這個(gè)問(wèn)題,因?yàn)槿绻以O(shè)定了

vim test.txt

Fold  FDR
2   0.04

然后awk操作罢杉,并不會(huì)返回值

awk -F "\t" '$1 < -1 && $2 < 0.05' test.txt

而如果我是

vim test.txt

"Fold"  "FDR"
2   0.04

就會(huì)返回值了

$ awk -F "\t" '$1 < -1 && $2 < 0.05' test.txt
"Fold"  "FDR"

這樣看起來(lái)似乎是引號(hào)的問(wèn)題……具體原因我也不知道

不過(guò)如果要避免這個(gè)問(wèn)題的話(huà)趟畏,要么一開(kāi)始就用 sed 's/\"http://g' 把雙引號(hào)去掉,要么就是 sed 1d 去掉第一行

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末滩租,一起剝皮案震驚了整個(gè)濱河市赋秀,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌律想,老刑警劉巖猎莲,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異技即,居然都是意外死亡益眉,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)姥份,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人年碘,你說(shuō)我怎么就攤上這事澈歉。” “怎么了屿衅?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵埃难,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我涤久,道長(zhǎng)涡尘,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任响迂,我火速辦了婚禮考抄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蔗彤。我一直安慰自己川梅,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布然遏。 她就那樣靜靜地躺著贫途,像睡著了一般。 火紅的嫁衣襯著肌膚如雪待侵。 梳的紋絲不亂的頭發(fā)上丢早,一...
    開(kāi)封第一講書(shū)人閱讀 51,125評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音秧倾,去河邊找鬼怨酝。 笑死傀缩,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的凫碌。 我是一名探鬼主播扑毡,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼盛险!你這毒婦竟也來(lái)了瞄摊?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤苦掘,失蹤者是張志新(化名)和其女友劉穎换帜,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體鹤啡,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡惯驼,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了递瑰。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片祟牲。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖抖部,靈堂內(nèi)的尸體忽然破棺而出说贝,到底是詐尸還是另有隱情,我是刑警寧澤慎颗,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布乡恕,位于F島的核電站,受9級(jí)特大地震影響俯萎,放射性物質(zhì)發(fā)生泄漏傲宜。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一夫啊、第九天 我趴在偏房一處隱蔽的房頂上張望函卒。 院中可真熱鬧,春花似錦撇眯、人聲如沸谆趾。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)沪蓬。三九已至,卻和暖如春来候,著一層夾襖步出監(jiān)牢的瞬間跷叉,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留云挟,地道東北人梆砸。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像园欣,于是被迫代替她去往敵國(guó)和親帖世。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353