vcf文件過濾親本純合且差異位點

了解過vcf文件的格式之后,對親本純合且差異的位點進行過濾就變得簡單多了。如果格式規(guī)范的話一行awk命令其實就能解決冰寻。這里為了提高腳本的適用范圍,所以寫的稍微麻煩了些煤率。

vcf=要過濾的vcf文件
p1=親本一的樣本名(與vcf中的樣本名保持一致)
p2=親本二的樣本名(與vcf中的樣本名保持一致)

python vcf_filt.py -i vcf -p1 p1 -p2 p2 >filter.vcf

腳本內容如下:

import argparse
parser = argparse.ArgumentParser()


parser.add_argument('-vcf', "--vcf",dest = "i", default="none", #metavar=", defining metavar is causing an error for some reason
                    help = "total vcf"
                    )
parser.add_argument('-p1', "--parent_1",dest = "P", default="P1", #metavar=", defining metavar is causing an error for some reason
                    help = "parent bulk 1 name"
                    )
parser.add_argument('-p2', "--parent_2",dest = "p",default="P2", #metavar=", defining metavar is causing an error for some reason
                    help = "parent bulk 2 name"
                    )


args = parser.parse_args()
vcffile=args.i
P1=args.P
P2=args.p


info_dic = {}
sample_dic = {}

with open(vcffile,'r')as vcf:
    for line in vcf:
        if line.strip() != '' and line[:2] != "##":
            if line[:2] == "#C":
                for i in line.strip().split("\t"):
                    sample_dic[i] = line.strip().split("\t").index(i)
                    print(line.strip())
            else:
                lst = line.strip().split("\t")
                for i in lst[sample_dic["FORMAT"]].split(":"):
                    info_dic[i] = lst[sample_dic["FORMAT"]].split(":").index(i)
                p1_gt = lst[sample_dic[P1]].split(":")[info_dic["GT"]][0] + lst[sample_dic[P1]].split(":")[info_dic["GT"]][2]
                p2_gt = lst[sample_dic[P2]].split(":")[info_dic["GT"]][0] + lst[sample_dic[P2]].split(":")[info_dic["GT"]][2]
                if (p1_gt == "00" and p2_gt == "11") or (p1_gt == "11" and p2_gt == "00"):
                    print(line.strip())
        else:
            print(line.strip())

整理不易仰冠,給個好評再走唄!

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末蝶糯,一起剝皮案震驚了整個濱河市洋只,隨后出現的幾起案子,更是在濱河造成了極大的恐慌昼捍,老刑警劉巖识虚,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異妒茬,居然都是意外死亡担锤,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門乍钻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來肛循,“玉大人,你說我怎么就攤上這事团赁∮Γ” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵欢摄,是天一觀的道長熬丧。 經常有香客問我,道長怀挠,這世上最難降的妖魔是什么析蝴? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮绿淋,結果婚禮上闷畸,老公的妹妹穿的比我還像新娘。我一直安慰自己吞滞,他們只是感情好佑菩,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著裁赠,像睡著了一般殿漠。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上佩捞,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天绞幌,我揣著相機與錄音,去河邊找鬼一忱。 笑死莲蜘,一個胖子當著我的面吹牛谭确,可吹牛的內容都是我干的。 我是一名探鬼主播票渠,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼逐哈,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了问顷?” 一聲冷哼從身側響起鞠眉,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎择诈,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體出皇,經...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡羞芍,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了郊艘。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片荷科。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖纱注,靈堂內的尸體忽然破棺而出畏浆,到底是詐尸還是另有隱情,我是刑警寧澤狞贱,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布刻获,位于F島的核電站,受9級特大地震影響瞎嬉,放射性物質發(fā)生泄漏蝎毡。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一氧枣、第九天 我趴在偏房一處隱蔽的房頂上張望沐兵。 院中可真熱鬧,春花似錦便监、人聲如沸扎谎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽毁靶。三九已至,卻和暖如春解藻,著一層夾襖步出監(jiān)牢的瞬間老充,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工螟左, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留啡浊,地道東北人觅够。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像巷嚣,于是被迫代替她去往敵國和親喘先。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內容