python學(xué)習(xí):primer3-py批量設(shè)計(jì)引物

100天生信-Day11

最近一直在做濕實(shí)驗(yàn)纳鼎,需要大量設(shè)計(jì)引物,發(fā)現(xiàn)primer3有python版本裳凸,可以批量設(shè)計(jì)贱鄙,簡(jiǎn)直神器。

import primer3
import pandas as pd

## primer_condition
global_args = {
        'PRIMER_NUM_RETURN': 10,
        'PRIMER_OPT_SIZE': 23,
        'PRIMER_MIN_SIZE': 20,
        'PRIMER_MAX_SIZE': 25,
        'PRIMER_OPT_TM': 59.0,
        'PRIMER_MIN_TM': 57.0,
        'PRIMER_MAX_TM': 61.0,
        'PRIMER_MIN_GC': 40.0,
        'PRIMER_MAX_GC': 60.0,
        'PRIMER_THERMODYNAMIC_OLIGO_ALIGNMENT': 1,
        'PRIMER_MAX_POLY_X': 100,
        'PRIMER_INTERNAL_MAX_POLY_X': 100,
        'PRIMER_SALT_MONOVALENT': 50.0,
        'PRIMER_DNA_CONC': 50.0,
        'PRIMER_MAX_NS_ACCEPTED': 0,
        'PRIMER_MAX_SELF_ANY': 12,
        'PRIMER_MAX_SELF_END': 8,
        'PRIMER_PAIR_MAX_COMPL_ANY': 12,
        'PRIMER_PAIR_MAX_COMPL_END': 8,
        'PRIMER_PRODUCT_SIZE_RANGE': [140,160],
        'PRIMER_GC_CLAMP': 1
}

## function of read fasta
def readfasta(lines):
    seq = []
    index = []
    seqplast = ""
    numlines = 0
    for i in lines:
        if ">" in i:
            index.append(i.replace("\n", "").replace(">", ""))
            seq.append(seqplast.replace("\n", ""))                       
            seqplast = ""
            numlines += 1
        else:
            seqplast = seqplast + i.replace("\n", "")
            numlines += 1
        if numlines == len(lines):                                      
            seq.append(seqplast.replace("\n", ""))
    seq = seq[1:]                                                                  
    return index, seq

## function of split table in txt
def str_split(lines):
    list2 = lines.split()
    return list2

## read fasta
f = open('/Users/lichuanshun/Desktop/Ta_NaCl_cds_name.txt', 'r')
lines = f.readlines()
(index, seq) = readfasta(lines)
f.close()

## build table
primer_df = pd.DataFrame()

## primer finder, dic -> datafrme
for i in range(len(index)):
    seq_args = {
        'SEQUENCE_ID': str(index[i]),
        'SEQUENCE_TEMPLATE': str(seq[i]),
        'SEQUENCE_INCLUDED_REGION': [0,len(seq[i])-1],
        }
    GeneID = str(index[i])
    
    primer3_result = primer3.bindings.designPrimers(seq_args, global_args)

    ## change dic
    primer3_result_table_dict = {} 
    for j in range(primer3_result["PRIMER_PAIR_NUM_RETURNED"]):
        primer_id = str(j) 
        for key in primer3_result: 
            if primer_id in key:
                # 要將每個(gè)信息中的數(shù)字和下劃線去掉
                info_tag = key.replace("_" + primer_id, "")
                # 就是把不同的引物對(duì)結(jié)果歸到一起
                try:
                    primer3_result_table_dict[info_tag] 
                except:
                    primer3_result_table_dict[info_tag] = [] 
                finally:
                    primer3_result_table_dict[info_tag].append(primer3_result[key])

    df_index = []      
    
    ## append dataframe    
    for m in range(primer3_result["PRIMER_PAIR_NUM_RETURNED"]):
        df_index.append(GeneID + "_" + str(m + 1))
    primer3_result_df = pd.DataFrame(primer3_result_table_dict, index=df_index)
    primer_df = primer_df.append(primer3_result_df)

## writing csv & txt
primer_df.to_csv("/Users/lichuanshun/Desktop/primer3_result.csv")
primer_df.to_csv("/Users/lichuanshun/Desktop/primer3_result.txt", sep='\t')

## read txt
f_gtf = open('/Users/lichuanshun/Desktop/primer3_result.txt', 'r')
lines_gtf = f_gtf.readlines()
f_gtf.close()

## writing fasta of primer
fo = open('/Users/lichuanshun/Desktop/qpcr_primer.txt', 'w')
for i in range(1,len(lines_gtf)):
    fo.write('>' + str_split(lines_gtf[i])[0] + '_F' + '\n'
              + str_split(lines_gtf[i])[4] + '\n' 
              + '>' + str_split(lines_gtf[i])[0] + '_R' + '\n' 
              + str_split(lines_gtf[i])[5] + '\n' )

fo.close()

參考教程:
https://mp.weixin.qq.com/s/MA7Tw7KOwB1phZmUoEy02g
http://www.chenlianfu.com/?tag=primer

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末姨谷,一起剝皮案震驚了整個(gè)濱河市逗宁,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌梦湘,老刑警劉巖疙剑,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異践叠,居然都是意外死亡言缤,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門禁灼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來管挟,“玉大人,你說我怎么就攤上這事弄捕∑ⅲ” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵守谓,是天一觀的道長穿铆。 經(jīng)常有香客問我,道長斋荞,這世上最難降的妖魔是什么荞雏? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上凤优,老公的妹妹穿的比我還像新娘悦陋。我一直安慰自己,他們只是感情好筑辨,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布俺驶。 她就那樣靜靜地躺著,像睡著了一般棍辕。 火紅的嫁衣襯著肌膚如雪暮现。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天楚昭,我揣著相機(jī)與錄音送矩,去河邊找鬼。 笑死哪替,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的菇怀。 我是一名探鬼主播凭舶,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼爱沟!你這毒婦竟也來了帅霜?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤呼伸,失蹤者是張志新(化名)和其女友劉穎身冀,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體括享,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡搂根,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了铃辖。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖髓考,靈堂內(nèi)的尸體忽然破棺而出纵刘,到底是詐尸還是另有隱情,我是刑警寧澤犬第,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布锦积,位于F島的核電站,受9級(jí)特大地震影響歉嗓,放射性物質(zhì)發(fā)生泄漏丰介。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望基矮。 院中可真熱鬧淆储,春花似錦、人聲如沸家浇。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽钢悲。三九已至点额,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間莺琳,已是汗流浹背还棱。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留惭等,地道東北人珍手。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像辞做,于是被迫代替她去往敵國和親琳要。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353