項(xiàng)目一：序列文件處理

Script1 讀取fastq and fasta格式的文件（列表和生成器兩種模式）

"""
FASTQ 讀取
FASTA 讀取
...
"""
import gzip


def load_fastx(file: str) -> list:
    """

    :param str file: path of input <fastq | fastq.gz | fasta | fasta.gz>
    :return: a list for all reads:
        i.e. [['header', 'seq', 'info', 'quality'], [...],[...]]
    :rtype: list
    """
    f = open(file, 'rt') if not '.gz' in file else gzip.open(file, 'rt')
    # FASTQ @  FASTA >
    symbol = f.read(1)
    # print(symbol)
    f.close()
    # 全部載入內(nèi)存就好脖卖，當(dāng)文件很小的時(shí)候
    f = open(file, 'rt') if not '.gz' in file else gzip.open(file, 'rt')

    if symbol == '@':
        # FASTQ
        # print('is fastq')
        ls = []
        read = []
        raw_info = [i.rstrip() for i in f.readlines()]
        line_fix = None  # 為了 fix quality 中開頭為@的情況

        # for line in tqdm(raw_info):
        for line in raw_info:
            if line.startswith('@'):
                n = len(read)
                if n == 0:
                    # 第一次循環(huán)開始
                    read.append(line)  # add header
                elif n == 4:
                    # 后面的循環(huán)開始
                    ls.append(read)
                    read = []
                    read.append(line)  # add header
                elif n == 3:
                    # try to add quality line
                    """Fix a bug.
                    如果第 4 行是@開頭,先正常操作一行 read 的 append,再判斷下一行是否是@開頭,如果不是,文件損壞,如果是,沒問題繼續(xù)
                    ['@Beta12AdemL1C001R00100001768/1', 
                    'ATCCCCGTATCTTCACCCCACCACAAACTATTAGCTTTAGA', 
                    '+']
                    '@@IIEIBCE>IC<IBIIIIEAIEIEB<IDECCD6ICBCED<'
                    """
                    # print(read)
                    # print(line)
                    if line_fix:
                        # 遇到需要fix的下一次循環(huán)
                        read.append(line_fix)
                        ls.append(read)
                        read = []
                        read.append(line)
                        line_fix = None
                    else:
                        # 第一次遇到需要 fix 的 line
                        line_fix = line
                else:
                    f.close()
                    raise ValueError('The file may be incomplete!')
            else:
                read.append(line)  # add other three lines: seq, info, quality

        ls.append(read)
        f.close()
        return ls


    elif symbol == '>':
        # FASTA
        # print('is fasta!')
        ls = []
        read = []
        seq = ''
        raw_info = [i.rstrip() for i in f.readlines()]
        # print(raw_info)

        for line in raw_info:
            if line.startswith('>'):
                # 讀取 header哪痰！
                n = len(read)

                if n == 0:
                    # 第一次循環(huán)
                    read.append(line)
                elif n == 1:
                    # 已經(jīng)有一個(gè) header 了！現(xiàn)在缺 seq
                    read.append(seq)  # add seq line
                    ls.append(read)
                    read = []  # 重置 read 這個(gè) list
                    read.append(line)
                    seq = ''  # 重置 seq 這個(gè) str
                else:
                    f.close()
                    raise ValueError('The file may be incomplete!')
            else:
                # 讀取并添加 seq
                seq += line

        read.append(seq)
        ls.append(read)
        return ls
    else:
        raise ValueError('Input line one must starts with @ for FQ or > for FA!')
    # f.close()

# 當(dāng)文件很大的時(shí)候，用生成器函數(shù)惨篱，產(chǎn)生一個(gè)迭代器來進(jìn)行文件讀取
def load_fastx_generator(file):
    """

    :param str file: path of input <fastq | fastq.gz | fasta | fasta.gz>
    :return: a generator for all reads:
        i.e. print(next(obj)) -> ['header', 'seq', 'info', 'quality']
    :rtype: generator
    """
    f = open(file, 'rt') if not '.gz' in file else gzip.open(file, 'rt')
    # FASTQ @  FASTA >
    symbol = f.read(1)
    # print(symbol)
    f.close()
    # 全部載入內(nèi)存就好，當(dāng)文件很小的時(shí)候
    f = open(file, 'rt') if not '.gz' in file else gzip.open(file, 'rt')

    if symbol == '@':
        # FASTQ
        # print('is fastq!')
        # ls = []
        read = []
        line = f.readline().rstrip()

        while True:
            if not line:
                break
            else:
                if line.startswith('@'):
                    n = len(read)
                    if n == 0:
                        # read == []
                        # 第一次循環(huán)開始
                        read.append(line)  # add header!
                        line = f.readline().rstrip()
                    elif n == 4:
                        # read == ['header', 'seq', 'info', 'quality']
                        # ls.append(read)
                        yield read
                        read = []
                        read.append(line)
                        line = f.readline().rstrip()
                    elif n == 3:
                        # TODO
                        """
                        @@IIEIBCE>IC<IBIIIIEAIEIEB<IDECCD6 # line! 期望它是 header州疾！現(xiàn)在它是 quality
                        [
                            '@Beta12AdemL1C001R00100001768/1', 
                            'ATCCCCGTATCTTCACCCCACCACAAACTATTAG', 
                            '+',
                        ]'@@IIEIBCE>IC<IBIIIIEAIEIEB<IDECCD6'

                        """
                        read.append(line)
                        line = f.readline().rstrip()

                        if not line.startswith('@'):
                            raise ValueError('The file may be incomplete!')
                    else:
                        f.close()
                        raise ValueError('The file may be incomplete!')

                    # header line!
                    # read.append(line)  # add header !
                else:
                    # not header line!
                    read.append(line)
                    line = f.readline().rstrip()

        # ls.append(read)
        yield read
        f.close()
        # return ls


    elif symbol == '>':
        # FASTA
        # print('is fasta!')
        ls = []
        read = []
        seq = ''
        # raw_info = [i.rstrip() for i in f.readlines()]
        line = f.readline().rstrip()
        # print(raw_info)

        while True:
            if not line:
                break
            else:
                if line.startswith('>'):
                    # 讀取 header剂习！
                    n = len(read)

                    if n == 0:
                        # 第一次循環(huán)
                        read.append(line)
                        line = f.readline().rstrip()
                    elif n == 1:
                        # 已經(jīng)有一個(gè) header 了！現(xiàn)在缺 seq
                        read.append(seq)  # add seq line
                        # ls.append(read)
                        yield read
                        read = []  # 重置 read 這個(gè) list
                        read.append(line)
                        line = f.readline().rstrip()
                        seq = ''  # 重置 seq 這個(gè) str
                    else:
                        f.close()
                        raise ValueError('The file may be incomplete!')
                else:
                    # 讀取并添加 seq
                    seq += line
                    line = f.readline().rstrip()

        read.append(seq)
        # ls.append(read)
        yield read
        # return ls
    else:
        f.close()
        raise ValueError('Input line one must starts with @ for FQ or > for FA!')
    f.close()

if __name__ == '__main__':
    FQ_TEST = '/mnt/alamo01/users/dengys/Learn/Python/Python課程資料-20220924-第4次課-實(shí)戰(zhàn)項(xiàng)目 1/fake_fa.fasta'
    FA_TEST = '/mnt/alamo01/users/dengys/Learn/Python/Python課程資料-20220924-第4次課-實(shí)戰(zhàn)項(xiàng)目 1/fake_fq.fastq'
    # ls = load_fastx(file=FQ_TEST)
    # print(ls)
    # print(ls[-1][0])
    #
    # ls = load_fastx(file=FA_TEST)
    # print(ls)
    # pass

    # it = load_fastx_generator(file=FQ_TEST)
    # print(it)
    # print(next(it))
    # print(next(it))
    # print(next(it))
    # print(next(it))
    # print(next(it))

    # for i in it:
    #     print(i)

    # while True:
    #     try:
    #         print(next(it))
    #     except StopIteration:
    #         print("循環(huán)完了")
    #         break


    it = load_fastx_generator(file=FA_TEST)
    print(it)
    # print(next(it))
    # print(next(it))
    # print(next(it))
    # print(next(it))
    # print(next(it))

Script2 基因序列的操作

"""
1. 讀取 FASTQ 文件并以 FASTA 文件格式輸出
2. 解析 FASTQ 的質(zhì)量值逊移，計(jì)算 Q30的比例
"""
import gzip
import random
from coden import CODEN#還可以從其它py文件中導(dǎo)入字典
from tqdm import tqdm#顯示進(jìn)度
from loader import load_fastx, load_fastx_generator


# 面向?qū)ο笤み海 fasta, Genome, Transcriptome
class Genome():
    """Genome class.
    """
    PAIR = {k: v for k, v in zip('AGCTUN', 'TCGAAN')}


    def __init__(self, file):
        """

        :param file:
        """

        self.__FILE_PATH = file
        # load genome
        self.GENOME = {}
        self.__parse_genome()
        self.__genome_length = {}
        self.__gc_ratio = {}
        self.__effective_length = {}
        #
        # print(self.GENOME.keys())

    def __parse_genome(self):
        print("Parse genome...")

        # for chrom, seq in tqdm(load_fastx(file=self.__FILE_PATH)):
        for chrom, seq in load_fastx_generator(file=self.__FILE_PATH):
            chrom = chrom[1:]  # >chr1
            self.GENOME[chrom] = seq.upper()  # ggg GGG
                # .replace('U', 'T')

    def replace_base(self, *args, convert: dict):
        # {'A': 'T', 'U': 'T'}
        # U to T
        # C to T
        print("Replace base...")
        # print(args)

        if not args:
            args = self.GENOME.keys()
            print(f'chromesomes are not specified, use all: {list(args)}')
        else:
            print(f'chromesomes are specified, use: {sorted(list(args))}')

        for chrom in args:
            for k, v in convert.items():
                self.GENOME[chrom] = self.GENOME[chrom].replace(k, v)
    def reverse_complement(self):
        print('Reverse complement...')

        for chrom in tqdm(self.GENOME.keys()):
            # reverse
            self.GENOME[chrom] = self.GENOME[chrom][::-1]##
            # complement
            self.GENOME[chrom] = ''.join([self.PAIR[base] for base in self.GENOME[chrom]])


    def __calculate_length(self):
        print('calculate_length...')

        for chrom in self.GENOME.keys():
            self.__genome_length[chrom] = len(self.GENOME[chrom])

    def get_length(self):
        self.__calculate_length()
        return self.__genome_length

    def __calculate_gc_ratio(self):
        print('calculate_gc_ratio...')

        for chrom in self.GENOME.keys():
            seq = self.GENOME[chrom]
            total = len(seq)
            g = seq.count('G')
            c = seq.count('C')
            self.__gc_ratio[chrom] = (g + c) / total

    def get_gc_ratio(self):
        self.__calculate_gc_ratio()
        return self.__gc_ratio

    def __calculate_effective_length(self):
        print('calculate_effective_length...')

        for chrom in self.GENOME.keys():
            seq = self.GENOME[chrom]
            total = len(seq)
            n = seq.count('N')
            self.__effective_length[chrom] = total - n
    def get_effective_length(self):
        self.__calculate_effective_length()
        return self.__effective_length


# 1. 讀取 FASTQ 文件并以 FASTA 文件格式輸出
def fastq_to_fasta(file, out_name, use_iter=True):
    """Convert FASTQ to FASTA.

    :param str file: path of a <fastq | fastq.gz>
    :param str out_name: path of a <fasta | fasta.gz>
    :param bool use_iter: True-> iterator, False -> list to loop
    :return: None
    """

    if use_iter:
        # use iterator
        reads = load_fastx_generator(file=file)
    else:
        # use list
        reads = load_fastx(file=file)

    # print(reads)
    # print(type(reads))

    f = open(out_name, 'wt') if not '.gz' in out_name else gzip.open(out_name, 'wt')

    for header, seq, _, _, in reads:
        # print(header, seq)
        header = '>' + header[1:]
        # print(header, seq)
        f.write(
            f'{header}\n{seq}\n'
        )
    f.close()
    print("Covert done!")


# 2. 解析 FASTQ 的質(zhì)量值，計(jì)算 Q30的比例,Qwhat?,>Q? <Q?
def get_aim_quality_ratio(file, quality=30, method='>Q', use_iter=True):
    """Calculate aim quality ratio > quality or < quality.

    :param str file: path of a <fastq | fastq.gz>
    :param int quality: the quality to compare with( shoud > 0 )
    :param str method: how to compare
    :param bool use_iter: True-> iterator, False -> list to loop
    :return: aim quality ratio
    :rtype: float
    """

    if use_iter:
        # use iterator
        reads = load_fastx_generator(file=file)
    else:
        # use list
        reads = load_fastx(file=file)

    # Phred(quality) = -10 * log10(errorP)  # errorP胳泉，以 illumina 為例, 0.001, -3 * - 10 = 30
    # 30 + 33 -> ASCII  # 0~ 127 = 128
    # Q/Phred + 33 -> ASCII
    # Q/Phred ASCII->value - 33
    total_base = 0
    total_base_aim = 0

    for _, _, _, r_quality in reads:
        q = [ord(base) - 33 for base in r_quality]

        if method == '>Q':
            q_aim = [i for i in q if i > quality]
        elif method == '<Q':
            q_aim = [i for i in q if i < quality]
        else:
            raise ValueError('Param method is wrong!')

        # print(q)
        # print(q_aim)
        total_base += len(q)
        total_base_aim += len(q_aim)

    return total_base_aim / total_base


# 3. trim fastq
def trim_fastq(file, out_name, trim_start: int = 0, trim_end: int = None, use_iter: bool = True):
    """

    :param file:
    :param out_name:
    :param trim_start:
    :param trim_end:
    :param use_iter:
    :return:
    """

    try:
        assert 0 <= trim_start < trim_end
    except AssertionError:
        print('Must follow this: 0 <= trim_start < trim_end')

    if use_iter:
        # use iterator
        reads = load_fastx_generator(file=file)
    else:
        # use list
        reads = load_fastx(file=file)

    f = open(out_name, 'wt') if not '.gz' in out_name else gzip.open(out_name, 'wt')

    for header, seq, info, r_quality, in reads:
        # print(header, seq, info, r_quality)
        # AGCTACTAAACCCCC
        # 012345678910
        seq = seq[trim_start: trim_end]  # [) step1
        r_quality = r_quality[trim_start: trim_end]  # [) step1

        f.write(
            f'{header}\n{seq}\n{info}\n{r_quality}\n'
        )
    f.close()
    print("Trim done!")


def filter_fastq(file, out_name, tiles_to_drop: list, use_iter: bool = True):
    """

    :param file:
    :param out_name:
    :param tiles_to_drop:
    :param use_iter:
    :return:
    """

    if use_iter:
        # use iterator
        reads = load_fastx_generator(file=file)
    else:
        # use list
        reads = load_fastx(file=file)

    f = open(out_name, 'wt') if not '.gz' in out_name else gzip.open(out_name, 'wt')

    counter_dropped_reads = 0
    counter_all_reads = 0

    for header, seq, info, r_quality, in reads:
        # header : illumina style! mgi no! fake no!
        # print(header)
        counter_all_reads += 1

        try:
            tile = int(header.split('\t')[0].split(':')[-3])
        except IndexError:
            print("Parse <header> failed!\n"
                  "Please make sure this FASTQ is an illumina NGS file!\n"
                  f"\t<header>: {header}\n")
        # print(tile)

        if tile not in tiles_to_drop:
            # 寫出去
            f.write(
                f'{header}\n{seq}\n{info}\n{r_quality}\n'
            )
        else:
            # 不寫拐叉，去掉
            counter_dropped_reads += 1
    f.close()
    print("Filter done!")
    print(f"\t{counter_dropped_reads}/{counter_all_reads} reads"
          f" ({counter_dropped_reads/counter_all_reads: .3%}) were dropped!")


# fasta --> AA seq
def translate(file, out_name, use_iter: bool = True):
    """

    :param file:
    :param out_name:
    :param use_iter:
    :return:
    """

    if use_iter:
        # use iterator
        reads = load_fastx_generator(file=file)
    else:
        # use list
        reads = load_fastx(file=file)

    dt_start_coden = {k: v for k, v in CODEN.items() if '#' in v}
    dt_stop_coden = {k: v for k, v in CODEN.items() if '$' in v}
    print(dt_start_coden)
    print(dt_stop_coden)
    print(CODEN)
    # seq.upper()
    # T to U
    # start coden
    # stop coden


    f = open(out_name, 'wt') if not '.gz' in out_name else gzip.open(out_name, 'wt')


    for header, seq in reads:
        # 只考慮AUG
        # fix seq start
        seq = seq.upper().replace('T', 'U')
        start = seq.find('AUG')#找到AUG中A的索引下標(biāo)
        seq = seq[start:]#從AUG開始截取seq得到新的seq
        seq_aa = ''

        while True:
            if len(seq) >= 3:
                aa = CODEN[seq[:3]].replace('#', '').replace('$', '')
                seq = seq[3:]

                if aa:
                    # 正常密碼子
                    seq_aa += aa
                else:
                    # stop coden!
                    print('Stop!')
                    seq_aa += '\n'
                    break
            else:
                seq_aa += '\n'
                break
        f.write(f'{header} translate to AA\n{seq_aa}\n')
    f.close()
    pass

# down sampling FASTQ (隨機(jī)取一部分 reads)
def down_sampling(file, out_name, ratio: float = None, number: int = None):
    """
    :param file:
    :param out_name:
    :param ratio:
    :param number:
    :param use_iter:
    :return:
    """
    # use list
    reads = load_fastx_generator(file=file)
    count_all_reads = 0

    for read in reads:
        count_all_reads += 1
    reads = load_fastx_generator(file=file)

    if ratio and number:
        raise ValueError("Only one of ratio and number can be defined!")
    elif ratio:
        assert 0<= ratio <= 1
        number = int(count_all_reads * ratio)
    elif number:
        if number > count_all_reads:
            raise ValueError(f"number must <= total: {count_all_reads}")
    else:
        raise ValueError("Only/Must one of ratio and number can be defined!")

    # number
    # random select
    to_be_select = random.sample(range(count_all_reads), number)
    # print(to_be_select)
    to_be_select.sort(reverse=True)
    # print(to_be_select)

    f = open(out_name, 'wt') if not '.gz' in out_name else gzip.open(out_name, 'wt')

    idx = 0
    select = to_be_select.pop()
    try:
        for header, seq, info, r_quality, in reads:
            # print(idx, select, to_be_select)

            if idx == select:
                # write
                f.write(f'{header}\n{seq}\n{info}\n{r_quality}\n')
                idx += 1
                select = to_be_select.pop()
            else:
                idx += 1
                continue
    except IndexError:
        print('Down sampling done!')
    f.close()
    print(f"\t{number}/{count_all_reads} reads {number/count_all_reads: .3%} were selected!")

if __name__ == '__main__':
    # ------------------------------------------------------------------->>>>>>>>>>
    # files
    # ------------------------------------------------------------------->>>>>>>>>>
    FQ_TEST = '../2022-09-25_Prepared_data/FASTQ/fake_fq.fastq'
    FA_TEST = '../2022-09-25_Prepared_data/FASTA/fake_fa.fasta'
    FQ_TEST2 = '../2022-09-25_Prepared_data/FASTQ/from_illumina/from_illumina_R1.fastq.gz'
    FQ_TEST3 = '../2022-09-25_Prepared_data/FASTQ/from_mgi/from_mgi_R1.fastq.gz'
    FA_TEST2 = '../2022-09-25_Prepared_data/FASTA/mRNA_CTCF_NM_001191022.2.fa'
    GENOME_TEST = '../2022-09-25_Prepared_data/FASTA/genome_XY_for_test.fa.gz'
    GENOME = '../2022-09-25_Prepared_data/FASTA/genome_ucsc_mm39.fa.gz'
    GENOME_FAKE = '../2022-09-25_Prepared_data/FASTA/genome_fake.fa'
    # ------------------------------------------------------------------->>>>>>>>>>
    # fastq_to_fasta
    # ------------------------------------------------------------------->>>>>>>>>>
    # fastq_to_fasta(file=FQ_TEST, out_name='test_fastq_to_fasta.fasta.gz')
    # fastq_to_fasta(file=FQ_TEST, out_name='test_fastq_to_fasta.fasta', use_iter=False)
    # fastq_to_fasta(file=FQ_TEST, out_name='test_fastq_to_fasta.fasta', use_iter=True)
    # TODO Fix MGI line4 @@
    # fastq_to_fasta(file=FQ_TEST3, out_name='test_fastq_to_fasta3.fasta', use_iter=True)
    # fastq_to_fasta(file=FQ_TEST3, out_name='test_fastq_to_fasta3.fasta', use_iter=False)
    # ------------------------------------------------------------------->>>>>>>>>>
    # get_aim_quality_ratio
    # ------------------------------------------------------------------->>>>>>>>>>
    # print(get_aim_quality_ratio(file=FQ_TEST, use_iter=False))
    # print(get_aim_quality_ratio(file=FQ_TEST2, quality=30, method='>Q', use_iter=True))
    # print(get_aim_quality_ratio(file=FQ_TEST2, quality=30, method='>Q', use_iter=False))
    # print(get_aim_quality_ratio(file=FQ_TEST2, quality=20, use_iter=True))
    # print(get_aim_quality_ratio(file=FQ_TEST2, quality=20, method='<Q', use_iter=True))
    # TODO Fix MGI line4 @@
    # print(get_aim_quality_ratio(file=FQ_TEST3, quality=20, method='<Q', use_iter=True))
    # print(get_aim_quality_ratio(file=FQ_TEST3, quality=20, method='<Q', use_iter=False))
    # ------------------------------------------------------------------->>>>>>>>>>
    # trim_fastq
    # ------------------------------------------------------------------->>>>>>>>>>
    # illumina
    # trim_fastq(file=FQ_TEST2, out_name='test_trim_fastq2.fastq', trim_start=0, trim_end=109)
    # fake
    # trim_fastq(file=FQ_TEST, out_name='test_trim_fastq.fastq', trim_start=1, trim_end=10)
    # mgi
    # trim_fastq(file=FQ_TEST3, out_name='test_trim_fastq3.fastq', trim_start=0, trim_end=109)
    # ------------------------------------------------------------------->>>>>>>>>>
    # filter_fastq
    # ------------------------------------------------------------------->>>>>>>>>>
    # illumina
    # filter_fastq(file=FQ_TEST2, out_name='test_filter_fastq2.fastq.gz', tiles_to_drop=[2201, 1116])
    # fix bug (header has no tile info!)
    # filter_fastq(file=FQ_TEST, out_name='test_filter_fastq.fastq.gz', tiles_to_drop=[2201, 1116])
    # filter_fastq(file=FQ_TEST3, out_name='test_filter_fastq3.fastq.gz', tiles_to_drop=[2201, 1116])
    # ------------------------------------------------------------------->>>>>>>>>>
    # translate
    # ------------------------------------------------------------------->>>>>>>>>>
    # translate(file=FA_TEST2, out_name='test_translate.fa')
    # ------------------------------------------------------------------->>>>>>>>>>
    # Genome Ojb!
    # ------------------------------------------------------------------->>>>>>>>>>
    # genome = Genome(file=GENOME_TEST)
    # genome = Genome(file=GENOME)
    # genome = Genome(file=GENOME_FAKE)
    # # print(genome._Genome__FILE_PATH)
    # print(genome.GENOME)
    # genome.replace_base(convert={'C': 'T', 'U': 'T'})
    # print(genome.GENOME)

    # genome = Genome(file=GENOME_FAKE)
    # # print(genome.GENOME)
    # # genome.replace_base('chrM', 'chr1', convert={'C': 'T', 'U': 'T'})
    # print(genome.GENOME)
    # # genome.reverse_complement()
    # # print(genome.get_length())
    # # print(genome.get_gc_ratio())
    # # print(genome.get_effective_length())
    # ------------------------------------------------------------------->>>>>>>>>>
    # down_sampling
    # ------------------------------------------------------------------->>>>>>>>>>
    # down_sampling(file=FQ_TEST, out_name='test_down_sampling3.fastq.gz', ratio=0.1, number=20)
    # down_sampling(file=FQ_TEST, out_name='test_down_sampling3.fastq', ratio=0.6)
    # down_sampling(file=FQ_TEST, out_name='test_down_sampling3.fastq', number=3)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市扇商，隨后出現(xiàn)的幾起案子凤瘦，更是在濱河造成了極大的恐慌，老刑警劉巖钳吟，帶你破解...
沈念sama閱讀 206,126評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件廷粒，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)坝茎，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門涤姊，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人嗤放，你說我怎么就攤上這事思喊。” “怎么了次酌？”我有些...
開封第一講書人閱讀 152,445評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵恨课，是天一觀的道長。經(jīng)常有香客問我岳服，道長剂公，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,185評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任吊宋，我火速辦了婚禮纲辽，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘璃搜。我一直安慰自己拖吼，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 64,178評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布这吻。她就那樣靜靜地躺著吊档，像睡著了一般。火紅的嫁衣襯著肌膚如雪唾糯。梳的紋絲不亂的頭發(fā)上怠硼，一...
開封第一講書人閱讀 48,970評論 1贊 284
城市分裂傳說
那天，我揣著相機(jī)與錄音趾断，去河邊找鬼拒名。笑死，一個(gè)胖子當(dāng)著我的面吹牛芋酌，可吹牛的內(nèi)容都是我干的艺玲。我是一名探鬼主播时鸵，決...
沈念sama閱讀 38,276評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼缸废，長吁一口氣：“原來是場噩夢啊……” “哼仆百！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起堵腹，我...
開封第一講書人閱讀 36,927評論 0贊 259
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤炸站，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后疚顷，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體旱易，經(jīng)...
沈念sama閱讀 43,400評論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡禁偎，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,883評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了阀坏。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片如暖。...
茶點(diǎn)故事閱讀 37,997評論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖忌堂，靈堂內(nèi)的尸體忽然破棺而出盒至，到底是詐尸還是另有隱情，我是刑警寧澤士修，帶...
沈念sama閱讀 33,646評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布枷遂，位于F島的核電站，受9級特大地震影響棋嘲，放射性物質(zhì)發(fā)生泄漏酒唉。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,213評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一沸移、第九天我趴在偏房一處隱蔽的房頂上張望黔州。院中可真熱鬧，春花似錦阔籽、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,204評論 0贊 19
一樁弒父案笆制，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至涣达，卻和暖如春在辆，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背度苔。一陣腳步聲響...
開封第一講書人閱讀 31,423評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工匆篓，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人寇窑。一個(gè)月前我還...
沈念sama閱讀 45,423評論 2贊 352
代替公主和親
正文我出身青樓鸦概，卻偏偏與公主長得像，于是被迫代替她去往敵國和親甩骏。傳聞我的和親對象是個(gè)殘疾皇子窗市，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,722評論 2贊 345

項(xiàng)目一：序列文件處理

Script1 讀取fastq and fasta格式的文件（列表和生成器兩種模式）

Script2 基因序列的操作

推薦閱讀更多精彩內(nèi)容