全國計算機信息高新技術(shù)考試生物信息分析(中級)
考 試 大 綱
第一單元 基因組學(xué)相關(guān)基礎(chǔ)知識(8分)
1黍瞧、人類基因組組成與遺傳規(guī)律:DNA的分子結(jié)構(gòu)样漆、DNA復(fù)制方式出皇、人類基因組DNA序列特征(2分)裆蒸;
2分井、基因及其表達與調(diào)控:基因的基本結(jié)構(gòu)徘熔、基因的表達门躯、基因表達的調(diào)控(2分);
3近顷、基因突變及其生物學(xué)效應(yīng):基因突變類型生音、基因突變的生物學(xué)效應(yīng)、基因突變的誘變因素窒升;DNA損傷的修復(fù)(2分)缀遍;
4、人類基因組學(xué):人類基因組計劃饱须、人類基因組單體型圖計劃域醇、人類DNA元件百科全書計劃、人類表觀基因組計劃、癌癥基因組圖譜計劃(2分)譬挚。
第二單元 測序技術(shù)相關(guān)基本知識(10分)
1锅铅、PCR技術(shù)的基本原理與流程:PCR實驗原理、PCR實驗流程减宣、影響PCR循環(huán)反應(yīng)體系正常運轉(zhuǎn)的關(guān)鍵因素(2分)盐须;
2、第一代測序技術(shù):Sanger 雙脫氧末端終止法測序原理漆腌、測序特點贼邓、技術(shù)流程及優(yōu)劣勢;(2分)
3闷尿、第二代測序技術(shù):五種不同測序平臺(454焦磷酸測序塑径、SOLiD 連接測序、Illumina 邊合成邊測序技術(shù)填具、Ion Torrent 半導(dǎo)體測序技術(shù)统舀、華大基因Complete Genomics測序儀)的測序原理、測序特點劳景、不同測序平臺文庫構(gòu)建類型誉简、不同類型文庫構(gòu)建原理、下機數(shù)據(jù)特點枢泰、技術(shù)流程及優(yōu)缺點描融;(5分)
4、第三代單分子測序技術(shù):Nanopore測序原理及流程衡蚂、單分子實時(SMRT)DNA測序窿克、文庫制備、測序原理及數(shù)據(jù)讀取方法毛甲。(1分)年叮。
第三單元 生物統(tǒng)計學(xué)方法與原理(6分)
1、生物統(tǒng)計學(xué)相關(guān)基本概念及原理:生物信息分析中涉及到的均值玻募、眾數(shù)只损、中位數(shù)、中程數(shù)七咧、N50跃惫、概率、誤差艾栋、變量爆存、數(shù)據(jù)分布、顯著性檢驗蝗砾、p值先较、相關(guān)性携冤、離散程度等統(tǒng)計學(xué)基本概念。(3分)
2闲勺、常用生物數(shù)據(jù)統(tǒng)計方法:多重檢驗曾棕、假設(shè)檢驗、差異分析菜循、多重矯正翘地、數(shù)據(jù)統(tǒng)計特征、Lander-Waterman模型债朵、基因組特征參數(shù)估計子眶、數(shù)據(jù)分析結(jié)果的展示與評論(3分)。
第四單元 Linux系統(tǒng)的基本操作與常用命令(6分)
1.Linux 操作系統(tǒng)安裝:個人電腦安裝Linux虛擬機安裝的具體流程與方法(1分)序芦;
2.Linux 操作系統(tǒng)基本操作:Linux操作系統(tǒng)安裝與登錄方法、簡單的集群登錄與操作方法(1分)粤咪;
3.Linux 操作系統(tǒng)常用基本命令:pwd谚中,cd,mkdir寥枝,rm宪塔,cp,mv囊拜,cat某筐,less,wc冠跷,cut南誊,uniq,df等常用命令(2分)蜜托;
4.Linux 操作系統(tǒng)常用操作符號:|抄囚,>,>>等常用操作符號(1分)橄务;
5.VI編輯器的使用方法幔托;(1分)。
第五單元 Perl 語言簡單編程與數(shù)據(jù)處理分析(10分)
1蜂挪、perl語言編程環(huán)境重挑、編程語言的格式:變量、標量數(shù)據(jù)棠涮、換行符谬哀、列表與數(shù)組、哈希故爵、正則表達式玻粪、perl語言的幫助系統(tǒng)(2分)隅津;
2、perl語言各命令劲室、代碼的含義及文件信息處理:文件的輸入與文件輸出伦仍、序列提取、子程序很洋、統(tǒng)計FASTA序列文件子程序(2分)充蓝;
3、perl語言的常用基本操作:利用perl讀取FASTA文件中堿基序列喉磁,統(tǒng)計FASTA文件的CG含量谓苟,統(tǒng)計序列的長度分布、并對測序數(shù)據(jù)進行刪除协怒、挑取涝焙、排序等基礎(chǔ)操作(2分);
4孕暇、在Perl程序中調(diào)用其它軟件:Perl里調(diào)用R仑撞、Perl里調(diào)用BWA比對軟件、Perl里調(diào)用Samtools軟件妖滔、Perl里調(diào)用Soap SNP軟件隧哮、Perl里調(diào)用GATK軟件(2分);
5座舍、利用perl編寫簡單的生物信息分析程序:(格式轉(zhuǎn)換程序沮翔、利用正則表達式處理文本、基因組信息的統(tǒng)計曲秉、遺傳漂變模擬等)(2分)采蚀。
第六單元 R語言編程、繪圖及生物統(tǒng)計分析(10分)
1.R語言相關(guān)基礎(chǔ)知識:R語言的歷史岸浑、定義搏存、功能、現(xiàn)狀矢洲、優(yōu)勢及幫助系統(tǒng)璧眠;R程序的安裝與運行;R語言的語法读虏、對象及屬性责静;(2分)
2.使用R對生物數(shù)據(jù)進行統(tǒng)計分析: R語言數(shù)據(jù)結(jié)構(gòu)、類型及常用運算符盖桥;R數(shù)據(jù)結(jié)構(gòu)——向量建立灾螃、向量運算、數(shù)組揩徊、數(shù)據(jù)框腰鬼、列表嵌赠、因子、 R程序設(shè)計熄赡;生物統(tǒng)計數(shù)據(jù)的讀取與存儲——數(shù)據(jù)瀏覽與編輯姜挺、數(shù)據(jù)讀取、分析與存儲彼硫;(3分)
3.R的基礎(chǔ)繪圖工具:常用繪圖函數(shù)的含義炊豪、高級繪圖參數(shù)、常用繪圖參數(shù)拧篮、畫圖面板分割及圖形保存(2分)
4.使用R繪制簡單圖形:散點圖词渤、條形圖、文氏圖串绩、餅圖缺虐、盒形圖&頻率直方圖、熱圖的繪制方法(3分)赏参。
第七單元 生物信息分析常用軟件及分析方法(40分)
1志笼、生物信息分析相關(guān)序列比對原理、算法把篓、流程及軟件使用方法:序列比對原理、流程及常用軟件使用方法——序列比對原理與算法 腰涧、常用全局比對軟件使用方法韧掩、常用局部比對軟件、Blast在線軟件窖铡、常用短序列比對軟件 SOAP2 疗锐;數(shù)據(jù)的質(zhì)量控制及結(jié)果解讀(10分);
2费彼、基因組de novo組裝:基因組de novo組裝原理及常用軟件使用方法——組裝的概念滑臊、意義相關(guān)基礎(chǔ)知識、mate-pair文庫構(gòu)建 箍铲、不同測序數(shù)據(jù)特點雇卷、組裝基本思路 、overlap颠猴、Contig关划、scaffold、N50等基本概念翘瓮、利用測序深度及泊松分布模型預(yù)估測序數(shù)據(jù)量贮折、Kmer深度分布 、Kmer分析方法的其他應(yīng)用范圍 资盅、組裝的具體流程和算法调榄、組裝結(jié)果影響因素踊赠、組裝常用結(jié)果評估指標、SOAP de novo 組裝軟件下載安裝與使用方法每庆、下機數(shù)據(jù)質(zhì)量控制筐带、基因組大小的評估&數(shù)據(jù)糾錯、SOAP de novo 配置文件(10分)扣孟;
3烫堤、基因組重測序:基因組重測序原理及常用軟件使用方法——比對方法及常見問題說明、比對數(shù)據(jù)的質(zhì)量控制,深度與覆蓋度統(tǒng)計凤价、變異檢測鸽斟、結(jié)構(gòu)變異檢測、突變檢測數(shù)據(jù)QC利诺、數(shù)據(jù)注釋突變數(shù)據(jù)庫富蓄、群體遺傳突變分析(10分);
4慢逾、基因注釋:基因注釋原理立倍、流程及常用軟件使用方法——基因組組裝結(jié)果是否符合注釋要求的結(jié)果評估與質(zhì)量控制、不同類型重復(fù)序列預(yù)測方法及分析流程侣滩、利用Genscan口注、Glimmer進行基因結(jié)構(gòu)注釋的軟件使用方法、利用Genewise進行基因同源結(jié)構(gòu)預(yù)測的流程及軟件使用方法君珠;利用tRNAscan進行ncRNA預(yù)測的操作方法寝志、數(shù)據(jù)的質(zhì)量控制及結(jié)果解讀(10分)。
第八單元 生物信息分析常用數(shù)據(jù)庫 (10分)
1策添、NCBI數(shù)據(jù)庫的結(jié)構(gòu)材部、使用方法、NCBI PubMed 文獻檢索方法唯竹;(2分)
2乐导、GO功能注釋數(shù)據(jù)庫的組成、結(jié)構(gòu)浸颓、用途及在線檢索方法物臂;(2分)
3、KEGG數(shù)據(jù)庫的組成猾愿、結(jié)構(gòu)鹦聪、用途、在線檢索方法及其生物學(xué)意義蒂秘;(2分)
4泽本、DAVID數(shù)據(jù)庫的組成、結(jié)構(gòu)姻僧、用途规丽、在線檢索方法及其生物學(xué)意義蒲牧;(2分)
5、UCSC赌莺、UniProt冰抢、UniRef、UniPare等數(shù)據(jù)庫的結(jié)構(gòu)及其代表的生物學(xué)意義及其使用方法(2分)艘狭。