蛋白質(zhì)聚集的分子動(dòng)力學(xué)模擬( Molecular dynamics simulations of protein aggregation)
蛋白質(zhì)紊亂和聚集在許多神經(jīng)退行性疾睬置伞(如阿爾茨海默病和帕金森病)的發(fā)病機(jī)制中起著重要作用赌莺。這些疾病中聚集過(guò)程的最終產(chǎn)物是高度結(jié)構(gòu)化的淀粉樣纖維司志。因此手蝎,合理設(shè)計(jì)靶向淀粉樣蛋白寡聚體形成的藥物,就需要全面了解驅(qū)動(dòng)蛋白質(zhì)聚集的物理化學(xué)力俐芯。原子級(jí)的分子動(dòng)力學(xué) (MD) 模擬提供了該過(guò)程最高的時(shí)間和空間分辨率棵介,可以捕捉淀粉樣蛋白寡聚體形成過(guò)程中的關(guān)鍵步驟。
1.MD 模擬和基本分析
以 Aβ16-22 為例吧史,其兩端都帶有封端基團(tuán)邮辽,序列為 ACE-KLVFFAE-NME。由于蛋白質(zhì)數(shù)據(jù)庫(kù) (PDB) 不包含該肽的結(jié)構(gòu)贸营,因此可以從 Aβ42 的 PDB 結(jié)構(gòu)的殘基 16-21 的坐標(biāo)中檢索以下模擬的起始結(jié)構(gòu)吨述,例如 PDB ID 1Z0Q。在 PyMOL 的蛋白質(zhì)模式下使用 Builder 工具钞脂,ACE 和 NME 封端組可以分別添加到 N 和 C 端揣云。
1.1 六肽模擬體系建立
1. 第一步是為 Aβ16-22 單體產(chǎn)生一個(gè)松弛的構(gòu)象。對(duì)于 Aβ16-22冰啃,建議模擬長(zhǎng)度為 1 μs 或更長(zhǎng)邓夕,使用構(gòu)象聚類確定最穩(wěn)定的單體結(jié)構(gòu)(本文省略這步)。2. 使用 PACKMOL將六個(gè)單體隨機(jī)放置到一個(gè)模擬盒子中阎毅。下面的示例腳本將六個(gè) Aβ16-22 肽放置在一個(gè)大小為 ~10 nm × 10 nm × 10 nm 的模擬框中焚刚,它們之間的距離至少為 1.2 nm(或腳本中的 12 ?)。
packmol.inp#Six monomers of abeta16-22 peptide #minimum distance between two monomers tolerance 12.0 seed -1 #The file type of input and output files is PDB filetype pdb #The name of the output file output abeta16-22_hexamer.pdb #add TER to after each monomer chain add_amber_ter #distance from the edges of box add_box_sides 1.0 #path to input structure file #units for distance is measured in Angstrom #box size is 100 ? structure abeta16-22.pdb number 6 inside box 0. 0. 0. 100. 100. 100. end structure
運(yùn)行packmol
packmol < packmol.inp
或者使用gmx insert-molecules命令
gmx insert-molecules -ci abeta16-22.pdb -nmol 6 -box 10 10 10 -o abeta16-22_hexamer.pdb
1.2 不同的模擬步驟創(chuàng)建目錄
創(chuàng)建五個(gè)主要步驟的目錄:拓?fù)湮募?gòu)建扇调、能量最小化矿咕、NVT 平衡、NPT 平衡和 MD 生產(chǎn)運(yùn)行。每一步都需要一個(gè) .mdp 文件碳柱。mdp 文件類型擴(kuò)展名代表分子動(dòng)力學(xué)參數(shù)捡絮,這些文件包含使用 GROMACS 設(shè)置 MD 模擬的所有關(guān)鍵參數(shù)。
mkdir 1-topol 2-em 3-nvt 4-npt 5-md mdp
1.3 拓?fù)錁?gòu)建
拓?fù)湮募嘘P(guān)將被模擬的分子類型和分子數(shù)量的信息莲镣。上一步的 .pdb 文件作為輸入福稳,除了拓?fù)湮募猓€會(huì)生成一個(gè) .gro 文件剥悟,該文件與 .pdb 文件一樣灵寺,也包含模擬系統(tǒng)的坐標(biāo)曼库。它們之間的主要區(qū)別在于它們的格式区岗。
(1)從http://macerell.umaryland.edu/download.php?filename=CHARMM_ff_params_files/charmm36-mar2019.ff.tgz下載Charmm36m力場(chǎng),復(fù)制到1-topol目錄下毁枯。切換到該目錄:
cd 1-topol/
(2)運(yùn)行GROMACS pdb2gmx 命令處理輸入的結(jié)構(gòu)文件并創(chuàng)建擴(kuò)展名為.top 的拓?fù)湮募鹊蕖U(kuò)展名為.itp 的拓?fù)浒募蛿U(kuò)展名為.itp 的位置約束文件。
gmx pdb2gmx -f ../abeta16-22_hexamer.pdb -o protein.gro -p topol.top -ignh -ter <<EOF
1
1
3
4
3
4
3
4
3
4
3
4
3
4
EOF
選項(xiàng)說(shuō)明:
-f: 讀取輸入結(jié)構(gòu)文件 abeta16-22_hexamer.pdb
-o and -p: 寫(xiě)入輸出結(jié)構(gòu)文件 protein.gro 和系統(tǒng)拓?fù)湮募?topol.top
-ignh: 忽略輸入文件中的氫原子种玛,這是可取的藐鹤,因?yàn)檩斎胛募土?chǎng)中氫原子的命名約定不同。GROMACS 將使用所選力場(chǎng)的 H 原子名稱添加新的氫原子赂韵。
-ter: N 端和 C 端的質(zhì)子化狀態(tài)可以-ter 標(biāo)志交互選擇
Option 1: choosing protein force field (charmm36-mar2019)
Option 1: choosing water force field (TIP3P)
Option 3: choosing N-terminus (None, as we use ACE capping)
Option 4: choosing C-terminus (None, as we use NME capping)
Options 3 and 4 are repeated for each peptide in the system, in this example six.
成功執(zhí)行 GROMACS pdb2gmx 命令后娱节,該目錄還將包含六個(gè)拓?fù)浒募土鶄€(gè)位置約束文件,每個(gè)肽一個(gè):topol_Protein_chain_$chain.itp 和 posre_Protein_chain_$chain.itp祭示,其中 $chain = A肄满、B、C质涛、D稠歉、E 或 F。后面的文件包含肽的所有非氫原子的位置限制條目汇陆,這是平衡 MD 步驟期間需要的怒炸。
(3) 接下來(lái),創(chuàng)建一個(gè)模擬框毡代。請(qǐng)注意阅羹,上面定義的框僅用于放置肽。和以前一樣教寂,選擇了一個(gè) 10 × 10 × 10 nm3 的立方體盒子:
gmx editconf -f protein.gro -o box.gro -bt cubic -box 10 10 10
(4)在模擬盒里裝入水分子
gmx solvate -cp box.gro -cs spc216.gro -o protein-solvated.gro -p topol.top溶劑分子的添加反映在 topol.top 文件中灯蝴,除了 6 個(gè)肽段外,該文件現(xiàn)在還包括 32,323 個(gè)水分子孝宗。(5)為了使用周期性邊界條件進(jìn)行 MD 模擬穷躁,我們需要根據(jù)需要通過(guò)添加正 (Na+) 或負(fù) (Cl-) 離子來(lái)中和系統(tǒng)的電荷。此外,我們可以為系統(tǒng)指定一個(gè)特定的離子濃度问潭,通常約為 150 mM 以模擬生理?xiàng)l件:
gmx grompp -f ../mdp/ions.mdp -c protein-solvated.gro -p topol.top -o protein-ions.tpr
echo 13 | gmx genion -s protein-ions.tpr -o protein-ions.gro -p topol -neutral -conc 0.15
Explanation of flags and options: -neutral: 通過(guò)添加 Na+ 或 Cl- 離子將系統(tǒng)中和至零電荷 -conc: 將濃度更改為 150 mM NaClecho 13: 用離子替換溶劑分子猿诸,其中選項(xiàng) 13 代表 SOL(溶劑分子)。
在第一個(gè)命令中狡忙,grompp 模塊梳虽,讀取坐標(biāo)文件、系統(tǒng)拓?fù)湮募肿隆ons.mdp 文件并將它們處理成 GROMACS 二進(jìn)制格式生成 .tpr 文件窜觉。該文件包含模擬的起始結(jié)構(gòu)、單個(gè)肽和水分子的拓?fù)湫畔⒁约八心M參數(shù)北专。第二個(gè)命令讀取二進(jìn)制輸入文件 protein-ions.tpr 并中和凈電荷禀挫,添加了 90 個(gè) Na+ 和 90 個(gè) Cl- 離子,相應(yīng)地更新 topol.top 文件拓颓。