一裕照、SMARTS簡介
是什么
SMARTS(SMiles ARbitrary Target Specification)是一種用于描述分子模式和屬性的語言。SMILES所有的符號和屬性在SMARTS中同樣適用调塌,因此它也是SMILES的延伸晋南。此外,SMARTS還包括了邏輯操作符和額外的分子描述符羔砾,后文會一一介紹负间。能做什么
SMARTS可以從不同程度來概括和表示結(jié)構(gòu)模式。舉個例子:
甲烷的SMILES可以用"C"或"[CH4]"表示姜凄。
而"[CH4]"在SMARTS中政溃,高度特異地表示與甲烷一致的結(jié)構(gòu),即只能匹配一個帶有4個氫的脂肪族碳原子檀葛。
而"C"在SMARTS中特異程度較低玩祟,可以表示帶有任意數(shù)量氫的脂肪族碳原子,比如乙烷屿聋、乙烯空扎、環(huán)戊烷。
二润讥、原子屬性
SMARTS | 匹配結(jié)構(gòu) | 說明 |
---|---|---|
[+1] | 帶有一個正電荷的原子 | SMILES對電荷转锈、氫、同位素楚殿、鍵撮慨、手性等描述方式,在SMARTS中都可以兼容。一個"+"表示"+1"砌溺,兩個"++"表示"+2" |
[a] | 帶有芳香性的原子 | "a"表示任何帶有芳香性質(zhì)的原子 |
[A] | 帶有脂肪族屬性的原子 | "A"表示任何帶有脂肪族性質(zhì)的原子 |
[#6] | 原子序數(shù)為6的原子(c或C) | "#<number>"表示序數(shù)為<number>的原子影涉,無論是脂肪族還是芳香族 |
[R2] | 在兩個環(huán)中的原子 | "R<number>"表示在<number>元環(huán)中的原子,默認{R}為在任何環(huán)中的原子 |
[r5] | 在五元環(huán)中的原子 | "r<number>"表示<number>元環(huán)中的原子 |
[v4] | 4價原子 | "v<number>"表示任何含有鍵的數(shù)量為<number>的原子规伐。另外"="表示雙鍵蟹倾,"#"表示三鍵 |
[X2] | 與兩個原子鏈接的原子 | "X<number>"表示任何與<number>個原子相連的原子(包括氫原子) |
[H] | 氫原子 | 一個氫原子(通常也叫一個顯式氫,explicit hydrogen)具有一些特殊的性質(zhì)[H+],[2H],[H][H]等猖闪。[H+]和[2H]含義相似 |
[H1] | 與一個氫相連的原子 | "H<number>"表示任何與<number>個氫(顯式或隱式氫)相連的原子鲜棠。[*H]表示沒有氫相連的原子 |
* | 任何原子 | "*"表示通配原子,匹配任意重原子(非氫原子) |
三培慌、鍵屬性
SMARTS | 匹配結(jié)構(gòu) | 說明 |
---|---|---|
CC | 兩個由單鍵相連接的脂肪碳 | 所有SMILES的鍵的屬性在SMARTS中都可以使用豁陆,包括隱式單鍵、顯式單鍵(-)吵护、雙鍵(=)盒音、三鍵(#)、芳香鍵(:) |
[#6]~[#6] | 兩個由任意鍵相連的碳 | "~"表示通配鍵 |
[#6]@[#6] | 兩個在同一個環(huán)中相連的碳 | "@"表示在同一個環(huán)中 |
[F/?[#6]=C/Cl] | 氟原子通過"/"("/"指定了順反異構(gòu)構(gòu)型)或未指明的鍵與碳原子相連(比如可以匹配到"F/C=C/Cl"或"FC=C/Cl"何址,不能匹配到"F\C=C/Cl") | "?"表示"或不確定"里逆,還可以和手性描述符"@"一起使用 |
四进胯、邏輯操作符
SMARTS | 匹配結(jié)構(gòu) | 說明 |
---|---|---|
!c | 非芳香的碳 | "!"表示"非" |
[N,#8] | 匹配脂肪族氮或匹配一個氧 | ","表示"或"用爪,優(yōu)先級高于"與"(";"),低于另一個"與"("&") |
[#7,C&+O,+1] or [#7,C+O,+1] | 氮原子或中性脂肪碳原子或帶一個正電荷的原子 | "&"表示"與"(優(yōu)先級高)胁镐,是默認的邏輯操作符偎血,可以省略 |
[#7,C;+0,+1] | 氮或脂肪碳,且不帶或帶一個正電荷 | ";"也表示"與"盯漂,但優(yōu)先級低 |
五颇玷、遞歸SMARTS
SMARTS | 匹配結(jié)構(gòu) | 說明 |
---|---|---|
[$(O);$(CC)] | 一個與脂肪氧相連的原子,或一個連接有兩個脂肪碳的原子 | "$<SMARTS>"表示匹配周圍具有某種結(jié)構(gòu)的原子 |
[$([CX3]=[OX1]),$([CX3+]-[OX1-])] | 與一個羰基相連的原子就缆,或相對合理的結(jié)構(gòu) | |
[$([A]aaO);$([A]aaaN)] | 芳環(huán)上位于氧的鄰位帖渠,氮的間位的原子 |
六、組合匹配
SMARTS | 匹配結(jié)構(gòu) | 說明 |
---|---|---|
[#8].[#8] | 匹配兩個氧(例如O=O, OCCO, O.CCO) | "."表示無需連接 |
([#8].[#8]) | 在同一個結(jié)構(gòu)中匹配兩個氧(例如O=O, OCCO竭宰,無法匹配O.CCO) | 可以在SMARTS外加圓括號空郊,表示括號內(nèi)的結(jié)構(gòu)需要在同一組分中出現(xiàn) |
([#8]).([#8]) | 在不同的結(jié)構(gòu)中匹配兩個氧(例如O.CCO,無法匹配O=O, OCCO) | 可以使用多個圓括號切揭,表示需要在不同的組分中進行匹配 |
七狞甚、反應(yīng)SMARTS
SMARTS | 匹配結(jié)構(gòu) | 說明 |
---|---|---|
[#6]=,:[#6] | 由一個雙鍵或芳香鍵連接的的碳 | 分子SMARTS(沒有">"符號)可以對任意反應(yīng)組分(反應(yīng)物、試劑或產(chǎn)物)中進行匹配 |
>>[#6]=,:[#6] | 產(chǎn)物中碳由一個雙鍵或芳香鍵連接 | 反應(yīng)SMARTS(帶有">"符號)不能用于分子的匹配 |
反應(yīng)SMARTS還剩下一些比較難理解廓旬,等明白了再補上哼审。