化學(xué)分子結(jié)構(gòu)表達(dá)詳解

化學(xué)分子結(jié)構(gòu)表達(dá)

化學(xué)分子結(jié)構(gòu)可以用多種方式表達(dá)已日,包括一維描姚、二維和三維松捉。二維和三維結(jié)構(gòu)是化學(xué)家常用的夹界,通常以圖形形式存儲(chǔ)在Mol或Sdf格式中。

但一維線性表達(dá)在處理大量分子時(shí)惩坑,尤其在存儲(chǔ)和操作速度上掉盅,有明顯優(yōu)勢(shì)。今天以舒,我們重點(diǎn)介紹一維線性表達(dá)趾痘。


01 一維線性表達(dá)含義及類型

一維結(jié)構(gòu)表達(dá)主要采用線性符號(hào)表示法(Line Notation),即利用線性的字符或數(shù)字組合來(lái)表示化合物結(jié)構(gòu)蔓钟,這樣很容易被計(jì)算機(jī)儲(chǔ)存和處理永票。常見(jiàn)的線性符號(hào)表示法包括SMILES、SLN和ROSDAL等滥沫。

SMILES (Simplified Molecular Input Line Entry System)格式是目前化學(xué)信息學(xué)中的主流表達(dá)方法侣集。

SLN(SYBYL Linear Notation)是Tripos公司為其分子模擬和藥物設(shè)計(jì)軟件SYBYL開(kāi)發(fā)的線性表達(dá)方式,與SMILES相似兰绣,可視為SMILES的改進(jìn)版世分。

ROSDAL曾用于Beilstein系統(tǒng)的分子結(jié)構(gòu)表示,但現(xiàn)在已較少使用缀辩。


02 SMILES基本規(guī)則

SMILES(Simplified Molecular Input Line Entry System)是一種用于描述分子結(jié)構(gòu)的簡(jiǎn)化線性輸入系統(tǒng)臭埋,由美國(guó)環(huán)境保護(hù)局的David Weininger在1986年提出踪央。

這種格式通過(guò)字符串來(lái)編碼分子結(jié)構(gòu),此后瓢阴,該系統(tǒng)不斷得到擴(kuò)充和完善畅蹂,特別是Daylight化學(xué)信息系統(tǒng)公司對(duì)此做出了重要貢獻(xiàn)。

SMILES的應(yīng)用非常廣泛荣恐,它作為一種獨(dú)立于硬件和軟件的數(shù)據(jù)交換語(yǔ)言液斜,不需要圖形界面即可在多種在線服務(wù)和數(shù)據(jù)傳輸系統(tǒng)中使用,這使得它成為化學(xué)結(jié)構(gòu)輸入的重要工具叠穆。

原子通常以大寫(xiě)元素符號(hào)表示(省略氫原子)少漆,芳香結(jié)構(gòu)原子則以小寫(xiě)元素符號(hào)表示。

比如痹束,環(huán)已烷C6H12被表示為:C1CCCCC1检疫,而苯C6H6則表示為:clcccccl。

相鄰原子依次排放在一起祷嘶,單鍵通常省略,雙鍵和三鍵分別以“=”和“#”表示夺溢,芳香鍵以“:”表示论巍,也可省略。

比如风响,乙炔 HC

CH 被表示為:C#C嘉汰。

分支部分放在括號(hào)內(nèi),環(huán)則打開(kāi)状勤,并賦予斷開(kāi)鍵兩端的原子以相同的數(shù)值鞋怀。

比如,異丁酸(CH3)2CHCOOH被表示為:CC(C)C(=O)O持搜。

離子用方括號(hào)括起密似,用元素符號(hào)和電荷表示,“十”表示正電荷葫盼、“一”表示負(fù)電荷残腌,電荷數(shù)跟在正負(fù)號(hào)之后。如果該原子與氫原子相連贫导,則氫原子寫(xiě)在元素符號(hào)后面抛猫。

比如:銨離子(NH4+)被表示為[NH4+],氫氧根離子(OH-)被表示為[OH-]孩灯,四價(jià)鈦離子(Ti4+)被表示為[Ti+4]或[Ti++++]闺金。

SMILES也可以表示化合物的立體化學(xué)信息,含順?lè)串悩?gòu)和旋光異構(gòu)峰档。

順?lè)串悩?gòu):雙鍵兩側(cè)的結(jié)構(gòu)分別用符號(hào)“/”和“\”來(lái)表示败匹。

例如匣距,F(xiàn)/C=C/F或者F\C=C\F表示反二氟乙烯,它的兩個(gè)氟原子位于雙鍵的兩側(cè)哎壳;而F/C=C\F或者F\C=C/F則表示順二氟乙烯毅待,它的兩個(gè)氟原子位于雙鍵的同一側(cè)。再比如:Cl/C=C/Br(反式)归榕,CI/C=C\Br(順式)尸红。

旋光異構(gòu):手性碳原子用@(逆時(shí)針)或@@(順時(shí)針)表示,圍繞在手性中心周圍的原子可以從標(biāo)識(shí)符@或@@表示中得到原子的順序刹泄。

比如:丙氨酸外里,普通SMILES式為NC(C)C(=O)O,或者可以寫(xiě)為N[CH](C)C(=O)O特石。而L-丙氨酸則應(yīng)表示為N[C@@H](C)C(=O)O盅蝗,標(biāo)示符@@表明,從氮原子(N)處沿著連接氮原子和手性中心碳原子的鍵看去姆蘸,取代基氫原子(H)墩莫、甲基(C)和羧基(C(=O)O)按順時(shí)針順序出現(xiàn)。

請(qǐng)注意:這里取代基列出的順序非常重要逞敷,與@或@@符號(hào)要保持一致狂秦,因此,L-丙氨酸也可以表示為N[C@H](C(=O)O)C推捐,即如果從N原子沿N-C鍵看去裂问,取代基氫原子(H)、羧基(C(=O)O)和甲基(C)按逆時(shí)針順序出現(xiàn)牛柒。

相應(yīng)地堪簿,D-丙氨酸可以表示為:N[C@H](C)C(=0)O或者 N[C@@H](C(=O)O)C。


04 SMARTS格式

SMARTS(SMILES ARbitrary Target Specification)是SMILES的一個(gè)擴(kuò)展皮壁,由David Weininger開(kāi)發(fā)椭更,用于描述更復(fù)雜的化學(xué)結(jié)構(gòu)模式。與SMILES不同闪彼,SMARTS不僅能夠描述一個(gè)確切的分子結(jié)構(gòu)甜孤,還能定義一個(gè)結(jié)構(gòu)的模式,從而在化學(xué)數(shù)據(jù)庫(kù)中進(jìn)行精確的搜索和匹配畏腕。

以下為SMARTS的主要特點(diǎn)


通配符的使用

SMARTS通過(guò)使用通配符如*(任何原子)缴川、A(任何脂肪族原子)、a(任何芳香族原子)等描馅,可以表示一類原子或化學(xué)鍵把夸。


邏輯運(yùn)算符

SMARTS允許使用邏輯運(yùn)算符如&(和)、|(或)铭污、!(非)等恋日,來(lái)組合不同的結(jié)構(gòu)特征膀篮,實(shí)現(xiàn)復(fù)雜的結(jié)構(gòu)查詢。


環(huán)搜索

SMARTS能夠表示環(huán)的存在岂膳,例如r6表示一個(gè)六元環(huán)誓竿,這在尋找特定環(huán)結(jié)構(gòu)的化合物時(shí)非常有用。


距離和連接性

SMARTS可以指定原子之間的距離和連接性谈截,例如C-0表示碳原子和氧原子之間有一個(gè)單鍵筷屡。


05 InChI表達(dá)式

InChI(International Chemical Identifier,國(guó)際化學(xué)標(biāo)識(shí)符)是一種由國(guó)際純粹與應(yīng)用化學(xué)聯(lián)合會(huì)(IUPAC)和美國(guó)化學(xué)文摘社(Chemical Abstracts Service, CAS)共同開(kāi)發(fā)的分子結(jié)構(gòu)的標(biāo)準(zhǔn)化表示方法簸喂。

InChI的目的是為每一種化學(xué)物質(zhì)提供一個(gè)唯一的毙死、機(jī)器可讀的標(biāo)識(shí)符,以解決SMILES表達(dá)式可能存在的非唯一性問(wèn)題喻鳄。

以下為InChI的主要特點(diǎn)

唯一性

每個(gè)分子結(jié)構(gòu)無(wú)論其排列方式如何扼倘,都會(huì)有一個(gè)唯一的InChI編碼,這保證了在不同數(shù)據(jù)庫(kù)和文獻(xiàn)中的一致性除呵。


層次結(jié)構(gòu)

InChI編碼由多個(gè)部分組成再菊,包括分子公式、連接表竿奏、立體化學(xué)信息等袄简,這些部分按照一定的層次結(jié)構(gòu)排列。


立體化學(xué)

InChI能夠精確地表示分子的立體化學(xué)泛啸,包括順?lè)串悩?gòu)和旋光異構(gòu),這對(duì)于手性分子的識(shí)別尤為重要秃症。


距離和連接性

SMARTS可以指定原子之間的距離和連接性候址,例如C-0表示碳原子和氧原子之間有一個(gè)單鍵。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末种柑,一起剝皮案震驚了整個(gè)濱河市岗仑,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌聚请,老刑警劉巖荠雕,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異驶赏,居然都是意外死亡炸卑,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門煤傍,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)盖文,“玉大人,你說(shuō)我怎么就攤上這事蚯姆∥逍” “怎么了洒敏?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)疙驾。 經(jīng)常有香客問(wèn)我凶伙,道長(zhǎng),這世上最難降的妖魔是什么它碎? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任函荣,我火速辦了婚禮,結(jié)果婚禮上链韭,老公的妹妹穿的比我還像新娘偏竟。我一直安慰自己,他們只是感情好敞峭,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布踊谋。 她就那樣靜靜地躺著,像睡著了一般旋讹。 火紅的嫁衣襯著肌膚如雪殖蚕。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,624評(píng)論 1 305
  • 那天沉迹,我揣著相機(jī)與錄音睦疫,去河邊找鬼。 笑死鞭呕,一個(gè)胖子當(dāng)著我的面吹牛蛤育,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播葫松,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼瓦糕,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了腋么?” 一聲冷哼從身側(cè)響起咕娄,我...
    開(kāi)封第一講書(shū)人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎珊擂,沒(méi)想到半個(gè)月后圣勒,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡摧扇,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年圣贸,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扳剿。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡旁趟,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情锡搜,我是刑警寧澤橙困,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站耕餐,受9級(jí)特大地震影響凡傅,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜肠缔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一夏跷、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧明未,春花似錦槽华、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至披摄,卻和暖如春亲雪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背疚膊。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工义辕, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人寓盗。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓灌砖,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親傀蚌。 傳聞我的和親對(duì)象是個(gè)殘疾皇子周崭,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容