RDKit|支持RDKit的PostgreSQL環(huán)境搭建與基本操作

  • 一技肩、環(huán)境配置
    • 1.windows下的安裝與初始化
    • 2.用戶設置與服務啟動
  • 二界拦、操作使用
    • 1.cmd操作
    • 2.python操作

一攻礼、環(huán)境配置

PostgreSQL是一個開源睡互、可擴展的關系型數據庫肠套,rdkit官網文檔里也是以postgresql作為案例進行演示舰涌。本文介紹帶rdkit插件的postgresql在windows系統(tǒng)上的環(huán)境配置,以及在python環(huán)境下的基本操作你稚。

1.windows下的安裝與初始化

  • 直接在cmd下使用conda安裝繼承了rdkit插件的postgresql
C:\Users\Administrator> conda install -c rdkit rdkit-postgresql
  • 安裝完成后需要初始化一下瓷耙,在"-D"后加上數據庫的數據存儲目錄
C:\Users\Administrator> initdb –D d:\postgresql\data

2.用戶設置與服務啟動

  • 安裝完成后,直接在cmd中執(zhí)行“postgres -D d:\postgresql\data”啟動服務會出現如下提示刁赖,即不能用帶管理員權限的用戶來啟動服務
Execution of PostgreSQL by a user with administrative permissions is not permitted.
  • 接下來在cmd命令行中進行用戶設置搁痛,這部分內容會被360報錯,需要暫時關閉殺毒軟件或手動操作
  • 新建一個用戶postgres
C:\Users\Administrator> net user postgres /add
  • 激活該用戶
C:\Users\Administrator> net user postgres /active:yes
  • 在<password>中設置密碼
C:\Users\Administrator> net user postgres <password>
  • 切換到postgres用戶宇弛,并根據提示輸入上一步中設置的密碼
C:\Users\Administrator> runas /user:postgres cmd
  • 在彈出的新窗口中啟動postgresql服務
C:\Users\Administrator> postgres -D d:\postgresql\data
  • 服務啟動成功鸡典,可以在cmd或python中操作數據庫了


    1

二、操作使用

1.cmd操作

  • 再打開一個cmd終端涯肩,創(chuàng)建一個新數據庫命名為mols(需要添加conda的環(huán)境變量)
C:\Users\Administrator> createdb mols
  • 為數據庫加載rdkit擴展模塊
C:\Users\Administrator> psql –c “create extension rdkit” mols
  • 進入mols數據庫的交互界面.
C:\Users\Administrator> psql mols
  • 操作失誤還可以刪除數據庫.
C:\Users\Administrator> dropdb mols

2.python操作

  • 這里選擇psycopg2庫用于連接postgresql轿钠,同樣使用conda安裝psycopg2
C:\Users\Administrator> conda install -c conda-forge psycopg2
  • 接下來導入psycopg2,并創(chuàng)建一個connection連接:connect()
    database:設置連接數據庫的名稱
    user:用戶
    password:密碼
    port:端口號病苗,默認5432
    host:宿主ip
>>> import psycopg2
>>> connection = psycopg2.connect(database='mols',
>>>                               user='Administrator',
>>>                               password='postgresql',
>>>                               port='5432',
>>>                               host='127.0.0.1')
>>> type(connection)
psycopg2.extensions.connection
  • 創(chuàng)建一個游標cursor疗垛,在內存中開辟一塊區(qū)域,用于存儲數據操作的結果:connection.cursor()
>>> cur = connection.cursor()
>>> type(cur)
psycopg2.extensions.cursor
  • 執(zhí)行一條SQL語句測試一下硫朦,查看操作用戶
>>> cur.execute("select * from current_user;")
>>> reply = cur.fetchall()
>>> reply
[('Administrator',)]
  • 寫一條postgresql語句贷腕,記為query,創(chuàng)建一個數據表咬展,命名為info泽裳,并表添加列名,設置數據格式
  • 使用游標來執(zhí)行語句:execute(query)
>>> query = '''create table info(id serial primary key,
>>>                              database text,
>>>                              project text,
>>>                              SMILES text,
>>>                              HA integer,
>>>                              HD integer,
>>>                              RB integer,
>>>                              MW float,
>>>                              LOGP float);'''
>>> cur.execute(query)
  • 讀取1000條左右的數據
>>> import pandas as pd
>>> df = pd.read_excel('ippin.xlsx')

獲取mol對象列表

>>> from rdkit import Chem
>>> mol_list = [x for x in [Chem.MolFromSmiles(i) for i in df.SMILES] if x]
>>> len(mol_list)
1351

創(chuàng)建一個描述符計算對象破婆,將類藥五規(guī)則設置到計算器中涮总,這部分不明白的可以參考這篇文章

from rdkit.ML.Descriptors import MoleculeDescriptors
des_list = ['MolWt', 'NumHAcceptors', 'NumHDonors', 'MolLogP', 'NumRotatableBonds']
calculator = MoleculeDescriptors.MolecularDescriptorCalculator(des_list)
  • 使用計算器,對每個分子計算所需描述符
>>> feat_list = ['%s'%str(calculator.CalcDescriptors(mol)) for mol in mol_list]
  • 在query中寫入一條向數據表info插入數據的語句祷舀,并執(zhí)行該語句
>>> query = "insert into info (MW, HA, HD, LOGP, RB) values %s" % (','.join(feat_list))
>>> cur.execute(query)
  • 通過聚合函數count(*)看一下有多少條結果
  • 通過游標獲取查詢結果:fetchall()
>>> query = 'select count(*) from info'
>>> cur.execute(query)
>>> reply = cur.fetchall()
>>> reply
[(1351,)]
  • 最后操作完后瀑梗,記得提交對數據庫的修改:commit()
>>> connection.commit()

本文參考自rdkit、postgresql安裝文檔裳扯。
python代碼及源文件在這里抛丽。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市饰豺,隨后出現的幾起案子亿鲜,更是在濱河造成了極大的恐慌,老刑警劉巖冤吨,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蒿柳,死亡現場離奇詭異饶套,居然都是意外死亡,警方通過查閱死者的電腦和手機其馏,發(fā)現死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門凤跑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來爆安,“玉大人叛复,你說我怎么就攤上這事∪硬郑” “怎么了褐奥?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長翘簇。 經常有香客問我撬码,道長,這世上最難降的妖魔是什么版保? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任呜笑,我火速辦了婚禮,結果婚禮上彻犁,老公的妹妹穿的比我還像新娘叫胁。我一直安慰自己,他們只是感情好汞幢,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布驼鹅。 她就那樣靜靜地躺著,像睡著了一般森篷。 火紅的嫁衣襯著肌膚如雪输钩。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天仲智,我揣著相機與錄音买乃,去河邊找鬼。 笑死钓辆,一個胖子當著我的面吹牛剪验,可吹牛的內容都是我干的。 我是一名探鬼主播岩馍,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼碉咆,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蛀恩?” 一聲冷哼從身側響起疫铜,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎双谆,沒想到半個月后壳咕,有當地人在樹林里發(fā)現了一具尸體席揽,經...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年谓厘,在試婚紗的時候發(fā)現自己被綠了幌羞。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡竟稳,死狀恐怖属桦,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情他爸,我是刑警寧澤聂宾,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站诊笤,受9級特大地震影響系谐,放射性物質發(fā)生泄漏。R本人自食惡果不足惜讨跟,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一纪他、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧晾匠,春花似錦茶袒、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至句喜,卻和暖如春预愤,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背咳胃。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工植康, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人展懈。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓销睁,卻偏偏與公主長得像,于是被迫代替她去往敵國和親存崖。 傳聞我的和親對象是個殘疾皇子冻记,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345