mongoDB的查詢測試

做的事情:

分析mongodb的查詢性能伟阔,引入冗余的字段來加快查詢的效率是否可行尔觉?同時對比了冗余字段和索引的查詢能力皮璧。

我們從下面幾個維度來分析

????????1. 存儲空間

????????2. 時間

怎么做:

????????1. 生成數(shù)據(jù)

????????2. 分兩類來考察

????????????????a. 冗余一定的數(shù)據(jù)來加快數(shù)據(jù)本身的子父級關(guān)系

????????????????b. 建立索引的方式

????????3. 統(tǒng)計數(shù)據(jù)庫的空間成本版述,查詢花費的時間成本

舉例:

1. 數(shù)據(jù)結(jié)構(gòu)如下:

????????{"id":1, "data":"adasdasd","parent":2}

????????{"id":2, "data":"adasdasd","parent":null}

2. 數(shù)據(jù)結(jié)構(gòu)如下:

? ? ? ? {"id":1 , "data":"asdasdasd","children":[2,3],"parent":null}

? ? ? ? {"id":2 , "data":"asdasdasd","children":[],"parent":2}

我們要查詢的數(shù)據(jù)是:將一條數(shù)據(jù)的子數(shù)據(jù)都查詢出來

第一種查詢方式

????????db.test1.find({"parent":2})

第二種查詢方式:

????????db.test2.find({"$in":{"_id":[2,3,4]}})

第三種查詢方式和第一種一樣几蜻,只是第三種多了一個parent_id 的索引



1. 首先我們先要創(chuàng)建數(shù)據(jù)庫和數(shù)據(jù)

import ?random

defget_id(db):

????????key = db.seq.find_and_modify(

????????????????query={'name':'mongo_test'},

????????????????update={'$inc': {'seq':1}}

????????)

????????if notkey:

????????????????db.seq.insert({"name":"mongo_test","seq":1})

????????????????return 1

????????returnkey['seq']


def init_data(client):

????????""" 構(gòu)造數(shù)據(jù) """

????????db1 = client["mongo_test1"]

????????db2 = client["mongo_test2"]

? ? ? ? for i in xrange(100000):

????????????????key1 = get_id(db1)

????????????????parent_id = None

????????????????if random.random() > 0.2:

????????????????????????parent_id = random.randint(1, i + 1)

? ? ? ? ? ? ? ? data = {"_id": key1, "data": "And loved your beauty with love false or true {0}".format(i),"parent_id": parent_id}

????????????????db1.mongo_test.insert(data)

????????????????key2 = get_id(db2)

? ? ? ? ? ? ? ? data2 = {"_id": key2, "data": "And loved your beauty with love false or true {0}".format(i), "children_id": [],"parent_id": parent_id}

????????????????db2.mongo_test.insert(data2)

????????????????if parent_id:

????????????????????????parent = db2.mongo_test.find_one({"_id": parent_id})

? ? ? ? ? ? ? ? ? ? ? ? if parent and parent.get("parent_id") is None:

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? children = parent.get("children_id", [])

????????????????????????????????children.append(key2)

????????????????????????????????db2.mongo_test.save(parent)

????????????????if i % 10000 == 0:

????????????????????????print "{0}0 % ".format(i // 10000)

這個方法就是在創(chuàng)建數(shù)據(jù)铸本,數(shù)據(jù)量在100000條肮雨。


2.? 數(shù)據(jù)生成完了之后,我們需要到mongo客戶端copy一個數(shù)據(jù)出來箱玷,命名為mong_test3怨规,這個數(shù)據(jù)庫和mong_test1數(shù)據(jù)庫唯一的區(qū)別在于,我們會再mong_test3中添加一個parent_id 的索引

db.copyDatabase('mongo_test1', 'mongo_test3', '127.0.0.1');

use mongo_test3

db.mongo_test.ensureIndex( { 'patent_id' : 1 } )


3. 上兩步完成之后就開始查詢數(shù)據(jù)锡足,并且計算查找時間

def test_db(client):

"""測試花費的時間"""

????????db1 = client["mongo_test1"]

????????import time

????????start = time.time()

????????parent = db1.mongo_test.find({"parent": None})

????????for item in parent:

????????????????children = db1.mongo_test.find({"parent_id": item.get("_id")})

? ? ? ? end = time.time()

????????test_db1_time = end - start

????????db2 = client["mongo_test2"]

????????start = time.time()

????????parent = db2.mongo_test.find({"parent": None})

????????for item in parent:

????????????????if item.get("children_id"):

????????????????????????children = db2.mongo_test.find({"_id": {"$in": item.get("children_id",[])}})

????????end = time.time()

????????test_db2_time = end - start

????????db3 = client["mongo_test3"]

????????start = time.time()

????????parent = db3.mongo_test.find({"parent": None})

????????for item in parent:

????????????????children = db3.mongo_test.find({"parent_id": item.get("_id")})

????????end = time.time()

????????test_db3_time = end - start

????????print "第一種方式花費時間:{0} \n" \

????????????????"第二種方式花費時間:{1} \n" \

????????????????"第三種方式花費時間(parent建立索引):{2}".format(test_db1_time, test_db2_time, test_db3_time)


4. 最后展示一張我查找的結(jié)果截圖:


可以看出來波丰,有索引的情況確認會比沒有縮影的情況在查詢時間上還一點,但是沒有那么突出的效果舶得。

而我冗余的children_id 數(shù)組卻帶來了4倍的查詢速度的提升 呀舔,可以說是效果非常的明顯了。


5. 我們來查看一下他們空間大欣┑啤:


查詢后發(fā)現(xiàn)媚赖,他們的區(qū)別在這個10W的數(shù)據(jù)量下表現(xiàn)不出來。

6. 主函數(shù):

if __name__ == '__main__':

????????from pymongo import MongoClient

????????client = MongoClient(host='127.0.0.1', port=27017)

????????init_data(client)

????????# test_db(client)

注意:

在我們執(zhí)行添加數(shù)據(jù)操作的時候珠插,會報兩次錯誤惧磺,這是由于數(shù)據(jù)庫數(shù)據(jù)引起的。不用在意捻撑,點擊執(zhí)行就好了磨隘,大概要點擊三次缤底,在第三次的時候就不會再報錯了。

總結(jié):

這是一個典型的用空間換時間的例子番捂。

我們這里還沒有去考慮建立索引帶來了插入和刪除的性能損耗的問題个唧,只是單純的做了一次查找的性能對比。

至此设预,在這個10W的數(shù)據(jù)量下的查詢?nèi)哂嘧侄瓮陝倨胀ǚ椒ê退饕?/p>

完整的代碼就是將上面的代碼依次放入py文件中徙歼,就可以執(zhí)行了。前提是本地機器上已經(jīng)有了mongoDB數(shù)據(jù)庫鳖枕。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末魄梯,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子宾符,更是在濱河造成了極大的恐慌酿秸,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,997評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件魏烫,死亡現(xiàn)場離奇詭異辣苏,居然都是意外死亡,警方通過查閱死者的電腦和手機哄褒,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,603評論 3 392
  • 文/潘曉璐 我一進店門稀蟋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人读处,你說我怎么就攤上這事糊治。” “怎么了罚舱?”我有些...
    開封第一講書人閱讀 163,359評論 0 353
  • 文/不壞的土叔 我叫張陵井辜,是天一觀的道長。 經(jīng)常有香客問我管闷,道長粥脚,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,309評論 1 292
  • 正文 為了忘掉前任包个,我火速辦了婚禮刷允,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘碧囊。我一直安慰自己树灶,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,346評論 6 390
  • 文/花漫 我一把揭開白布糯而。 她就那樣靜靜地躺著天通,像睡著了一般。 火紅的嫁衣襯著肌膚如雪熄驼。 梳的紋絲不亂的頭發(fā)上像寒,一...
    開封第一講書人閱讀 51,258評論 1 300
  • 那天烘豹,我揣著相機與錄音,去河邊找鬼诺祸。 笑死携悯,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的筷笨。 我是一名探鬼主播憔鬼,決...
    沈念sama閱讀 40,122評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼奥秆!你這毒婦竟也來了逊彭?” 一聲冷哼從身側(cè)響起咸灿,我...
    開封第一講書人閱讀 38,970評論 0 275
  • 序言:老撾萬榮一對情侶失蹤构订,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后避矢,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體悼瘾,經(jīng)...
    沈念sama閱讀 45,403評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,596評論 3 334
  • 正文 我和宋清朗相戀三年审胸,在試婚紗的時候發(fā)現(xiàn)自己被綠了亥宿。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,769評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡砂沛,死狀恐怖烫扼,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情碍庵,我是刑警寧澤映企,帶...
    沈念sama閱讀 35,464評論 5 344
  • 正文 年R本政府宣布,位于F島的核電站静浴,受9級特大地震影響堰氓,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜苹享,卻給世界環(huán)境...
    茶點故事閱讀 41,075評論 3 327
  • 文/蒙蒙 一双絮、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧得问,春花似錦囤攀、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,705評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至哪怔,卻和暖如春宣蔚,著一層夾襖步出監(jiān)牢的瞬間向抢,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,848評論 1 269
  • 我被黑心中介騙來泰國打工胚委, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留挟鸠,地道東北人。 一個月前我還...
    沈念sama閱讀 47,831評論 2 370
  • 正文 我出身青樓亩冬,卻偏偏與公主長得像艘希,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子硅急,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,678評論 2 354

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理覆享,服務(wù)發(fā)現(xiàn),斷路器营袜,智...
    卡卡羅2017閱讀 134,654評論 18 139
  • 目錄 查詢操作 集合查詢方法 find() 查詢內(nèi)嵌文檔 查詢操作符(內(nèi)含 數(shù)組查詢) "$gt" 撒顿、"$gte"...
    彩虹之夢閱讀 1,022評論 0 1
  • Spring Boot 參考指南 介紹 轉(zhuǎn)載自:https://www.gitbook.com/book/qbgb...
    毛宇鵬閱讀 46,806評論 6 342
  • 1. MongoDB命令幫助系統(tǒng) 2. 基本命令及實例 一基本命令 二基本DDL和DML 三啟動與終止 四安全管理...
    ZGKzm閱讀 392評論 0 2
  • NoSql數(shù)據(jù)庫優(yōu)缺點 在優(yōu)勢方面主要體現(xiàn)在下面幾點: 簡單的擴展 快速的讀寫 低廉的成本 靈活的數(shù)據(jù)模型 在不足...
    dreamer_lk閱讀 2,718評論 0 6