測試數(shù)據(jù)生成工具datafaker

一、開源情況

datafaker是一個大批量測試數(shù)據(jù)和流測試數(shù)據(jù)生成工具,兼容python2.7和python3.4+贷掖,歡迎下載使用。github地址為:

https://github.com/gangly/datafaker

文檔同步更新在github

二孽糖、工具產(chǎn)生背景

在軟件開發(fā)測試過程枯冈,經(jīng)常需要測試數(shù)據(jù)。這些場景包括:

  • 后端開發(fā)
    新建表后办悟,需要構(gòu)造數(shù)據(jù)庫測試數(shù)據(jù)尘奏,生成接口數(shù)據(jù)提供給前端使用。
  • 數(shù)據(jù)庫性能測試
    生成大量測試數(shù)據(jù)病蛉,測試數(shù)據(jù)庫性能
  • 流數(shù)據(jù)測試
    針對kafka流數(shù)據(jù)炫加,需要不斷定時生成測試數(shù)據(jù)寫入kafka

常用方法是人工手動造幾條數(shù)據(jù)寫入數(shù)據(jù)庫,這種方法帶來的弊端是

  • 浪費工時
    針對表的不同數(shù)據(jù)類型的字段铺然,需要構(gòu)造不同數(shù)據(jù)
  • 數(shù)據(jù)量小
    如果需要構(gòu)造大量數(shù)據(jù)俗孝,手動造數(shù)據(jù)無能為力
  • 不夠準確
    比如需要構(gòu)造郵箱(滿足一定格式),電話號碼(確定的數(shù)字位數(shù))魄健,ip地址(固定格式)赋铝,年齡(不能為負數(shù),有大小范圍)等沽瘦。這些測試數(shù)據(jù)有一定的限制或規(guī)律革骨,手工構(gòu)造可能不能滿足數(shù)據(jù)范圍或一些格式要求而導致后端程序報錯
  • 多表關(guān)聯(lián)
    手動造的數(shù)據(jù)量較小农尖,在多個表中用主鍵不一定能關(guān)聯(lián)上,或者關(guān)聯(lián)出來沒數(shù)據(jù)
  • 動態(tài)隨機寫入
    比如針對流數(shù)據(jù)良哲,需要隨機每隔幾秒鐘寫入kafka盛卡。或者動態(tài)隨機插入mysql筑凫,手工操作相對麻煩滑沧,而且不好統(tǒng)計寫入數(shù)據(jù)條數(shù)

datafaker是一個多數(shù)據(jù)源測試數(shù)據(jù)構(gòu)造工具,可以模擬產(chǎn)生大部分常用數(shù)據(jù)類型漏健,具有以下功能:

  • 多種數(shù)據(jù)類型
    包括常見數(shù)據(jù)庫字段類型(整型嚎货、浮點型、字符型)蔫浆、自定義類型(IP地址殖属,郵箱,身份證號碼等)
  • 模擬多表關(guān)聯(lián)數(shù)據(jù)
    通過制定某些字段為枚舉類型(從指定的數(shù)據(jù)列表里面隨機選擇)瓦盛,這樣在數(shù)據(jù)量多的情況下能保證多表Join能關(guān)聯(lián)上洗显,查詢到數(shù)據(jù)
  • 支持批數(shù)據(jù)和流數(shù)據(jù)生成,可指定數(shù)據(jù)產(chǎn)生間隔時間
  • 支持多種數(shù)據(jù)輸出方式原环,包括屏幕打印挠唆、文件和遠程數(shù)據(jù)源
  • 支持多種數(shù)據(jù)源。目前支持關(guān)系型數(shù)據(jù)庫嘱吗、Hive玄组、Kafka、Hbase谒麦、ES俄讹。后面將擴展到Mongo,Kudu等數(shù)據(jù)源
  • 可指定輸出格式绕德,目前支持text患膛,json

三、軟件架構(gòu)

datafaker是用python編寫耻蛇,支持python2.7踪蹬,python3.4+。已經(jīng)發(fā)布在pypi上臣咖,https://pypi.org/search/?q=datafaker跃捣。

datafaker.png

架構(gòu)圖完整的畫出了工具的執(zhí)行過程,從圖可知工具經(jīng)歷了5個模塊:

  • 參數(shù)解析器亡哄。解析用戶從終端命令行輸入的命令枝缔。
  • 元數(shù)據(jù)解析器。用戶可以指定元數(shù)據(jù)來自本地文件或者遠程數(shù)據(jù)庫表。解析器獲取到文件內(nèi)容后按照規(guī)則將文本內(nèi)容解析成表字段元數(shù)據(jù)和數(shù)據(jù)構(gòu)造規(guī)則愿卸。
  • 數(shù)據(jù)構(gòu)造引擎灵临。構(gòu)造引擎根據(jù)元數(shù)據(jù)解析器產(chǎn)生的數(shù)據(jù)構(gòu)造規(guī)則,模擬產(chǎn)生不同類型的數(shù)據(jù)趴荸。
  • 數(shù)據(jù)路由儒溉。根據(jù)不同的數(shù)據(jù)輸出類型,分成批量數(shù)據(jù)和流數(shù)據(jù)生成发钝。流數(shù)據(jù)可指定產(chǎn)生頻率顿涣。然后將數(shù)據(jù)轉(zhuǎn)換成用戶指定的格式輸出到不同數(shù)據(jù)源中。
  • 數(shù)據(jù)源適配器酝豪。適配不同數(shù)據(jù)源涛碑,將數(shù)據(jù)導入到數(shù)據(jù)源中。

四孵淘、安裝流程

首先確保已經(jīng)安裝python和pip
有兩種安裝方法:

方法1.下載安裝
下載源碼壓縮包蒲障,解壓后,到datafaker目錄里面執(zhí)行:

python setup.py install

方法2.直接安裝(此方法使用若有問題瘫证,請用方法1安裝)

pip install datafaker
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末揉阎,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子背捌,更是在濱河造成了極大的恐慌毙籽,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件毡庆,死亡現(xiàn)場離奇詭異坑赡,居然都是意外死亡,警方通過查閱死者的電腦和手機么抗,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進店門垮衷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人乖坠,你說我怎么就攤上這事〉睹疲” “怎么了熊泵?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長甸昏。 經(jīng)常有香客問我顽分,道長,這世上最難降的妖魔是什么施蜜? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任卒蘸,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘缸沃。我一直安慰自己恰起,他們只是感情好,可當我...
    茶點故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布趾牧。 她就那樣靜靜地躺著检盼,像睡著了一般。 火紅的嫁衣襯著肌膚如雪翘单。 梳的紋絲不亂的頭發(fā)上吨枉,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天,我揣著相機與錄音哄芜,去河邊找鬼貌亭。 笑死,一個胖子當著我的面吹牛认臊,可吹牛的內(nèi)容都是我干的圃庭。 我是一名探鬼主播,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼美尸,長吁一口氣:“原來是場噩夢啊……” “哼冤议!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起师坎,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤恕酸,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后胯陋,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蕊温,經(jīng)...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年遏乔,在試婚紗的時候發(fā)現(xiàn)自己被綠了义矛。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,664評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡盟萨,死狀恐怖凉翻,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情捻激,我是刑警寧澤制轰,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站胞谭,受9級特大地震影響垃杖,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜丈屹,卻給世界環(huán)境...
    茶點故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一调俘、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦彩库、人聲如沸肤无。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽舅锄。三九已至,卻和暖如春司忱,著一層夾襖步出監(jiān)牢的瞬間皇忿,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工坦仍, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留鳍烁,地道東北人。 一個月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓繁扎,卻偏偏與公主長得像幔荒,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子梳玫,可洞房花燭夜當晚...
    茶點故事閱讀 43,554評論 2 349