前言
今天分享的內(nèi)容是2017年5月10日晚寸五,在微信群里做的一次分享踩叭,這里整理出來侈咕,以供大家閱讀公罕、了解。
為什么要分享一下數(shù)據(jù)分析方面的知識呢耀销?
一是擴(kuò)展下知識面
二是期望討論下數(shù)據(jù)分析在測試領(lǐng)域的應(yīng)用場景的可能性
從分享的情況來看楼眷,測試人員的思維依舊非常局限,同時大多的測試從業(yè)者的知識面是相當(dāng)?shù)莫M窄。
數(shù)據(jù)分析的關(guān)鍵要點(diǎn)
準(zhǔn)備
主要是讀寫各種各樣的文件格式罐柳、數(shù)據(jù)庫掌腰,獲取原始數(shù)據(jù)集。處理
主要對原始數(shù)據(jù)集進(jìn)行清理张吉、休整齿梁、整合、規(guī)劃化肮蛹、重塑勺择、切片切換、變形等處理蔗崎,生成可數(shù)據(jù)分析的數(shù)據(jù)集酵幕。轉(zhuǎn)換
對可分析數(shù)據(jù)集做數(shù)據(jù)做一些數(shù)學(xué)和統(tǒng)計(jì)運(yùn)算生成新的數(shù)據(jù)集。例如分組分類缓苛、數(shù)據(jù)聚合等等。建模和計(jì)算
將新的數(shù)據(jù)集跟統(tǒng)計(jì)模型邓深、機(jī)器學(xué)習(xí)算法進(jìn)行關(guān)聯(lián)未桥,實(shí)現(xiàn)數(shù)據(jù)落地的應(yīng)用模型和計(jì)算。展示
將數(shù)據(jù)最終根據(jù)其應(yīng)用場景創(chuàng)建交互式的或報(bào)表芥备、文字冬耿、圖片等靜態(tài)信息展示。
應(yīng)用場景
通常情況下萌壳,大家所了解的數(shù)據(jù)分析更多的是為市場亦镶、運(yùn)營服務(wù)。
那數(shù)據(jù)分析在測試領(lǐng)域可否有發(fā)揮的地方呢袱瓮?
筆者以為缤骨,數(shù)據(jù)分析是可以在測試領(lǐng)域發(fā)揮重要功能的,甚至可以為質(zhì)量的保證提供一個很好的支撐尺借。
下面我們來嘗試發(fā)散下:
通常情況下绊起,每天業(yè)務(wù)線上的運(yùn)營會產(chǎn)生以G為單位的日志數(shù)據(jù),而這些日志數(shù)據(jù)中記錄著系統(tǒng)運(yùn)營過程中的異常燎斩、錯誤等等虱歪,如果通過對其進(jìn)行分析,再反饋至測試過程中的策略定制栅表、用例設(shè)計(jì)和日常業(yè)務(wù)測試結(jié)合笋鄙,應(yīng)當(dāng)可以改進(jìn)整個測試過程。
在任何一個行業(yè)里怪瓶,其業(yè)務(wù)數(shù)據(jù)都具備一定的行業(yè)特征萧落,如果能將這些特征進(jìn)行分析,抽離出來。那么應(yīng)該可以嘗試該類業(yè)務(wù)級數(shù)據(jù)的自動化測試
在我們?nèi)粘5钠髽I(yè)實(shí)踐中铐尚,大家有沒有發(fā)現(xiàn)拨脉,其實(shí)很多數(shù)據(jù)是獨(dú)立,業(yè)務(wù)無關(guān)的宣增。把這類數(shù)據(jù)進(jìn)行抽離后玫膀,是可以做元數(shù)據(jù)級的自動化測試的
當(dāng)我們從事某一個行業(yè)的時間夠長時,會發(fā)現(xiàn)不管系統(tǒng)如何改造爹脾,以前所踩過的坑帖旨,在系統(tǒng)改造時依舊會出現(xiàn),對測試人員來說是十足的坑灵妨,如何能更好的避免呢解阅? 我想,對歷史bug記錄的分析泌霍,尤其時積累了幾萬的bug時货抄,單純的靠人工分析是不靠譜的,如果引入數(shù)據(jù)分析相關(guān)技術(shù)來進(jìn)行自動化分析朱转,并能夠形成一定的模式蟹地,那對于避免這些坑將會有很大的作用
就不一一舉例了,大家可以盡情的發(fā)揮想象藤为,數(shù)據(jù)分析技術(shù)在測試領(lǐng)域或是說質(zhì)量保證是可以發(fā)揮極大的能量的怪与。
數(shù)據(jù)分析技術(shù)
我們一起來看下筆者推薦給大家學(xué)習(xí)掌握的數(shù)據(jù)分析技術(shù)。
- python 編程不可少
- numpy 數(shù)據(jù)計(jì)算基礎(chǔ)庫
- pandas 數(shù)據(jù)分析庫
- scikit 機(jī)器學(xué)習(xí)套件
- TensorFlow 谷歌基于DistBelief進(jìn)行研發(fā)的第二代人工智能學(xué)習(xí)系統(tǒng)缅疟。
- Spark 是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎(當(dāng)你面對TB為單位的數(shù)據(jù)時需要的東西)
對于大部分情況下分别,大家只需python、numpy存淫、pandas就可以干活了耘斩。
推薦點(diǎn)資料
- 《Python數(shù)據(jù)分析基礎(chǔ)教程:NumPy學(xué)習(xí)指南(第2版)》
- 《集體智慧編程》
- 《利用python進(jìn)行數(shù)據(jù)分析》
- scikit官方文檔:http://scikit-learn.org/stable/tutorial/index.html
其他的就先不推薦了,有興趣的朋友可以自行搜索閱讀纫雁。