一宰闰、需求與場景分析
1.1 需求分析
a.數(shù)據(jù)的審核茬贵,需要了解數(shù)據(jù)的質(zhì)量情況,對采集移袍、處理的數(shù)據(jù)進(jìn)行把控解藻;
b.數(shù)據(jù)的編輯,需要對看到明顯錯誤的數(shù)據(jù)進(jìn)行編輯葡盗、修改或增加螟左;
c.數(shù)據(jù)的標(biāo)注,需要人工對數(shù)據(jù)進(jìn)行規(guī)范性標(biāo)注。
1.2 使用場景
數(shù)據(jù)審核人員小明胶背,負(fù)責(zé)法律法規(guī)/司法案例/法學(xué)期刊/用戶需求數(shù)據(jù)質(zhì)量的控制工作巷嚣,最近新增了一批數(shù)據(jù),需要快速地了解這批數(shù)據(jù)量有多少钳吟、有哪些內(nèi)容廷粒、是否有新處理的字段、字段內(nèi)容是否完善砸抛、缺失率多少评雌,以便效率地評估此批數(shù)據(jù)的質(zhì)量、并有針對性地進(jìn)行抽查直焙,發(fā)現(xiàn)問題后及時反饋給數(shù)據(jù)處理方景东。
數(shù)據(jù)編輯人員小紅,負(fù)責(zé)法律法規(guī)/司法案例/法學(xué)期刊數(shù)據(jù)的校驗(yàn)奔誓,需要對有錯誤斤吐、不規(guī)范的數(shù)據(jù)進(jìn)行編輯、修改或人工增加字段厨喂,她發(fā)現(xiàn)法規(guī)的數(shù)據(jù)
小強(qiáng)是一名大三的在校法學(xué)生和措,最近被老師叫去把案例里的原被告、律師蜕煌、法官都給標(biāo)出來派阱,他需要一定的規(guī)范字段和簡單流暢的操作平臺。
二斜纪、市場同類產(chǎn)品調(diào)研分析
主要針對上述需求贫母,對人工標(biāo)注與數(shù)據(jù)審核平臺進(jìn)行了了解,但因兩者都偏公司內(nèi)部應(yīng)用較多盒刚,特別是數(shù)據(jù)審核腺劣,所以能直接看到的并不多,只能通過平臺demo或公開宣講的資料了解人家的思路與解決方案因块。
數(shù)據(jù)標(biāo)注橘原,主要體驗(yàn)、了解了百度眾包涡上、京東微工趾断、龍貓數(shù)據(jù)等平臺,屬于人工標(biāo)注轉(zhuǎn)平臺商業(yè)化應(yīng)用的階段了吩愧,因此提供的功能與服務(wù)都會包括方案設(shè)計芋酌、數(shù)據(jù)采集、數(shù)據(jù)清洗耻警、數(shù)據(jù)標(biāo)準(zhǔn),可借鑒這些公司數(shù)據(jù)標(biāo)注的流程與項(xiàng)目管理。
數(shù)據(jù)審核甘穿,主要了解宜信公司的Themis腮恩,是針對數(shù)據(jù)庫工作表及SQL質(zhì)量進(jìn)行監(jiān)控的平臺,雖然運(yùn)用人員是DBA 但其解決思路可供借鑒温兼,即通過可視化的方式對工作表容量秸滴、字段數(shù)、索引數(shù)募判、異常數(shù)進(jìn)行顯示荡含,便于工作人員快速地定位數(shù)據(jù)問題。
三届垫、產(chǎn)品概述
基于數(shù)據(jù)需求释液,及產(chǎn)品調(diào)研情況,對產(chǎn)品做如下概述装处。
3.1 產(chǎn)品簡介
審核误债、人工平臺主要供內(nèi)部或部分標(biāo)注者使用,屬于工具型產(chǎn)品妄迁,作為數(shù)據(jù)質(zhì)量控制寝蹈、建設(shè)的基礎(chǔ)環(huán)節(jié),是保障上層數(shù)據(jù)應(yīng)用的基礎(chǔ)登淘,也是是數(shù)據(jù)商業(yè)變現(xiàn)的基本前提箫老。
3.2 產(chǎn)品定位
(1) 幫助審核人員監(jiān)控數(shù)據(jù)質(zhì)量,快速定位問題黔州,并高效地完成數(shù)據(jù)審核耍鬓、編輯工作;
(2) 主要支持法律法規(guī)辩撑、司法案例兩個主要業(yè)務(wù)線數(shù)據(jù)界斜,后期將不斷加入其它數(shù)據(jù);
(3) 主要使用者為數(shù)據(jù)審核合冀、編輯人員各薇;
(4) 平臺只提供數(shù)據(jù)的監(jiān)控與編輯修改,發(fā)現(xiàn)的一些問題及項(xiàng)目協(xié)助通過其它工具處理君躺。
3.3 產(chǎn)品功能
(1) 數(shù)據(jù)的監(jiān)控峭判、審核功能,主要供數(shù)據(jù)審核人員對負(fù)責(zé)的數(shù)據(jù)進(jìn)行質(zhì)量的監(jiān)控與審核棕叫,及時發(fā)現(xiàn)問題林螃,以確保數(shù)據(jù)質(zhì)量。
(2)數(shù)據(jù)的標(biāo)注功能俺泣,主要供數(shù)據(jù)標(biāo)注人員領(lǐng)取數(shù)據(jù)標(biāo)準(zhǔn)任務(wù)疗认、對要求的標(biāo)注工作進(jìn)行保質(zhì)保量地完成完残。
(3) 用戶管理的功能,對平臺內(nèi)不同的賬號角色横漏、權(quán)限谨设、功能及操作日志進(jìn)行管理。
四缎浇、產(chǎn)品說明
略~