人工智能數(shù)據(jù)標(biāo)注平臺介紹

有一個非常形象的比喻——數(shù)據(jù)是21世紀(jì)的石油临谱。

然而,大多數(shù)原始數(shù)據(jù)其實(shí)更像原油套利,并不能直接拿來就用推励。特別是在如火如荼的AI領(lǐng)域,更需要先進(jìn)行數(shù)據(jù)標(biāo)注肉迫,將原始數(shù)據(jù)變成算法可用數(shù)據(jù)验辞。如果數(shù)據(jù)是原油,那么數(shù)據(jù)標(biāo)注就是把原油提煉為成品油的過程喊衫。

數(shù)據(jù)標(biāo)注得越精準(zhǔn)跌造、對算法模型訓(xùn)練的效果就越好。大部分算法在擁有足夠多普通標(biāo)注數(shù)據(jù)的情況下族购,能夠?qū)?zhǔn)確率提升到 95%壳贪,但從 95% 再提升到 99% 甚至 99.9% ,就需要大量高質(zhì)量的標(biāo)注數(shù)據(jù)寝杖〕挪辏可以說,高質(zhì)量的數(shù)據(jù)是制約模型和算法突破瓶頸的關(guān)鍵指標(biāo)朝墩。

事實(shí)上醉拓,正是由于數(shù)據(jù)標(biāo)注的重要性,在AI產(chǎn)業(yè)的上游已經(jīng)形成了一條數(shù)據(jù)標(biāo)注產(chǎn)業(yè)鏈收苏。京東金融也在去年8月推出了專注于人工智能數(shù)據(jù)標(biāo)注的科技平臺——京東眾智亿卤。

京東眾智數(shù)據(jù)標(biāo)注平臺

京東金融之所以上馬京東眾智項目,是因為隨著公司AI研發(fā)的加速推進(jìn)鹿霸,急劇增長的數(shù)據(jù)需求在市場上得不到有效滿足排吴。

京東眾智負(fù)責(zé)人回憶說:“隨著業(yè)務(wù)量的增大,我們在AI開發(fā)中需要的數(shù)據(jù)標(biāo)注量越來越大懦鼠。我們找過很多數(shù)據(jù)標(biāo)注公司钻哩,但是合作效果都不理想。這些問題嚴(yán)重拖累了很多項目的開發(fā)進(jìn)度肛冶。痛定思痛街氢,我們決定開發(fā)自己的數(shù)據(jù)標(biāo)注平臺,立項的時間是去年5月睦袖,我們只用了三個月時間珊肃,就在去年8月上線了京東眾智平臺。”

京東眾智開發(fā)團(tuán)隊總結(jié)了各類數(shù)據(jù)標(biāo)注平臺的優(yōu)點(diǎn)伦乔,并針對效率厉亏、質(zhì)量、數(shù)據(jù)安全等痛點(diǎn)烈和,對癥下藥——

  1. 人員專業(yè)度: 通過科學(xué)的培訓(xùn)機(jī)制和激勵機(jī)制爱只,建立起一套從標(biāo)注專員到標(biāo)注專家,再到高級專家和講師的完整人才體系招刹。

2)場景豐富度:開發(fā)了覆蓋無人駕駛虱颗、智能服務(wù)機(jī)器人、醫(yī)療影像輔助診斷等八大業(yè)務(wù)場景的一系列專業(yè)工具和豐富模板蔗喂。

3)審核機(jī)制: 與業(yè)內(nèi)常見的抽檢和一重審核不同,京東眾智設(shè)置了雙重審核機(jī)制高帖,針對一些復(fù)雜度高的標(biāo)注任務(wù)缰儿,甚至?xí)M(jìn)行第三重審核,以確保最終標(biāo)注質(zhì)量散址。

京東眾智數(shù)據(jù)標(biāo)注平臺
京東眾智數(shù)據(jù)標(biāo)注平臺

傳統(tǒng)的數(shù)據(jù)標(biāo)注行業(yè)更像一個勞動密集型產(chǎn)業(yè)乖阵,主要是靠人工方式對文本、圖片预麸、語音瞪浸、視頻等數(shù)據(jù)進(jìn)行標(biāo)注。

京東金融推出Pre-AI快速落地方案吏祸,將人工標(biāo)注和智能標(biāo)注同步進(jìn)行——第一步由人工進(jìn)行少量標(biāo)注对蒲,生成標(biāo)注樣本。第二步對樣本進(jìn)行建模訓(xùn)練贡翘,然后用訓(xùn)練出來的模型進(jìn)行數(shù)據(jù)預(yù)標(biāo)注蹈矮,由人工判斷標(biāo)注是否準(zhǔn)確,并反饋結(jié)果用于優(yōu)化算法鸣驱,直到機(jī)器標(biāo)注的準(zhǔn)確率達(dá)到99%時泛鸟,人工完全撤出。

Pre-AI方案明顯提高了數(shù)據(jù)標(biāo)注平臺效率踊东,用一個星期的時間北滥,就能完成傳統(tǒng)模式下一個月的標(biāo)注任務(wù)。

京東眾智數(shù)據(jù)標(biāo)注平臺
京東眾智數(shù)據(jù)標(biāo)注平臺

對于很多企事業(yè)單位來說闸翅,在將數(shù)據(jù)標(biāo)注外包時再芋,都會擔(dān)心數(shù)據(jù)安全問題,尤其是對于政府部門坚冀、銀行等金融機(jī)構(gòu)來說祝闻,數(shù)據(jù)安全問題至關(guān)重要。

為了確保涉密數(shù)據(jù)、核心數(shù)據(jù)的安全联喘,京東金融開發(fā)了數(shù)據(jù)與流程分離的DCS架構(gòu)华蜒。合作企業(yè)只要部署一套“眾智星”系統(tǒng),就可以通過調(diào)用接口的方式鏈接到京東眾智平臺豁遭,從而確保數(shù)據(jù)在不外流的情況下叭喜,使用京東眾智現(xiàn)有的工具模板、人員體系蓖谢、流程體系捂蕴。

京東眾智數(shù)據(jù)標(biāo)注平臺

京東眾智上線一年來,一位來自銀行的客戶表示:“過去闪幽,我們做一條身份證地址標(biāo)注啥辨,成本是2毛到6毛錢,在京東眾智平臺上只需要5分錢盯腌,而且標(biāo)注周期縮短為原先的四分之一溉知,質(zhì)量也明顯提高⊥蠊唬”喜悅之情溢于言表级乍。

總結(jié)京東眾智一年來取得的成績,京東眾智負(fù)責(zé)人表示:“我們在做京東眾智時帚湘,選擇了一條與業(yè)內(nèi)流行的輕模式截然相反的重模式玫荣,別人不提供預(yù)打標(biāo)、人員培訓(xùn)大诸、標(biāo)注工具捅厂、審核機(jī)制,我們都提供资柔。第一年恒傻,我們的重點(diǎn)是做好產(chǎn)品、技術(shù)和人才體系建邓;未來我們的重點(diǎn)是打造合作生態(tài)盈厘。希望在不久的將來,國內(nèi)大部分的AI公司都可以用我們平臺上標(biāo)注的高質(zhì)量數(shù)據(jù)官边,訓(xùn)練出更優(yōu)質(zhì)的模型和算法沸手。”

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末注簿,一起剝皮案震驚了整個濱河市契吉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌诡渴,老刑警劉巖捐晶,帶你破解...
    沈念sama閱讀 206,378評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件菲语,死亡現(xiàn)場離奇詭異,居然都是意外死亡惑灵,警方通過查閱死者的電腦和手機(jī)山上,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來英支,“玉大人佩憾,你說我怎么就攤上這事「苫ǎ” “怎么了妄帘?”我有些...
    開封第一講書人閱讀 152,702評論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長池凄。 經(jīng)常有香客問我抡驼,道長,這世上最難降的妖魔是什么肿仑? 我笑而不...
    開封第一講書人閱讀 55,259評論 1 279
  • 正文 為了忘掉前任致盟,我火速辦了婚禮,結(jié)果婚禮上柏副,老公的妹妹穿的比我還像新娘。我一直安慰自己蚣录,他們只是感情好割择,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,263評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著萎河,像睡著了一般荔泳。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上虐杯,一...
    開封第一講書人閱讀 49,036評論 1 285
  • 那天玛歌,我揣著相機(jī)與錄音,去河邊找鬼擎椰。 笑死支子,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的达舒。 我是一名探鬼主播值朋,決...
    沈念sama閱讀 38,349評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼巩搏!你這毒婦竟也來了昨登?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,979評論 0 259
  • 序言:老撾萬榮一對情侶失蹤贯底,失蹤者是張志新(化名)和其女友劉穎丰辣,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,469評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡笙什,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,938評論 2 323
  • 正文 我和宋清朗相戀三年飘哨,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片得湘。...
    茶點(diǎn)故事閱讀 38,059評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡杖玲,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出淘正,到底是詐尸還是另有隱情摆马,我是刑警寧澤,帶...
    沈念sama閱讀 33,703評論 4 323
  • 正文 年R本政府宣布鸿吆,位于F島的核電站囤采,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏惩淳。R本人自食惡果不足惜蕉毯,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,257評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望思犁。 院中可真熱鬧代虾,春花似錦、人聲如沸激蹲。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽学辱。三九已至乘瓤,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間策泣,已是汗流浹背衙傀。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留萨咕,地道東北人统抬。 一個月前我還...
    沈念sama閱讀 45,501評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像危队,于是被迫代替她去往敵國和親蓄喇。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,792評論 2 345

推薦閱讀更多精彩內(nèi)容