AI-數(shù)據(jù)標(biāo)注類型

? ? 隨著數(shù)據(jù)的暴增和計算機(jī)硬件技術(shù)的發(fā)展亿昏,也催生了AI技術(shù)在各行各業(yè)的應(yīng)用滲透吉捶。而想將AI技術(shù)應(yīng)用到各行各業(yè)霹陡,數(shù)據(jù)是必需品。因?yàn)閿?shù)據(jù)直接影響到AI最終訓(xùn)練出來的模型好壞双藕。AI建模沒有太大門檻淑趾,但數(shù)據(jù)才是真正的門檻。因此忧陪,目前業(yè)界流傳著一段話有多少人工智能扣泊,就有多少人工。前一篇講述了數(shù)據(jù)如何標(biāo)注及其注意嘶摊,今天來學(xué)習(xí)一下數(shù)據(jù)標(biāo)注的類型有哪些延蟹?

誰來做數(shù)據(jù)標(biāo)注

? ? 目前各個公司需要標(biāo)注的數(shù)據(jù),一般同下面幾大公司或人員承擔(dān)

  • 公司自己招聘人員或?qū)嵙?xí)生進(jìn)行標(biāo)注

這種方式最大的優(yōu)勢是:可以隨時檢查標(biāo)注的質(zhì)量和進(jìn)度叶堆,便于快速溝通和調(diào)整阱飘,數(shù)據(jù)可以做到保密不外泄;劣勢是成本較高

  • 外包給數(shù)據(jù)標(biāo)注公司

這種方式最大的優(yōu)勢是:速度非常快,成本低廉沥匈,標(biāo)注公司也具備一定的開發(fā)標(biāo)注工具能力蔗喂,可定制性化能力較強(qiáng);但劣勢也明顯標(biāo)注公司魚龍混雜,參差不齊高帖,需要隨時檢查標(biāo)注質(zhì)量缰儿,返工成本較大。另外數(shù)據(jù)也無法做到保密不外泄

  • 外包給私人團(tuán)體

這種方式的優(yōu)劣勢基本同標(biāo)注公司散址。優(yōu)勢是成本較低乖阵,因?yàn)榭梢源罅空惺杖藛T,如農(nóng)村閑置人員预麸,兼職人員等瞪浸。稍微培訓(xùn)下即可投入標(biāo)注。

誰來管理數(shù)據(jù)標(biāo)注

? ? 針對數(shù)據(jù)分配給不同的人員师崎,相應(yīng)的角色也可以分為三種類型:

  • 數(shù)據(jù)標(biāo)注人員

主要負(fù)責(zé)數(shù)據(jù)的標(biāo)注和匯總

  • 數(shù)據(jù)檢查人員

主要負(fù)責(zé)數(shù)據(jù)標(biāo)注的質(zhì)量檢查默终,常采用抽檢方式檢查,可細(xì)分為部分抽檢(比例約20%~30%)或全部抽檢

  • 數(shù)據(jù)管理人員

負(fù)責(zé)人員任務(wù)分配犁罩、進(jìn)度跟進(jìn)齐蔽、標(biāo)注培訓(xùn)及對外/對內(nèi)協(xié)調(diào)溝通等

數(shù)據(jù)標(biāo)注類型

? ? 因AI技術(shù)應(yīng)用到具體的實(shí)例場景,會有很大差異床估,因此標(biāo)注的類型也有很多含滴,詳細(xì)如下所示:

圖像標(biāo)注-2D邊框標(biāo)注

? ? 這種類型應(yīng)該是最常見的標(biāo)注方式,常用于檢測目標(biāo)對象的相應(yīng)區(qū)域丐巫,標(biāo)注框位于目標(biāo)對象的四周谈况,如下圖所示:

01邊框標(biāo)注.png

圖像標(biāo)注-3D邊框標(biāo)注

? ? 也稱立方體標(biāo)注,相比2D標(biāo)注而言递胧,還可以展現(xiàn)目標(biāo)對象的近似深度碑韵。如下所示:

05立方體標(biāo)注.png

圖像標(biāo)注-語義分割

? ? 根據(jù)檢測區(qū)域的不同,將圖像標(biāo)注為不同的像素缎脾,如下所示:

02語義分割.png

圖像標(biāo)注-多邊形標(biāo)注

? ? 根據(jù)需求標(biāo)注目標(biāo)對象的形狀祝闻,常用于無法使用邊框標(biāo)注的不規(guī)則的目標(biāo)對象,需要在目標(biāo)對象的各個關(guān)鍵點(diǎn)進(jìn)行描點(diǎn)遗菠,無論最終為何形狀联喘,均要能反應(yīng)目標(biāo)對象的輪廓形狀和所有邊緣,如下所示:

03多邊形標(biāo)注.png

圖像標(biāo)注-直線或曲線標(biāo)注

? ? 根據(jù)需求標(biāo)注目標(biāo)對象對應(yīng)的線條位置辙纬,線條可能是直線也可能是曲線豁遭,常用于分隔表明邊界的事物。常用于自動駕駛贺拣,如下所示:

04線條標(biāo)注.png

圖像標(biāo)注-點(diǎn)標(biāo)注

? ? 這種標(biāo)注一般用于人臉識別蓖谢,人體姿態(tài)跟蹤(如POSE算法)等

06點(diǎn)標(biāo)注.png

視頻標(biāo)注-跟蹤標(biāo)注

? ? 在視頻或連續(xù)的圖像中跟蹤標(biāo)注的目標(biāo)對象捂蕴,形成與ID關(guān)聯(lián)的運(yùn)動軌跡

文本標(biāo)注-中英文語音轉(zhuǎn)寫與校對

? ? 英文語音轉(zhuǎn)中文文本或中文文本轉(zhuǎn)英文語音。

語音標(biāo)注-客服語音標(biāo)注

? ? 外呼機(jī)器人進(jìn)行外呼記錄語音標(biāo)注呼叫成功或失敗蜈抓,從而訓(xùn)練話術(shù)启绰。

常用標(biāo)注工具

? ? 常用標(biāo)注工具如下所示:

  • labelImg

下載地址:https://github.com/tzutalin/labelImg
注意事項(xiàng):使用labelImg時,路徑不能包含中文

  • 精靈標(biāo)注助手

下載地址:http://www.jinglingbiaozhu.com/

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末沟使,一起剝皮案震驚了整個濱河市委可,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌腊嗡,老刑警劉巖着倾,帶你破解...
    沈念sama閱讀 216,997評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異燕少,居然都是意外死亡卡者,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,603評論 3 392
  • 文/潘曉璐 我一進(jìn)店門客们,熙熙樓的掌柜王于貴愁眉苦臉地迎上來崇决,“玉大人,你說我怎么就攤上這事底挫『闵担” “怎么了?”我有些...
    開封第一講書人閱讀 163,359評論 0 353
  • 文/不壞的土叔 我叫張陵建邓,是天一觀的道長盈厘。 經(jīng)常有香客問我,道長官边,這世上最難降的妖魔是什么沸手? 我笑而不...
    開封第一講書人閱讀 58,309評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮注簿,結(jié)果婚禮上契吉,老公的妹妹穿的比我還像新娘。我一直安慰自己诡渴,他們只是感情好栅隐,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,346評論 6 390
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著玩徊,像睡著了一般。 火紅的嫁衣襯著肌膚如雪谨究。 梳的紋絲不亂的頭發(fā)上恩袱,一...
    開封第一講書人閱讀 51,258評論 1 300
  • 那天,我揣著相機(jī)與錄音胶哲,去河邊找鬼畔塔。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的澈吨。 我是一名探鬼主播把敢,決...
    沈念sama閱讀 40,122評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼谅辣!你這毒婦竟也來了修赞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,970評論 0 275
  • 序言:老撾萬榮一對情侶失蹤桑阶,失蹤者是張志新(化名)和其女友劉穎柏副,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蚣录,經(jīng)...
    沈念sama閱讀 45,403評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡割择,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,596評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了萎河。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片荔泳。...
    茶點(diǎn)故事閱讀 39,769評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖虐杯,靈堂內(nèi)的尸體忽然破棺而出玛歌,到底是詐尸還是另有隱情,我是刑警寧澤厦幅,帶...
    沈念sama閱讀 35,464評論 5 344
  • 正文 年R本政府宣布沾鳄,位于F島的核電站,受9級特大地震影響确憨,放射性物質(zhì)發(fā)生泄漏译荞。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,075評論 3 327
  • 文/蒙蒙 一休弃、第九天 我趴在偏房一處隱蔽的房頂上張望吞歼。 院中可真熱鬧,春花似錦塔猾、人聲如沸篙骡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,705評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽糯俗。三九已至,卻和暖如春睦擂,著一層夾襖步出監(jiān)牢的瞬間得湘,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,848評論 1 269
  • 我被黑心中介騙來泰國打工顿仇, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留淘正,地道東北人摆马。 一個月前我還...
    沈念sama閱讀 47,831評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像鸿吆,于是被迫代替她去往敵國和親囤采。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,678評論 2 354

推薦閱讀更多精彩內(nèi)容

  • ? ? 算力和數(shù)據(jù)是影響深度學(xué)習(xí)的兩個關(guān)鍵因素惩淳。在算力滿足的情況下蕉毯,為了達(dá)到更好的效果,我們就需要提供海量優(yōu)質(zhì)素材...
    Surpassme閱讀 1,872評論 0 1
  • 人工智能時代相較于過去的數(shù)據(jù)處理方式黎泣,除了在數(shù)據(jù)量級上的差別之外恕刘,最大的差別是對非結(jié)構(gòu)化數(shù)據(jù)的處理與運(yùn)用。本文將介...
    P與N的協(xié)奏閱讀 1,728評論 0 2
  • 延安是昔日革命的根據(jù)地抒倚!而今我村的村支書村長他們帶領(lǐng)部分村民褐着,去參觀去學(xué)習(xí)去旅游,為此留下終身難忘的合影留念托呕! 看...
    碧婷閱讀 133評論 0 1