在網(wǎng)絡(luò)最后的輸出中牌里,對(duì)于每個(gè)grid cell產(chǎn)生3個(gè)bounding box,每個(gè)bounding box的輸出有三類參數(shù):一個(gè)是對(duì)象的box參數(shù)薄疚,一共是四個(gè)值图张,即box的中心點(diǎn)坐標(biāo)(x,y)和box的寬和高(w,h);一個(gè)是置信度,這是個(gè)區(qū)間在[0,1]之間的值韩肝;最后一個(gè)是一組條件類別概率触菜,都是區(qū)間在[0,1]之間的值,代表概率哀峻。
假如一個(gè)圖片被分割成S?SS*SS?S個(gè)grid cell涡相,我們有B個(gè)anchor box,也就是說(shuō)每個(gè)grid cell有B個(gè)bounding box, 每個(gè)bounding box內(nèi)有4個(gè)位置參數(shù)剩蟀,1個(gè)置信度催蝗,classes個(gè)類別概率,那么最終的輸出維數(shù)是:S?S?[B?(4+1+classes)]S*S*[B*(4 + 1 + classes)]S?S?[B?(4+1+classes)]育特。
下面分別具體介紹這三個(gè)參數(shù)的意義丙号。
anchor box其實(shí)就是從訓(xùn)練集的所有g(shù)round truth box中統(tǒng)計(jì)(使用k-means)出來(lái)的在訓(xùn)練集中最經(jīng)常出現(xiàn)的幾個(gè)box形狀和尺寸。比如缰冤,在某個(gè)訓(xùn)練集中最常出現(xiàn)的box形狀有扁長(zhǎng)的犬缨、瘦高的和寬高比例差不多的正方形這三種形狀。我們可以預(yù)先將這些統(tǒng)計(jì)上的先驗(yàn)(或來(lái)自人類的)經(jīng)驗(yàn)加入到模型中棉浸,這樣模型在學(xué)習(xí)的時(shí)候怀薛,瞎找的可能性就更小了些,當(dāng)然就有助于模型快速收斂了迷郑。以前面提到的訓(xùn)練數(shù)據(jù)集中的ground truth box最常出現(xiàn)的三個(gè)形狀為例乾戏,當(dāng)模型在訓(xùn)練的時(shí)候我們可以告訴它迂苛,你要在grid cell 1附件找出的對(duì)象的形狀要么是扁長(zhǎng)的三热、要么是瘦高的鼓择、要么是長(zhǎng)高比例差不多的正方形,你就不要再瞎試其他的形狀了就漾。anchor box其實(shí)就是對(duì)預(yù)測(cè)的對(duì)象范圍進(jìn)行約束呐能,并加入了尺寸先驗(yàn)經(jīng)驗(yàn),從而實(shí)現(xiàn)多尺度學(xué)習(xí)的目的抑堡。
量化anchor box
要在模型中使用這些形狀摆出,總不能告訴模型有個(gè)形狀是瘦高的,還有一個(gè)是矮胖的首妖,我們需要量化這些形狀偎漫。YOLO的做法是想辦法找出分別代表這些形狀的寬和高,有了寬和高有缆,尺寸比例即形狀不就有了象踊。YOLO作者的辦法是使用k-means算法在訓(xùn)練集中所有樣本的ground truth box中聚類出具有代表性形狀的寬和高,作者將這種方法稱作維度聚類(dimension cluster)棚壁。細(xì)心的讀者可能會(huì)提出這個(gè)問(wèn)題:到底找出幾個(gè)anchor box算是最佳的具有代表性的形狀杯矩。YOLO作者方法是做實(shí)驗(yàn),聚類出多個(gè)數(shù)量不同anchor box組袖外,分別應(yīng)用到模型中史隆,最終找出最優(yōu)的在模型的復(fù)雜度和高召回率(high recall)之間折中的那組anchor box。作者在COCO數(shù)據(jù)集中使用了9個(gè)anchor box曼验,我們前面提到的例子則有3個(gè)anchor box泌射。
怎么在實(shí)際的模型中加入anchor box的先驗(yàn)經(jīng)驗(yàn)?zāi)兀?/b>
最終負(fù)責(zé)預(yù)測(cè)grid cell中對(duì)象的box的最小單元是bounding box,那我們可以讓一個(gè)grid cell輸出(預(yù)測(cè))多個(gè)bounding box,然后每個(gè)bounding box負(fù)責(zé)預(yù)測(cè)不同的形狀不就行了鬓照?比如前面例子中的3個(gè)不同形狀的anchor box熔酷,我們的一個(gè)grid cell會(huì)輸出3個(gè)參數(shù)相同的bounding box,第一個(gè)bounding box負(fù)責(zé)預(yù)測(cè)的形狀與anchor box 1類似的box颖杏,其他兩個(gè)bounding box依次類推纯陨。作者在YOLOv3中取消了v2之前每個(gè)grid cell只負(fù)責(zé)預(yù)測(cè)一個(gè)對(duì)象的限制,也就是說(shuō)grid cell中的三個(gè)bounding box都可以預(yù)測(cè)對(duì)象留储,當(dāng)然他們應(yīng)該對(duì)應(yīng)不同的ground truth翼抠。那么如何在訓(xùn)練中確定哪個(gè)bounding box負(fù)責(zé)某個(gè)ground truth呢?方法是求出每個(gè)grid cell中每個(gè)anchor box與ground truth box的IOU(交并比)获讳,IOU最大的anchor box對(duì)應(yīng)的bounding box就負(fù)責(zé)預(yù)測(cè)該ground truth阴颖,也就是對(duì)應(yīng)的對(duì)象,后面還會(huì)提到負(fù)責(zé)預(yù)測(cè)的問(wèn)題丐膝。
怎么告訴模型第一個(gè)bounding box負(fù)責(zé)預(yù)測(cè)的形狀與anchor box 1類似量愧,第二個(gè)bounding box負(fù)責(zé)預(yù)測(cè)的形狀與anchor box 2類似钾菊?
YOLO的做法是不讓bounding box直接預(yù)測(cè)實(shí)際box的寬和高(w,h),而是將預(yù)測(cè)的寬和高分別與anchor box的寬和高綁定偎肃,這樣不管一開(kāi)始bounding box輸出的(w,h)是怎樣的煞烫,經(jīng)過(guò)轉(zhuǎn)化后都是與anchor box的寬和高相關(guān),這樣經(jīng)過(guò)很多次懲罰訓(xùn)練后累颂,每個(gè)bounding box就知道自己該負(fù)責(zé)怎樣形狀的box預(yù)測(cè)了滞详。這個(gè)綁定的關(guān)系是什么?就涉及到了anchor box的計(jì)算紊馏。
前提需要知道料饥,
cxc_{x}cx?和cyc_{y}cy?的坐標(biāo)是(0,0) (0,1),(0,2),(0,3)…(0,13)
(1,0),(1,1),(1,2),(1,3)…(1,13)等等
bouding box的輸出應(yīng)當(dāng)為:txt_{x}tx?和tyt_{y}ty?以及twt_{w}tw?和tht_{h}th?
而真實(shí)的預(yù)測(cè)box應(yīng)當(dāng)是:bxb_{x}bx?和byb_{y}by?(中心坐標(biāo))以及bwb_{w}bw?和bhb_{h}bh?(寬高)
還有就是cxc_{x}cx?和cyc_{y}cy?的每一個(gè)都是1,也就是說(shuō)朱监,每個(gè)格子grid cell是以1為一個(gè)范圍岸啡,每個(gè)grid cell的大小實(shí)際是1?11*11?1
剛才說(shuō)的綁定的關(guān)系是什么?就是下面這個(gè)公式:
bw=awetwb_w=a_we^{t_w}bw?=aw?etw?bh=ahethb_h=a_he^{t_h}bh?=ah?eth?
其中赫编,awa_{w}aw?和aha_{h}ah?為anchor box的寬和高巡蘸,
twt_{w}tw?和tht_{h}th?為bounding box直接預(yù)測(cè)出的寬和高,
bwb_{w}bw?和bhb_{h}bh?為轉(zhuǎn)換后預(yù)測(cè)的實(shí)際寬和高沛慢,
這也就是最終預(yù)測(cè)中輸出的寬和高赡若。你可能會(huì)想,這個(gè)公式這么麻煩团甲,為什么不能用bw=aw?twb_{w}=a_{w}*t_{w}bw?=aw??tw?,?bh=ah?thb_{h}=a_{h}*t_{h}bh?=ah??th?這樣的公式逾冬,我的理解是上面的公式雖然計(jì)算起來(lái)比較麻煩,但是在誤差函數(shù)求導(dǎo)后還帶有twt_{w}tw?和tht_{h}th?參數(shù)躺苦,而且也好求導(dǎo)(此觀點(diǎn)只是個(gè)人推測(cè)身腻,需要進(jìn)一步查證)。
既然提到了最終預(yù)測(cè)的寬和高公式匹厘,那我們也就直接帶出最終預(yù)測(cè)輸出的box中心坐標(biāo)(bx,by)(b_{x},b_{y})(bx?,by?)的計(jì)算公式:
前面提到過(guò)box中心坐標(biāo)總是落在相應(yīng)的grid cell中的嘀趟,所以bounding box直接預(yù)測(cè)出的txt_{x}tx?和tyt_{y}ty?也是相對(duì)grid cell來(lái)說(shuō)的,要想轉(zhuǎn)換成最終輸出的絕對(duì)坐標(biāo)愈诚,需要下面的轉(zhuǎn)換公式:
bx=σ(tx)+cxb_{x} = \sigma(t_{x}) + c_{x}bx?=σ(tx?)+cx?by=σ(ty)+cyb_{y} = \sigma(t_{y}) + c_{y}by?=σ(ty?)+cy?
其中她按,σ(tx)\sigma(t_{x})σ(tx?)為sigmoid函數(shù),
cxc_{x}cx?和cyc_{y}cy?分別為grid cell方格左上角點(diǎn)相對(duì)整張圖片的坐標(biāo)炕柔。
這個(gè)公式tx,ty為何要sigmoid一下白锰?
作者使用這樣的轉(zhuǎn)換公式主要是因?yàn)樵谟?xùn)練時(shí)如果沒(méi)有將txt_{x}tx?和tyt_{y}ty?壓縮到(0,1)區(qū)間內(nèi)的話匕累,模型在訓(xùn)練前期很難收斂陵刹。
另外:用sigmoid將txt_{x}tx?和tyt_{y}ty?壓縮到[0,1]區(qū)間內(nèi),可以有效的確保目標(biāo)中心處于執(zhí)行預(yù)測(cè)的網(wǎng)格單元中欢嘿,防止偏移過(guò)多衰琐。
舉個(gè)例子也糊,我們剛剛都知道了網(wǎng)絡(luò)不會(huì)預(yù)測(cè)邊界框中心的確切坐標(biāo)而是預(yù)測(cè)與預(yù)測(cè)目標(biāo)的grid cell左上角相關(guān)的偏移txt_{x}tx?和tyt_{y}ty?。如13?1313*1313?13的feature map中羡宙,某個(gè)目標(biāo)的中心點(diǎn)預(yù)測(cè)為(0.4,0.7)【都小于1】狸剃,它的cxc_{x}cx?和cyc_{y}cy?即中心落入的grid cell坐標(biāo)是(6,6),則該物體的在feature map中的中心實(shí)際坐標(biāo)顯然是(6.4,6.7).這種情況沒(méi)毛病辛辨,但若txt_{x}tx?和tyt_{y}ty?大于1捕捂,比如(1.2,0.7)則該物體在feature map的的中心實(shí)際坐標(biāo)是(7.2,6.7),注意這時(shí)候該物體中心在這個(gè)物體所屬grid cell外面了斗搞,但(6,6)這個(gè)grid cell卻檢測(cè)出我們這個(gè)單元格內(nèi)含有目標(biāo)的中心(yolo是采取物體中心歸哪個(gè)grid cell整個(gè)物體就歸哪個(gè)grid celll了),這樣就矛盾了慷妙,因?yàn)樽笊辖菫?6,6)的grid cell負(fù)責(zé)預(yù)測(cè)這個(gè)物體僻焚,這個(gè)物體中心必須出現(xiàn)在這個(gè)grid cell中而不能出現(xiàn)在它旁邊網(wǎng)格中,一旦txt_{x}tx?和tyt_{y}ty?算出來(lái)大于1就會(huì)引起矛盾膝擂,因而必須歸一化虑啤。
最終可以得出實(shí)際輸出的box參數(shù)公式如下,這個(gè)也是在推理時(shí)將輸出轉(zhuǎn)換為最終推理結(jié)果的公式:
bx=σ(tx)+cxb_{x}=\sigma(t_{x}) + c_{x}bx?=σ(tx?)+cx?by=σ(ty)+cyb_{y}=\sigma(t_{y}) + c_{y}by?=σ(ty?)+cy?bw=awetwb_{w}= a_{w}e^{t_{w}}bw?=aw?etw?bh=ahethb_{h}= a_{h}e^{t_{h}}bh?=ah?eth?
其中架馋,
cxc_{x}cx?和cyc_{y}cy?是網(wǎng)格grid cell的左上角坐標(biāo)是:(0,0) (0,1),(0,2),(0,3)…(0,13)
(1,0),(1,1),(1,2),(1,3)…(1,13)等等
bouding box的輸出應(yīng)當(dāng)為:txt_{x}tx?和tyt_{y}ty?以及twt_{w}tw?和tht_{h}th?
而真實(shí)的預(yù)測(cè)box應(yīng)當(dāng)是:bxb_{x}bx?和byb_{y}by?以及bwb_{w}bw?和bhb_{h}bh?
bxb_{x}bx?和byb_{y}by?以及bwb_{w}bw?和bhb_{h}bh?:預(yù)測(cè)出來(lái)的box的中心坐標(biāo)和寬高
下圖中的pwp_wpw?實(shí)際上就是上面的awa_waw?狞山,php_hph?實(shí)際上就是上面的aha_hah?
訓(xùn)練
關(guān)于box參數(shù)的轉(zhuǎn)換還有一點(diǎn)值得一提,作者在訓(xùn)練中并不是將tx叉寂、ty萍启、tw和tht_{x}、t_{y}屏鳍、t_{w}和t_{h}tx?勘纯、ty?、tw?和th?轉(zhuǎn)換為bx钓瞭、by驳遵、bwb_{x}、b_{y}山涡、b_{w}bx?堤结、by?、bw?和bhb_{h}bh?后與ground truth box的對(duì)應(yīng)參數(shù)求誤差鸭丛,而是使用上述公式的逆運(yùn)算將ground truth box的參數(shù)轉(zhuǎn)換為與tx竞穷、ty、twt_{x}系吩、t_{y}来庭、t_{w}tx?、ty?穿挨、tw?和th對(duì)應(yīng)的gx月弛、gy肴盏、gwt_{h}對(duì)應(yīng)的g_{x}、g_{y}帽衙、g_{w}th?對(duì)應(yīng)的gx?菜皂、gy?、gw?和ghg_{h}gh?厉萝,然后再計(jì)算誤差恍飘。
也就是說(shuō),我們訓(xùn)練的輸出是:tx谴垫、ty章母、twt_{x}、t_{y}翩剪、t_{w}tx?乳怎、ty?、tw?和tht_{h}th?前弯,那么在計(jì)算誤差時(shí)蚪缀,也是利用真實(shí)框的t?x、t?y恕出、t?w\hat t_{x}询枚、\hat t_{y}、\hat t_{w}t^x?浙巫、t^y?金蜀、t^w?和t?h\hat t_{h}t^h?這幾個(gè)值計(jì)算誤差。
所以需要求解t?x狈醉、t?y廉油、t?w\hat t_{x}、\hat t_{y}苗傅、\hat t_{w}t^x?抒线、t^y?、t^w?和t?h\hat t_{h}t^h?:
對(duì)于上面的公式:
bx=σ(tx)+cxb_{x}=\sigma(t_{x}) + c_{x}bx?=σ(tx?)+cx?by=σ(ty)+cyb_{y}=\sigma(t_{y}) + c_{y}by?=σ(ty?)+cy?bw=awetwb_{w}= a_{w}e^{t_{w}}bw?=aw?etw?bh=ahethb_{h}= a_{h}e^{t_{h}}bh?=ah?eth?
我們可以知道其中渣慕,bx嘶炭、by、bwb_{x}逊桦、b_{y}眨猎、b_{w}bx?、by?强经、bw?和bhb_{h}bh?實(shí)際上就是預(yù)測(cè)出來(lái)的框box的中心坐標(biāo)和寬高睡陪,那么如果預(yù)測(cè)的非常準(zhǔn)確,需要真實(shí)框的gx、gy兰迫、gwg_{x}信殊、g_{y}、g_{w}gx?汁果、gy?涡拘、gw?和ghg_{h}gh?坐標(biāo)應(yīng)當(dāng)為:(gx、gy据德、gwg_{x}鳄乏、g_{y}、g_{w}gx?棘利、gy?橱野、gw?和ghg_{h}gh?實(shí)際上是實(shí)際框的中心坐標(biāo)和寬高)
gx=σ(tx)+cxg_{x}=\sigma(t_{x}) + c_{x}gx?=σ(tx?)+cx?gy=σ(ty)+cyg_{y}=\sigma(t_{y}) + c_{y}gy?=σ(ty?)+cy?gw=awetwg_{w}= a_{w}e^{t_{w}}gw?=aw?etw?gh=ahethg_{h}= a_{h}e^{t_{h}}gh?=ah?eth?
由此可以得到,真實(shí)框的t?x赡译、t?y仲吏、t?w\hat t_{x}、\hat t_{y}蝌焚、\hat t_{w}t^x?、t^y?誓斥、t^w?和t?h\hat t_{h}t^h?
計(jì)算中由于sigmoid函數(shù)的反函數(shù)那計(jì)算只洒,所以并沒(méi)有計(jì)算sigmoid的反函數(shù),而是計(jì)算輸出對(duì)應(yīng)的sigmoid函數(shù)值劳坑。
σ(t?x)=gx?cx\sigma(\hat t_{x}) = g_x - c_{x}σ(t^x?)=gx??cx?σ(t?y)=gy?cy\sigma(\hat t_{y}) = g_y - c_{y}σ(t^y?)=gy??cy?t?w=log(gw/aw)\hat t_{w} = \log(g_{w} / a_{w})t^w?=log(gw?/aw?)t?h=log(gh/ah)\hat t_{h} = \log(g_{h} / a_{h})t^h?=log(gh?/ah?)
這樣毕谴,我們就可以根據(jù)訓(xùn)練的輸出σ(tx)、σ(ty)距芬、tw\sigma(t_{x})涝开、\sigma(t_{y})、t_{w}σ(tx?)框仔、σ(ty?)舀武、tw?和tht_{h}th?以及真實(shí)框的值σ(t?x)、σ(t?y)离斩、t?w\sigma(\hat t_{x})银舱、\sigma(\hat t_{y})、\hat t_{w}σ(t^x?)跛梗、σ(t^y?)寻馏、t^w?和t?h\hat t_{h}t^h?求出誤差了。
還存在一個(gè)很關(guān)鍵的問(wèn)題:在訓(xùn)練中我們挑選哪個(gè)bounding box的準(zhǔn)則是選擇預(yù)測(cè)的box與ground truth box的IOU最大的bounding box做為最優(yōu)的box核偿,但是在預(yù)測(cè)中并沒(méi)有g(shù)round truth box诚欠,怎么才能挑選最優(yōu)的bounding box呢?這就需要另外的參數(shù)了,那就是下面要說(shuō)到的置信度轰绵。
置信度是每個(gè)bounding box輸出的其中一個(gè)重要參數(shù)粉寞,作者對(duì)他的作用定義有兩重:
一重是:代表當(dāng)前box是否有對(duì)象的概率Pr(Object)P_{r}(Object)Pr?(Object),注意藏澳,是對(duì)象仁锯,不是某個(gè)類別的對(duì)象,也就是說(shuō)它用來(lái)說(shuō)明當(dāng)前box內(nèi)只是個(gè)背景(backgroud)還是有某個(gè)物體(對(duì)象)翔悠;
另一重:表示當(dāng)前的box有對(duì)象時(shí)业崖,它自己預(yù)測(cè)的box與物體真實(shí)的box可能的IOUtruthpredIOU_{pred}^{truth}IOUpredtruth?的值,注意蓄愁,這里所說(shuō)的物體真實(shí)的box實(shí)際是不存在的双炕,這只是模型表達(dá)自己框出了物體的自信程度。
以上所述撮抓,也就不難理解作者為什么將其稱之為置信度了妇斤,因?yàn)椴还苣闹睾x,都表示一種自信程度:框出的box內(nèi)確實(shí)有物體的自信程度和框出的box將整個(gè)物體的所有特征都包括進(jìn)來(lái)的自信程度丹拯。經(jīng)過(guò)以上的解釋站超,其實(shí)我們也就可以用數(shù)學(xué)形式表示置信度的定義了:
Cji=Pr(Object)?IOUtruthpredC_{i}^{j} = P_{r}(Object) * IOU_{pred}^{truth}Cij?=Pr?(Object)?IOUpredtruth?
其中,CjiC_{i}^{j}Cij?表示第i個(gè)grid cell的第j個(gè)bounding box的置信度乖酬。
那么如何訓(xùn)練CjiC_{i}^{j}Cij?死相?
訓(xùn)練中,C?ji\hat C_{i}^{j}C^ij?表示真實(shí)值咬像,C?ji\hat C_{i}^{j}C^ij?的取值是由grid cell的bounding box有沒(méi)有負(fù)責(zé)預(yù)測(cè)某個(gè)對(duì)象決定的算撮。如果負(fù)責(zé),那么C?ji=1\hat C_{i}^{j}=1C^ij?=1县昂,否則肮柜,C?ji=0\hat C_{i}^{j}=0C^ij?=0。
下面我們來(lái)說(shuō)明如何確定某個(gè)grid cell的bounding box是否負(fù)責(zé)預(yù)測(cè)該grid cell中的對(duì)象:前面在說(shuō)明anchor box的時(shí)候提到每個(gè)bounding box負(fù)責(zé)預(yù)測(cè)的形狀是依據(jù)與其對(duì)應(yīng)的anchor box(bounding box prior)相關(guān)的倒彰,那這個(gè)anchor box與該對(duì)象的ground truth box的IOU在所有的anchor box(與一個(gè)grid cell中所有bounding box對(duì)應(yīng)审洞,COCO數(shù)據(jù)集中是9個(gè))與ground truth box的IOU中最大,那它就負(fù)責(zé)預(yù)測(cè)這個(gè)對(duì)象狸驳,因?yàn)檫@個(gè)形狀预明、尺寸最符合當(dāng)前這個(gè)對(duì)象,這時(shí)C?ji=1\hat C_{i}^{j}=1C^ij?=1耙箍,其他情況下C?ji=0\hat C_{i}^{j}=0C^ij?=0撰糠。注意,你沒(méi)有看錯(cuò)辩昆,就是所有anchor box與某個(gè)ground truth box的IOU最大的那個(gè)anchor box對(duì)應(yīng)的bounding box負(fù)責(zé)預(yù)測(cè)該對(duì)象阅酪,與該bounding box預(yù)測(cè)的box沒(méi)有關(guān)系。
3. 對(duì)象條件類別概率(conditional class probabilities)
對(duì)象條件類別概率是一組概率的數(shù)組,數(shù)組的長(zhǎng)度為當(dāng)前模型檢測(cè)的類別種類數(shù)量术辐,它的意義是當(dāng)bounding box認(rèn)為當(dāng)前box中有對(duì)象時(shí)砚尽,要檢測(cè)的所有類別中每種類別的概率.
其實(shí)這個(gè)和分類模型最后使用softmax函數(shù)輸出的一組類別概率是類似的,只是二者存在兩點(diǎn)不同:
YOLO的對(duì)象類別概率中沒(méi)有background一項(xiàng)辉词,也不需要必孤,因?yàn)閷?duì)background的預(yù)測(cè)已經(jīng)交給置信度了,所以它的輸出是有條件的瑞躺,那就是在置信度表示當(dāng)前box有對(duì)象的前提下敷搪,所以條件概率的數(shù)學(xué)形式為Pr(classi∣Object)P_{r}(class_{i}|Object)Pr?(classi?∣Object);
分類模型中最后輸出之前使用softmax求出每個(gè)類別的概率,也就是說(shuō)各個(gè)類別之間是互斥的幢哨,而YOLOv3算法的每個(gè)類別概率是單獨(dú)用邏輯回歸函數(shù)(sigmoid函數(shù))計(jì)算得出了赡勘,所以每個(gè)類別不必是互斥的,也就是說(shuō)一個(gè)對(duì)象可以被預(yù)測(cè)出多個(gè)類別捞镰。這個(gè)想法其實(shí)是有一些YOLO9000的意思的闸与,因?yàn)閅OLOv3已經(jīng)有9000類似的功能,不同只是不能像9000一樣岸售,同時(shí)使用分類數(shù)據(jù)集和對(duì)象檢測(cè)數(shù)據(jù)集践樱,且類別之間的詞性是有從屬關(guān)系的。
來(lái)源:https://blog.csdn.net/weixin_43384257/article/details/100974776
侵刪