Yolov3:訓(xùn)練自己的模型 Part1:準(zhǔn)備數(shù)據(jù)集

關(guān)于yolov3在ubuntu18下的配置订讼,我的上一篇文章有介紹,本篇文章介紹如何構(gòu)建用于yolov3訓(xùn)練的數(shù)據(jù)集诬辈。

數(shù)據(jù)集獲取

數(shù)據(jù)集的獲取可以依靠下載公開數(shù)據(jù)集或標(biāo)注自己的數(shù)據(jù)集颓哮。一般來說常摧,公開數(shù)據(jù)集很難滿足我們實(shí)際的生產(chǎn)需求磕洪,因此大多數(shù)情況下需要我們自己標(biāo)注數(shù)據(jù)集吭练。一般使用labelImg用于目標(biāo)檢測的標(biāo)注,標(biāo)注完成后會(huì)生成與所標(biāo)注圖片同名的xml文件析显。

labelImg在win上的配置

1鲫咽、下載源碼https://github.com/tzutalin/labelImg

2、安裝python3.5(據(jù)說用py3.6會(huì)報(bào)錯(cuò)谷异,經(jīng)測試在py3.7下可成功配置)

3分尸、安裝PyQt5:

pip install PyQt5

(如果下載很慢可以換pip源)

4、安裝PyQt5_tools:

pip install pyqt5-tools

5歹嘹、安裝lxml:

pip install lxml

6箩绍、進(jìn)入labelImg解壓后的文件,執(zhí)行命令

pyrcc5 -o resources.py resources.qrc

(用于將Qt文件格式轉(zhuǎn)換為python格式)

7尺上、運(yùn)行l(wèi)abelImg.py

如果出現(xiàn) No module named ‘libs.resources’ 的報(bào)錯(cuò)

No module named ‘libs.resources’?

將resources.py拖進(jìn)libs文件夾即可

labelImg的使用

1伶选、打開需要標(biāo)注的圖片所在目錄

2、data文件夾下的predefined_classes.txt文件存儲(chǔ)了標(biāo)簽尖昏,將這個(gè)文件內(nèi)的標(biāo)簽修改為自己需要的仰税。例如:

3、根據(jù)需要更改或不更改標(biāo)注文件的存儲(chǔ)位置

4抽诉、需要注意的是陨簇,盡管用于yolo訓(xùn)練的標(biāo)注文件最終需要的是txt格式,但在制作數(shù)據(jù)集階段我們?nèi)孕柚谱鞒蒝OC格式(標(biāo)注文件為xml文件)迹淌,因此在標(biāo)注前需檢查保存的格式是否為VOC格式河绽。

5、按快捷鍵w對圖片進(jìn)行標(biāo)注唉窃,選擇標(biāo)簽耙饰,所有目標(biāo)標(biāo)注完成后保存,即可得到對應(yīng)的xml文件纹份。

6苟跪、xml文件的示例如下圖

xml文件示例


<annotation>

? ? <folder></folder>? ? ? ? //文件夾? ? ? ? ? ? ? ? ? ? ? ? ? ?

<filename></filename>? //文件名?

<path></path>? ? ? ? ? //文件路徑

? ? <source>? ? ? ? ? ? ? ? //圖像來源(不重要)?

? ? ? ? <database>Unknown </database>?

? ? </source>?

? ? <size>? ? ? ? ? ? ? ? ? ? //圖像尺寸(長寬、通道數(shù))? ? ? ? ? ? ? ? ? ? ? ?

? ? ? ? <width>1920</width>?

? ? ? ? <height>810</height>?

? ? ? ? <depth>3</depth>?

? ? </size>?

? ? <segmented>0</segmented>? ? ? ? ? ? //是否用于分割(在目標(biāo)識別中01無所謂)?

? ? <object>? ? ? ? ? ? ? ? ? ? ? ? ? ? ? //檢測到的物體?

? ? ? ? <name>car</name>? ? ? ? ? ? ? ? ? ? ? //物體類別?

? ? ? ? <pose>Unspecified</pose>? ? ? ? ? ? ? ? //拍攝角度?

? ? ? ? <truncated>0</truncated>? ? ? ? ? ? ? ? ? //是否被截?cái)啵?表示完整)?

? ? ? ? <difficult>0</difficult>? ? ? ? ? ? ? ? ? ? ? //目標(biāo)是否難以識別(0表示容易識別)?

? ? ? ? <bndbox>? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? //bounding-box(包含左下角和右上角xy坐標(biāo))?

? ? ? ? ? ? <xmin>465</xmin>?

? ? ? ? ? ? <ymin>410</ymin>?

? ? ? ? ? ? <xmax>784</xmax>?

? ? ? ? ? ? <ymax>651</ymax>?

? ? ? ? </bndbox>?

? ? </object>?

? ? <object>? ? ? ? ? ? ? //包含多個(gè)目標(biāo)?

? ? ? ? ??

? ? </object>?

</annotation>


可能會(huì)用到的快捷鍵

Ctrl+u 加載目錄中所有圖像

Ctrl+s 保存

Ctrl+r 更改標(biāo)注文件保存地址

Ctrl+d 復(fù)制當(dāng)前標(biāo)簽和矩形框

space 將當(dāng)前圖片標(biāo)記為已驗(yàn)證

w 創(chuàng)建一個(gè)矩形框

d 下一張圖片

a 上一張圖片

del 刪除選定的矩形框


數(shù)據(jù)準(zhǔn)備

需要將我們在上一步中準(zhǔn)備的數(shù)據(jù)集整理成VOC格式蔓涧,也就是將圖片全部存放在JPEGImages下件已,將標(biāo)注文件全部存放在Annotations下,ImageSets/Main文件夾先空著元暴。

VOC格式

--VOCdevkit

??--VOC2007??#2007可以為任意年份(也可以沒有篷扩,事實(shí)上文件夾也可以不叫這些名字)

??? --Annotations? #存儲(chǔ)xml文件

??? --ImageSets??

????? --Main?????#存儲(chǔ)訓(xùn)練集/驗(yàn)證集/測試集的txt

??? --JPEGImages?#存儲(chǔ)圖片


VOC格式數(shù)據(jù)集文件夾結(jié)構(gòu)

至此就完成了數(shù)據(jù)集的準(zhǔn)備,part2會(huì)介紹訓(xùn)練的流程茉盏、參數(shù)設(shè)置等鉴未。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末枢冤,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子铜秆,更是在濱河造成了極大的恐慌淹真,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,639評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件羽峰,死亡現(xiàn)場離奇詭異趟咆,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)梅屉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,277評論 3 385
  • 文/潘曉璐 我一進(jìn)店門值纱,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人坯汤,你說我怎么就攤上這事虐唠。” “怎么了惰聂?”我有些...
    開封第一講書人閱讀 157,221評論 0 348
  • 文/不壞的土叔 我叫張陵疆偿,是天一觀的道長。 經(jīng)常有香客問我搓幌,道長杆故,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,474評論 1 283
  • 正文 為了忘掉前任溉愁,我火速辦了婚禮处铛,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘拐揭。我一直安慰自己撤蟆,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,570評論 6 386
  • 文/花漫 我一把揭開白布堂污。 她就那樣靜靜地躺著家肯,像睡著了一般。 火紅的嫁衣襯著肌膚如雪盟猖。 梳的紋絲不亂的頭發(fā)上讨衣,一...
    開封第一講書人閱讀 49,816評論 1 290
  • 那天,我揣著相機(jī)與錄音扒披,去河邊找鬼值依。 笑死,一個(gè)胖子當(dāng)著我的面吹牛碟案,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播颇蜡,決...
    沈念sama閱讀 38,957評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼价说,長吁一口氣:“原來是場噩夢啊……” “哼辆亏!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起鳖目,我...
    開封第一講書人閱讀 37,718評論 0 266
  • 序言:老撾萬榮一對情侶失蹤扮叨,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后领迈,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體彻磁,經(jīng)...
    沈念sama閱讀 44,176評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,511評論 2 327
  • 正文 我和宋清朗相戀三年狸捅,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了衷蜓。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,646評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡尘喝,死狀恐怖磁浇,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情朽褪,我是刑警寧澤置吓,帶...
    沈念sama閱讀 34,322評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站缔赠,受9級特大地震影響衍锚,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜嗤堰,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,934評論 3 313
  • 文/蒙蒙 一戴质、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧梁棠,春花似錦置森、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,755評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至男娄,卻和暖如春行贪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背模闲。 一陣腳步聲響...
    開封第一講書人閱讀 31,987評論 1 266
  • 我被黑心中介騙來泰國打工建瘫, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人尸折。 一個(gè)月前我還...
    沈念sama閱讀 46,358評論 2 360
  • 正文 我出身青樓啰脚,卻偏偏與公主長得像,于是被迫代替她去往敵國和親实夹。 傳聞我的和親對象是個(gè)殘疾皇子橄浓,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,514評論 2 348