核心思想
提出單字分割以及單字間分割的方法泄伪,類似分割版本的seglink
提出如何利用char level合成數(shù)據(jù)得到真實(shí)數(shù)據(jù)的char box 標(biāo)注的弱監(jiān)督方法
標(biāo)簽構(gòu)造
char box以及box間的region
使用高斯map摔癣,為提高速度牍汹,使用一個(gè)正常的gaussian map(方的) 馅而,計(jì)算其與char box之間的仿射變換绒窑,然后直接得到標(biāo)注的gaussian map.
模型結(jié)構(gòu)
vgg_bn
采樣至原圖1/2
word標(biāo)注生成char標(biāo)注
- 弱監(jiān)督學(xué)習(xí)過程
- 如何得到切分好的char-box
后處理
- 通過閾值篩選字符文本區(qū)域與字符間區(qū)域士聪,然后通過通過閾值篩選字符文本區(qū)域與字符間區(qū)域某饰,然后通過opencv 中連通方法得當(dāng)外界輪廓
數(shù)據(jù)處理
- 正常的CROP, rotated, 隨機(jī)尺度變換等
思考
方法依賴字符級(jí)別的標(biāo)注
后處理依賴字符的分割以及字符間區(qū)域的分割。因此對(duì)于較大間隔文本的間隔無法準(zhǔn)確分割剃袍,容易完成斷裂
后處理依賴逐像素操作黄刚,因此速度較慢