Scene Text Detection via Holistic, Multi-Channel(翻譯)

摘要

? ? ? ?近年來,場(chǎng)景文本檢測(cè)因其具有的重要意義和巨大挑戰(zhàn)性,已經(jīng)成為計(jì)算機(jī)視覺領(lǐng)域和文檔分析領(lǐng)域中一個(gè)活躍的研究課題。然而,絕大多數(shù)的現(xiàn)有方法都是在本地區(qū)域內(nèi)通過候選聚合和假正消除的方式提取字符襟交、字詞或行級(jí)候選詞進(jìn)行文本檢測(cè),這就可能潛在的排除了場(chǎng)景中較廣范圍和較長(zhǎng)距離的上下文線索產(chǎn)生的影響迈倍。而為了充分利用整個(gè)自然圖像中豐富的信息,我們則建議將場(chǎng)景文本檢測(cè)作為語義分割問題,以整體的方方式來進(jìn)行文本定位。該算法直接運(yùn)行在完整的圖像上,并生成全局的單像素預(yù)測(cè)圖,檢測(cè)結(jié)果也隨后形成捣域。為了更好地利用文本屬性,我們將利利用一個(gè)單獨(dú)的全卷積網(wǎng)絡(luò)(FCN)模型對(duì)文本區(qū)域啼染、單個(gè)字符及其關(guān)系等三種類型的信息進(jìn)行估算。通過對(duì)文本屬性的預(yù)測(cè),本文提出的算法可以處理現(xiàn)實(shí)世界的自然圖像,例如水平文本焕梅、多方向文本和彎曲文本迹鹅。就對(duì)基準(zhǔn)進(jìn)行的實(shí)驗(yàn)而言,包括CDAR2013 、CDAR2015 和MSRA-TD500,都已表明,該算法在很大大程度上優(yōu)于先前的技術(shù)方方法贞言。此外,我們?cè)谧罱l(fā)布的大規(guī)模數(shù)據(jù)集coco - text上發(fā)布了了第一個(gè)基準(zhǔn)結(jié)果斜棚。

關(guān)鍵詞: —場(chǎng)景文本檢測(cè),全卷積網(wǎng)網(wǎng)絡(luò),整體預(yù)測(cè),自然圖像。

I.介紹

? ? ?自然場(chǎng)景中的文本信息在各種現(xiàn)實(shí)世界的應(yīng)用中都極具有價(jià)值且非常有益,例如圖像搜索该窗、人人機(jī)交互弟蚀、刑事調(diào)查[1]和向盲人提供幫助[57]。在過去幾年里,場(chǎng)景文本的檢測(cè)和識(shí)別得到了計(jì)算機(jī)視覺領(lǐng)域和文檔分析領(lǐng)域人員的廣泛關(guān)注,同時(shí)也激發(fā)他們提出了許多鼓舞人心的靈感來解決以上這些問題挪捕。然而在不可控的環(huán)境中(例如野外),本地化和閱讀文本的實(shí)現(xiàn)仍然是極具挑戰(zhàn)性的粗梭。原因眾多,如文本外觀争便、布局级零、字體、語言滞乙、風(fēng)格等問題,以及背景雜波奏纪、噪聲、模糊斩启、遮擋序调、不均勻光照等情況。本文重點(diǎn)討論了場(chǎng)景文本檢測(cè)存在的問題,旨在預(yù)測(cè)文本檢測(cè)的呈現(xiàn)技術(shù),并對(duì)每個(gè)實(shí)例的地位和延伸范圍進(jìn)行估算兔簇。

? ? ? 以前的方法主要是在局部地區(qū)內(nèi)使用滑動(dòng)窗口或連接組建提取技術(shù)发绢,找尋文本實(shí)例(字符、文字或文本行)垄琐。新算法則為這一領(lǐng)域的發(fā)展提供了了許多新的想法,同時(shí)不斷地推進(jìn)著現(xiàn)今最新的工藝水平边酒。然而,大多數(shù)現(xiàn)有的算法只能在一定區(qū)域內(nèi)找尋文本(至高到文本行級(jí)別), 如果范圍擴(kuò)大,就幾乎無法辦到,而這對(duì)處理具有挑戰(zhàn)性的狀況卻是至關(guān)重要的。因此,舊有的算法會(huì)陷入捕捉弱文本實(shí)例和抑制誤報(bào)的境況中而無法脫身狸窘。

此外,幾乎此前所有的方法都集中在檢測(cè)水平或接近水平文本,卻忽略了非水平性的問題墩朦。在很大程度上限制了方法的實(shí)用性和適應(yīng)性,究其原因是關(guān)乎現(xiàn)場(chǎng)的一些至關(guān)重要的信息或許就體現(xiàn)在這種非水平文本上。

我們?cè)谶@項(xiàng)工作中提出了一種新算法,將文本檢測(cè)看作為語義分割問題[43]翻擒。該算法執(zhí)行整體氓涣、逐像素的估算,并生成密集的特征圖, 其中場(chǎng)景文本的屬性是隱含的,如圖1所示牛哺。然而,因?yàn)槎鄠€(gè)文本實(shí)例相似而難以拆分單個(gè)字符(?圖2),簡(jiǎn)單的二級(jí)語義分割(文本和非文本)不能夠完全完成場(chǎng)景文本檢測(cè)。因此,除了文本區(qū)域位置,我們同時(shí)將單個(gè)字符及其連接方向附近字符的中心和規(guī)睦头停考慮了進(jìn)去,最終解決了這一問題引润。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市痒玩,隨后出現(xiàn)的幾起案子椰拒,更是在濱河造成了極大的恐慌,老刑警劉巖凰荚,帶你破解...
    沈念sama閱讀 211,290評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件燃观,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡便瑟,警方通過查閱死者的電腦和手機(jī)缆毁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來到涂,“玉大人脊框,你說我怎么就攤上這事〖模” “怎么了浇雹?”我有些...
    開封第一講書人閱讀 156,872評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)屿讽。 經(jīng)常有香客問我昭灵,道長(zhǎng),這世上最難降的妖魔是什么伐谈? 我笑而不...
    開封第一講書人閱讀 56,415評(píng)論 1 283
  • 正文 為了忘掉前任烂完,我火速辦了婚禮,結(jié)果婚禮上诵棵,老公的妹妹穿的比我還像新娘抠蚣。我一直安慰自己,他們只是感情好履澳,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,453評(píng)論 6 385
  • 文/花漫 我一把揭開白布嘶窄。 她就那樣靜靜地躺著,像睡著了一般距贷。 火紅的嫁衣襯著肌膚如雪柄冲。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,784評(píng)論 1 290
  • 那天储耐,我揣著相機(jī)與錄音羊初,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛长赞,可吹牛的內(nèi)容都是我干的晦攒。 我是一名探鬼主播,決...
    沈念sama閱讀 38,927評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼得哆,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼脯颜!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起贩据,我...
    開封第一講書人閱讀 37,691評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤栋操,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后饱亮,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體矾芙,經(jīng)...
    沈念sama閱讀 44,137評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,472評(píng)論 2 326
  • 正文 我和宋清朗相戀三年近上,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了剔宪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,622評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡壹无,死狀恐怖葱绒,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情斗锭,我是刑警寧澤地淀,帶...
    沈念sama閱讀 34,289評(píng)論 4 329
  • 正文 年R本政府宣布,位于F島的核電站岖是,受9級(jí)特大地震影響帮毁,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜璧微,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,887評(píng)論 3 312
  • 文/蒙蒙 一作箍、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧前硫,春花似錦、人聲如沸荧止。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽跃巡。三九已至危号,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間素邪,已是汗流浹背外莲。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留趾诗,地道東北人婴洼。 一個(gè)月前我還...
    沈念sama閱讀 46,316評(píng)論 2 360
  • 正文 我出身青樓携栋,卻偏偏與公主長(zhǎng)得像甸昏,于是被迫代替她去往敵國(guó)和親却舀。 傳聞我的和親對(duì)象是個(gè)殘疾皇子邀泉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,490評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容