Java基于opencv實(shí)現(xiàn)圖像數(shù)字識(shí)別(二)—基本流程

Java基于opencv實(shí)現(xiàn)圖像數(shù)字識(shí)別(二)—基本流程

做一個(gè)項(xiàng)目之前呢狱杰,我們應(yīng)該有一個(gè)總體把握瘦材,或者是進(jìn)度條;來(lái)一步步的督促著我們來(lái)完成這個(gè)項(xiàng)目仿畸,在我們正式開(kāi)始前呢食棕,我們先討論下流程。

我做的主要是表格中數(shù)字的識(shí)別错沽,但這個(gè)不是重點(diǎn)簿晓。重點(diǎn)是通過(guò)這個(gè)我們可以舉一反三,來(lái)實(shí)現(xiàn)我們自己的業(yè)務(wù)甥捺。

圖像的識(shí)別主要分為兩步:圖片預(yù)處理和圖像識(shí)別抢蚀;這兩步都很重要

圖像預(yù)處理:
1、 圖像灰度化镰禾;二值化
2、 圖像降噪吴侦,去除干擾線
3屋休、 圖像腐蝕、膨脹處理
4备韧、 字符分割
5劫樟、 字符歸一化

圖像識(shí)別:
1、 特征值提取
2、 訓(xùn)練
3叠艳、 測(cè)試

灰度化:

在RGB模型中奶陈,如果R=G=B時(shí),則彩色表示灰度顏色附较,其中R=G=B的值叫灰度值吃粒;因此,灰度圖像每個(gè)像素點(diǎn)只需一個(gè)字節(jié)存放灰度值(又稱強(qiáng)度值拒课、亮度值)徐勃,灰度范圍為0-255。一般常用的是加權(quán)平均法來(lái)求像素點(diǎn)的灰度值

常見(jiàn)的加權(quán)方法如下:
1:)Gray = B ; Gray = G ; Gray = R
2:)Gray = max({B , G , R})
3:)Gray = (B + G + R) / 3
4:)Gray = 0.072169 * B + 0.715160 * G + 0.212671 * R
5:)Gray = 0.11 * B + 0.59 * G + 0.3 * R

這幾種方法中早像,第一為分量法僻肖,即用RGB三個(gè)分量的某一個(gè)分量作為該點(diǎn)的灰度值;第二種方法為最大值法卢鹦,將彩色圖像中的三個(gè)分量亮度的最大值作為灰度圖的灰度值臀脏;第三種方法是將彩色圖像中的三分量求平均得到一個(gè)灰度圖;后兩種都屬于加權(quán)平均法法挨,其中第四種是opencv開(kāi)發(fā)庫(kù)所采用的一種求灰度值算法谁榜;第五種為從人體生理學(xué)角度所提出的一種求灰度值算法(人眼對(duì)綠色的敏感最高,對(duì)藍(lán)色敏感最低)

二值化:

圖像的二值化凡纳,就是將圖像上的像素點(diǎn)的灰度值設(shè)置位0或255這兩個(gè)極點(diǎn)窃植,也就是將整個(gè)圖像呈現(xiàn)出明顯的只有黑和白的視覺(jué)效果

圖像降噪:

就是處理掉一些干擾因素;

主要的降噪算法

濾波類:通過(guò)設(shè)計(jì)濾波器對(duì)圖像進(jìn)行處理荐糜。特點(diǎn)是速度往往比較快巷怜,很多卷積濾波可以借助快速傅里葉變化來(lái)加速

稀疏表達(dá)類:自然圖片之所以看起來(lái)不同于隨機(jī)噪音/人造結(jié)構(gòu),是因?yàn)榇蠹野l(fā)現(xiàn)他們總會(huì)在某一個(gè)橫型下存在稀疏表達(dá)暴氏。而我們想排除的噪音往往無(wú)法被稀疏化延塑。基于這個(gè)判別式模型答渔,用稀疏性來(lái)約束自然圖像关带,在很多逆問(wèn)題里取得了拔群的效果

外部先驗(yàn):如果從有噪音的圖片本身無(wú)法找到規(guī)律,我們也可以借助其他類似但又沒(méi)有噪音的圖片沼撕,來(lái)總結(jié)圖片具有的固有屬性宋雏。這一類方法利用的外部圖片來(lái)創(chuàng)造先驗(yàn)條件,然后用于約束需要預(yù)測(cè)的圖片务豺。最有代表性就是混合高斯模型

聚類低秩:除了可稀疏性磨总,低秩性也是自然圖片常見(jiàn)的一個(gè)特性。數(shù)學(xué)上笼沥,可稀疏表達(dá)的數(shù)據(jù)可以被認(rèn)為是在Union of low-dimensional subspaces蚪燕;而低秩數(shù)據(jù)則是直接存在于一個(gè)Low-dimensional subspace娶牌。這個(gè)更嚴(yán)格的限制往往也可以取得很好的降噪效果。

深度學(xué)習(xí)(Deep Learning):這類可以歸于外部先驗(yàn)的子類馆纳,如果說(shuō)解決逆問(wèn)題的關(guān)鍵诗良,是尋找一個(gè)好的圖像約束器,那么我們?yōu)槭裁床挥靡粋€(gè)最好的約束器厕诡?深度學(xué)習(xí)方法的精髓累榜,就在于通過(guò)大量的數(shù)據(jù),學(xué)習(xí)得到一個(gè)高復(fù)雜度(多層網(wǎng)絡(luò)結(jié)構(gòu))的圖片約束器灵嫌,從而將學(xué)習(xí)外部先驗(yàn)條件這一途徑推到極限。近期的很多這類工作葛作,都是沿著這一思路寿羞,取得了非常逆天的效果。

字符分割:就是把圖片有用的部分一個(gè)個(gè)分割下來(lái);字符分割有很多方法赂蠢,但并不是每一種方法都是萬(wàn)能的绪穆,我們需要根據(jù)自己的業(yè)務(wù)來(lái)調(diào)整;常見(jiàn)的就是投影法和連通域法

投影法:就是分析每一維上黑色像素點(diǎn)的個(gè)數(shù)(假設(shè)是二值化的圖像)虱岂,然后設(shè)置一個(gè)闕值玖院,根據(jù)這個(gè)闕值來(lái)分割圖片

圖像腐蝕、膨脹處理

腐蝕:圖像的一部分區(qū)域與指定的核進(jìn)行卷積第岖,求核的最小值并賦值給指定區(qū)域难菌。 腐蝕可以理解為圖像中高亮區(qū)域的領(lǐng)域縮小。

膨脹:圖像的一部分區(qū)域與指定的核進(jìn)行卷積蔑滓,求核的最大值并賦值給指定區(qū)域郊酒。 膨脹可以理解為圖像中高亮區(qū)域的領(lǐng)域擴(kuò)大。

字符的歸一化:

就是將分割好的圖像內(nèi)的字符歸一化到一個(gè)標(biāo)準(zhǔn)模板大屑ぁ燎窘;歸一化的理想結(jié)果就是:歸一化到標(biāo)準(zhǔn)模板大小蹄咖;傾斜校正褐健;筆畫(huà)寬度歸一化;字形歸一化澜汤。

注:
本文章參考了很多博客蚜迅,感謝;主要是跟著一個(gè)博客來(lái)實(shí)現(xiàn)的https://blog.csdn.net/ysc6688/article/category/2913009(也是基于opencv來(lái)做的银亲,只不過(guò)他是用c++實(shí)現(xiàn)的)感謝

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末慢叨,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子务蝠,更是在濱河造成了極大的恐慌拍谐,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,627評(píng)論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異轩拨,居然都是意外死亡践瓷,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,180評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)亡蓉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)晕翠,“玉大人,你說(shuō)我怎么就攤上這事砍濒×苌觯” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 169,346評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵爸邢,是天一觀的道長(zhǎng)樊卓。 經(jīng)常有香客問(wèn)我,道長(zhǎng)杠河,這世上最難降的妖魔是什么碌尔? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,097評(píng)論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮券敌,結(jié)果婚禮上唾戚,老公的妹妹穿的比我還像新娘。我一直安慰自己待诅,他們只是感情好叹坦,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,100評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著咱士,像睡著了一般立由。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上序厉,一...
    開(kāi)封第一講書(shū)人閱讀 52,696評(píng)論 1 312
  • 那天锐膜,我揣著相機(jī)與錄音,去河邊找鬼弛房。 笑死道盏,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的文捶。 我是一名探鬼主播荷逞,決...
    沈念sama閱讀 41,165評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼粹排!你這毒婦竟也來(lái)了种远?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 40,108評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤顽耳,失蹤者是張志新(化名)和其女友劉穎坠敷,沒(méi)想到半個(gè)月后妙同,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,646評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡膝迎,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,709評(píng)論 3 342
  • 正文 我和宋清朗相戀三年粥帚,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片限次。...
    茶點(diǎn)故事閱讀 40,861評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡芒涡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出卖漫,到底是詐尸還是另有隱情费尽,我是刑警寧澤,帶...
    沈念sama閱讀 36,527評(píng)論 5 351
  • 正文 年R本政府宣布懊亡,位于F島的核電站依啰,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏店枣。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,196評(píng)論 3 336
  • 文/蒙蒙 一叹誉、第九天 我趴在偏房一處隱蔽的房頂上張望鸯两。 院中可真熱鬧,春花似錦长豁、人聲如沸钧唐。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,698評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)钝侠。三九已至,卻和暖如春酸舍,著一層夾襖步出監(jiān)牢的瞬間帅韧,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,804評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工啃勉, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留忽舟,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 49,287評(píng)論 3 379
  • 正文 我出身青樓淮阐,卻偏偏與公主長(zhǎng)得像叮阅,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子泣特,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,860評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容