有了 iText侣签,你截圖啊鸭,騰訊、Google OCR 幫你識別文字

比如硬耍,在看類似上面的掃描版 PDF 時垄琐,想要復(fù)制其中的文字,怎么辦经柴?手打狸窘?太累。試試我新開發(fā)的工具 iText 吧坯认。

iText 是 macOS 平臺的 OCR 工具翻擒,自帶截圖功能,選擇屏幕任意區(qū)域牛哺,即可識別其中的文字陋气,又爽又酷。

識別后的文字已經(jīng)復(fù)制到系統(tǒng)剪貼板引润,直接粘貼即可恩伺。

配合 ??1 快捷鍵,使用體驗更佳椰拒。當(dāng)然,你也可以選擇圖片文件凰荚,或者將圖片拖拽至 iText 的菜單欄圖標(biāo)進(jìn)行識別燃观。

文字識別精準(zhǔn)

你有沒有這種印象:OCR 識別出來的文字有很多問題,還不如自己打字來得快便瑟±禄伲可見,識別的準(zhǔn)確性非常重要到涂,也是我非常在意的一點脊框。

騰訊、Google 雙引擎

首先践啄,我排除了離線的識別庫浇雹,因為離線注定了這些庫的識別能力是死的,不會自己增強屿讽。接下來昭灵,在一票在線 OCR 服務(wù)中,我對比了百度、騰訊烂完、微軟试疙、Google 等大廠的產(chǎn)品,最后選擇了國內(nèi)使用騰訊抠蚣、國外使用 Google 的組合祝旷。判斷依據(jù)是什么?少量測試 + 主觀傾向嘶窄,比如不測我就覺得 Google 比微軟牛怀跛。

那么,到底識別準(zhǔn)不準(zhǔn)呢护侮?這么說吧:

  • 對于一般的自然語言敌完,比如書中的一段話、新聞稿羊初,識別效果是驚人的準(zhǔn)確滨溉,甚至可以達(dá)到 100%
  • 對于排版復(fù)雜、尤其有特殊字符的文字长赞,比如程序代碼晦攒、選擇題,識別效果就不太理想得哆,需要手動對識別后的結(jié)果進(jìn)行修正
    • 比如脯颜,單純地給一個豎線,機器是無法區(qū)分到底是小寫的 l贩据、還是大寫的 I(順便問一下栋操,你看出二者的區(qū)別了嗎?)饱亮;與之相對矾芙,機器是需要根據(jù)上下文進(jìn)行判斷和優(yōu)化的。而像程序代碼這種非自然語言近上,機器目前是很難進(jìn)行語義識別的

到底準(zhǔn)不準(zhǔn)剔宪?你不妨一試。

獨創(chuàng)算法壹无,進(jìn)一步優(yōu)化識別結(jié)果

OCR 服務(wù)還有一些欠缺葱绒,iText 針對性地做了這些優(yōu)化:

  • 自動識別段落
  • 中文環(huán)境使用全角標(biāo)點符號
  • 中文與英文字母、數(shù)字間增加空格
  • 刪除中文字符間斗锭、英文字符與標(biāo)點符號間的多余空格
  • 英文首字母大寫

如果你發(fā)現(xiàn)識別不好的地方地淀,歡迎把圖發(fā)給我,我會相應(yīng)地優(yōu)化算法岖是,畢竟算法是需要數(shù)據(jù)喂養(yǎng)的骚秦,先謝她倘。

預(yù)覽原圖,方便校對

在目前 OCR 技術(shù)不能始終達(dá)到 100% 的情況下作箍,預(yù)覽原圖硬梁、并進(jìn)行修正,還是有必要的胞得。在 iText 中荧止,你可以這樣:

  • 將識別后的窗口拖到圖片附近
  • 調(diào)用 iText 識別結(jié)果的 雙欄模式:左側(cè)展示圖片、右側(cè)展示識別后的文字

這樣阶剑,就可以很方便地對照原圖進(jìn)行手動優(yōu)化識別后的文字跃巡。

下載與付費

其實,很多場景都會用到 iText牧愁,比如 識別快遞單上的號碼素邪、圖片中的聯(lián)系人信息、需要登錄才能復(fù)制的網(wǎng)頁 等等猪半,歡迎 下載 iText 試試兔朦。

每月可免費識別 20 次,訂閱 iText 高級版即可無限次識別磨确。首發(fā)期間沽甥,高級版限時 6 折優(yōu)惠:¥3/月、¥30/年乏奥。關(guān)于收費模式摆舟,我很是糾結(jié)了一番。如果你準(zhǔn)備吐槽邓了,請先看下這篇文章再次糾結(jié)付費模式恨诱,這次是 iText

如果你覺得 iText 還不錯,還請幫忙 在 App Store 評論骗炉;如果你覺得 iText 還可以改進(jìn)照宝,歡迎:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市痕鳍,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌龙巨,老刑警劉巖笼呆,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異旨别,居然都是意外死亡诗赌,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進(jìn)店門秸弛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來铭若,“玉大人洪碳,你說我怎么就攤上這事〉鹜溃” “怎么了瞳腌?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長镜雨。 經(jīng)常有香客問我嫂侍,道長,這世上最難降的妖魔是什么荚坞? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任挑宠,我火速辦了婚禮,結(jié)果婚禮上颓影,老公的妹妹穿的比我還像新娘各淀。我一直安慰自己,他們只是感情好诡挂,可當(dāng)我...
    茶點故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布碎浇。 她就那樣靜靜地躺著,像睡著了一般咆畏。 火紅的嫁衣襯著肌膚如雪南捂。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天旧找,我揣著相機與錄音溺健,去河邊找鬼。 笑死钮蛛,一個胖子當(dāng)著我的面吹牛鞭缭,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播魏颓,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼岭辣,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了甸饱?” 一聲冷哼從身側(cè)響起沦童,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎叹话,沒想到半個月后偷遗,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡驼壶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年氏豌,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片热凹。...
    茶點故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡泵喘,死狀恐怖泪电,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情纪铺,我是刑警寧澤相速,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站霹陡,受9級特大地震影響和蚪,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜烹棉,卻給世界環(huán)境...
    茶點故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一攒霹、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧浆洗,春花似錦催束、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至摘昌,卻和暖如春速妖,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背聪黎。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工罕容, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人稿饰。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓锦秒,卻偏偏與公主長得像,于是被迫代替她去往敵國和親喉镰。 傳聞我的和親對象是個殘疾皇子旅择,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,077評論 2 355