當(dāng)前基于OCR技術(shù)的產(chǎn)品提供的能力:
- 文字識(shí)別夯秃,格式比較規(guī)整的文本掃描愤惰,比如一段純文本文字包归,名片(一般名片應(yīng)用是對(duì)名片格式模板做了大量適配才會(huì)比較好)锨推;往深的發(fā)展可以識(shí)別圖片或視頻上的文字。
- 圖片內(nèi)容自動(dòng)裁剪公壤,說(shuō)白了就是幫助用戶(hù)把用手機(jī)拍照片的主要內(nèi)容裁剪出來(lái)换可,其輸出還是圖片。
OCR技術(shù)在K12教育的應(yīng)用情況:
- 搜題出答案境钟,本質(zhì)是對(duì)拍照的題進(jìn)行特征識(shí)別锦担,然后從數(shù)據(jù)庫(kù)找到該特征類(lèi)似的題目,其技術(shù)不是簡(jiǎn)單通過(guò)識(shí)別文字然后查找慨削,而是有復(fù)雜算法洞渔。
- 標(biāo)準(zhǔn)模板的紙質(zhì)試卷的自動(dòng)批改,舉例科大訊飛提供一個(gè)服務(wù)缚态,就是按照一定格式制作試卷(各科都可以)磁椒,學(xué)生答題后,用專(zhuān)門(mén)掃描儀掃描試卷就可以統(tǒng)計(jì)成績(jī)玫芦。(本質(zhì)的答題卡的擴(kuò)展)浆熔。
- 文本內(nèi)容識(shí)別+英文語(yǔ)法規(guī)則實(shí)現(xiàn)英文作文的自動(dòng)批改。舉例桥帆,科大訊飛頁(yè)提供該服務(wù)医增。與上一條一樣慎皱,本質(zhì)是要減少老師批改作業(yè)工作量和老師分析學(xué)生成績(jī)的工作量。
- 學(xué)習(xí)筆記叶骨、作業(yè)茫多、試卷的保存與分享,本質(zhì)是通過(guò)OCR減低用戶(hù)保存忽刽、裁剪天揖、分享文件的工作量,比如拍身份證跪帝,拍學(xué)霸的學(xué)習(xí)筆記今膊、拍合同文件等等,只要想保存某些內(nèi)容都可以拍下來(lái)伞剑。(但這應(yīng)該場(chǎng)景本質(zhì)是圖片的加工處理斑唬,不是文字識(shí)別)
K12教育產(chǎn)品可以通過(guò)OCR技術(shù)做什么?初步分析如下:
- 識(shí)別手寫(xiě)打分纸泄。老師作業(yè)批改赖钞,涉及老師在pad給作業(yè)打分,老師可以用手寫(xiě)筆批改和打分聘裁,通過(guò)OCR技術(shù)自己識(shí)別分?jǐn)?shù),而不需要使用數(shù)字鍵盤(pán)輸入分?jǐn)?shù)弓千,讓老師使用過(guò)程比較流暢衡便。(但感覺(jué)這個(gè)功能只能算有價(jià)值,但不是很高價(jià)值)
- 記錄內(nèi)容洋访。拍照裁剪保存學(xué)習(xí)內(nèi)容是學(xué)生常用功能镣陕,所以我們可以在我們產(chǎn)品集成這個(gè)功能,比如學(xué)霸自己把筆記拍攝下來(lái)姻政,然后放到商城讓其他學(xué)校的學(xué)生購(gòu)買(mǎi)呆抑。
- 拍照搜題。該技術(shù)和題目量有一定門(mén)檻汁展,建議找已有方案的公司合作鹊碍。
- 內(nèi)容批量電子化。該技術(shù)與拍照搜題類(lèi)似食绿,都是對(duì)題目?jī)?nèi)容進(jìn)行拍照侈咕,拍照搜題在于根據(jù)拍攝的內(nèi)容特征到數(shù)據(jù)庫(kù)找題目,而內(nèi)容電子化是把大的內(nèi)容片段切分成小片段器紧,然后再通過(guò)文本識(shí)別技術(shù)和一定題目格式識(shí)別耀销,把小片段內(nèi)容電子化,最終實(shí)現(xiàn)紙質(zhì)內(nèi)容電子化铲汪。 這個(gè)技術(shù)也有比較大的難度熊尉,實(shí)現(xiàn)起來(lái)不簡(jiǎn)單罐柳。