最近問答類APP很火,例如沖頂大會(huì)
百萬英雄
芝士超人
等
網(wǎng)上的各種搜題輔助程序也很多, 作為程序員,當(dāng)然也湊波熱鬧自己搞了一個(gè).
環(huán)境 Python3
+ google OCR
其中圖片的截取利用了macOS + iOS
的配合
采用的大致原理是手機(jī)連上Mac
,通過自帶的QuickTime
實(shí)時(shí)顯示手機(jī)屏幕,具體做法
可以百度怎么用 Quick Time Player 為 iPhone 錄制屏幕
這個(gè)搜題輔助其實(shí)可以用在任意答題類APP上,調(diào)整截圖坐標(biāo)是識(shí)別的關(guān)鍵
步驟如下
brew install tesseract
- 下載中文語言識(shí)別包
- 找到語言包
chi_sim.traineddata
- 下載下來后放到,這里是
Mac
上的路徑
/usr/local/Cellar/tesseract/3.05.01/share/tessdata/
- 安裝python依賴庫
pip3 install -r requirements.txt
- 自行修改代碼中的屏幕截圖區(qū)域Frame
#由于每個(gè)人屏幕尺寸不同需要自行修改截圖Frame "x, y, w, h "
#沖頂大會(huì)截圖坐標(biāo)
cddh_ques_loca = "70, 150, 310, 120"
cddh_answer_one_loca = "100, 275, 270, 35"
cddh_answer_two_loca = "100, 330, 270, 35"
cddh_answer_thr_loca = "100, 376, 270, 35"
- 運(yùn)行程序
python3 KnMoney.py
識(shí)別效果
- OCR畢竟比不上接口直接拿數(shù)據(jù),會(huì)存在一定誤差,發(fā)現(xiàn)識(shí)別不準(zhǔn)是可以自行調(diào)節(jié)圖像處理參數(shù)
#處理圖像
enh_con = ImageEnhance.Contrast(image)
#對(duì)比度,銳度,亮度
contrast = 2.0
sharpness = 5.0
brightness = 5.0
- 這是截圖后識(shí)別成文字的效果
image.png
- 這是丟進(jìn)百度搜索的效果
image.png
感謝
- 部分代碼出自TopSup