一、場(chǎng)景
現(xiàn)在上班孔庭,健康碼尺上、行程卡以及核酸采樣記錄缺一不可;阿里云之類(lèi)的云平臺(tái)也提供了健康碼圆到、行程卡的ocr識(shí)別API怎抛;
這里簡(jiǎn)單介紹一下我怎么入坑百度飛槳PaddleOCR~(瞎搞搞,路子野)
二芽淡、PaddleOCR環(huán)境安裝
推薦大家看官方文檔马绝,畢竟版本會(huì)一直更新,這里只是簡(jiǎn)單整理一下~點(diǎn)擊傳送
1. 安裝Anaconda
- 地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D
- 大部分win10電腦均為64位操作系統(tǒng)挣菲,選擇x86_64版本富稻;若電腦為32位操作系統(tǒng),則選擇x86.exe
-
勾選conda加入環(huán)境變量
2. 打開(kāi)Anaconda終端并創(chuàng)建conda環(huán)境
-
打開(kāi)終端
- 創(chuàng)建1個(gè)名為paddle_env白胀、python版本為3.8的可執(zhí)行環(huán)境
# 在命令行輸入以下命令椭赋,創(chuàng)建名為paddle_env的環(huán)境
# 此處為加速下載,使用清華源
conda create --name paddle_env python=3.8 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ # 這是一行命令
-
激活剛創(chuàng)建的conda環(huán)境并查看python位置
3. 安裝PaddlePaddle
- 如果用cpu跑或杠,請(qǐng)運(yùn)行以下命令安裝
python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
- 如果用gpu跑哪怔,看這里,根據(jù)下面的快速安裝,找適合自己的
- 安裝時(shí)认境,我遇到的一些問(wèn)題
問(wèn)題1:
ERROR: pips dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
daal4py 2021.3.0 requires daal==2021.2.3, which is not installed.
解決方法:
// 設(shè)置清華源
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
// 安裝daal4py
pip install daal4py
問(wèn)題2:
ERROR: Cannot uninstall 'TBB'. It is a distutils installed project and thus we cannot accurately determine which files belong to it which would lead to only a partial uninstall.
解決方法:
pip install --ignore-installed TBB
4. 安裝PaddleOCR whl包
- 執(zhí)行安裝命令
pip install "paddleocr>=2.0.1"
-
可能會(huì)報(bào)一大堆紅色錯(cuò)誤胚委,注意看報(bào)錯(cuò)信息,去提示的網(wǎng)址安裝一下即可;安裝完tools元暴,再執(zhí)行一下安裝whl包的命令篷扩。
error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools": https://visualstudio.microsoft.com/visual-cpp-build-tools/
三、windows下安裝cuda
由于PaddleOCR飛槳CUDA版本的限制茉盏,我們可能需要自己安裝cuda鉴未。
CUDA、CUDNN在windows下的安裝及配置
四鸠姨、測(cè)試
這里以行程卡為例铜秆,直接使用默認(rèn)的模型,測(cè)試圖片:
命令行運(yùn)行后讶迁,執(zhí)行的結(jié)果:
五连茧、簡(jiǎn)單使用
思路:
簡(jiǎn)單的用python寫(xiě)一個(gè)服務(wù),對(duì)外提供接口巍糯;
調(diào)用方調(diào)用接口時(shí)啸驯,python程序獲取傳過(guò)來(lái)的圖片或者圖片地址,調(diào)用PaddleOCR分析圖片祟峦,并將分析的結(jié)果以JSON字符串傳給調(diào)用方罚斗。
代碼寫(xiě)的比較亂,會(huì)在下一篇博客中貼出示例代碼并說(shuō)明宅楞。