C# 提取圖片上的文字內(nèi)容

一府蛇、平臺(tái):.net 6.0 控制臺(tái)應(yīng)用程序
二、插件安裝


image.png

EPPlus 7.2.1
OpenCvSharp4.runtime.win 4.10.0.20240616
Sdcb.PaddleInference 2.5.0.1
Sdcb.PaddleInference.runtime.win64.mkl 2.6.1
Sdcb.PaddleOCR 2.7.0.3
Sdcb.PaddleOCR.Models.Local 2.7.0
System.Drawing.Common 8.0.7

三、實(shí)現(xiàn)代碼

using OpenCvSharp;
using Sdcb.PaddleInference;
using Sdcb.PaddleOCR.Models.Local;
using Sdcb.PaddleOCR.Models;
using Sdcb.PaddleOCR;
using System.Diagnostics;
using System;
using System.Drawing;
using System.IO;
using OfficeOpenXml;

namespace ConsoleApp1
{
    internal class Program
    {
        static void Main(string[] args)
        {
            Console.WriteLine("【啟動(dòng)圖片掃描程序】");
            Console.WriteLine("請(qǐng)指定一個(gè)文件根目錄:");

            string rootFolder = Console.ReadLine();

            if (!Directory.Exists(rootFolder))
            {
                Console.WriteLine("【錯(cuò)誤】路徑不存在...");
                return;
            }

            try
            {
                Console.WriteLine("開始遍歷文件夾...");
                string runDir = AppDomain.CurrentDomain.BaseDirectory;
                string savePath = $"{runDir}output.xlsx";
                ExcelPackage.LicenseContext = LicenseContext.NonCommercial;
                using (var package = new ExcelPackage())
                {
                    var sheet1 = package.Workbook.Worksheets.Add("結(jié)果表");
                    var sheet2 = package.Workbook.Worksheets.Add("錯(cuò)誤表");

                    sheet1.SetValue(1, 1, "文件夾名稱");
                    sheet1.SetValue(1, 2, "圖片名稱");
                    sheet1.SetValue(1, 3, "時(shí)間");
                    sheet1.SetValue(1, 4, "經(jīng)度");
                    sheet1.SetValue(1, 5, "緯度");
                    sheet1.SetValue(1, 6, "地址");
                    sheet1.SetValue(1, 7, "路徑");

                    sheet2.SetValue(1, 1, "文件夾名稱");
                    sheet2.SetValue(1, 2, "圖片名稱");
                    sheet2.SetValue(1, 3, "路徑");
                    sheet2.SetValue(1, 4, "識(shí)別錯(cuò)誤原因");

                    TraverseDirectory(rootFolder, sheet1, sheet2, 2, 2);

                    package.SaveAs(savePath);
                }
                Console.WriteLine("識(shí)別完成,請(qǐng)查看輸出文件!");
            }
            catch (Exception ex)
            {
                Console.WriteLine();
            }
        }

        static void TraverseDirectory(string path, ExcelWorksheet sheet1, ExcelWorksheet sheet2, int rowIndex1, int rowIndex2)
        {
            var rdir = new DirectoryInfo(path);
            Console.WriteLine($"***【文件夾{rdir.Name}】***");
            foreach (var fileInfo in rdir.GetFiles())
            {
                if (fileInfo.Extension == ".jpg" || fileInfo.Extension == ".png")
                {
                    Console.WriteLine($"正在識(shí)別文件:{fileInfo.Name}");
                    try
                    {
                        FullOcrModel model = LocalFullModels.ChineseV3;
                        using (PaddleOcrAll all = new PaddleOcrAll(model, PaddleDevice.Mkldnn())
                        {
                            AllowRotateDetection = false,
                            Enable180Classification = false,
                        })
                        {
                            using (Mat src = Cv2.ImRead(fileInfo.FullName))
                            {
                                PaddleOcrResult result = all.Run(src);
                                // 此處是我自定義將文字內(nèi)容提取的方法芋类,可以自己替換
                                var txt1 = result.Text.Replace("\r", "").Replace("\n", "").Replace(":", ":");

                                var index = txt1.IndexOf("間:");
                                if (index > -1)
                                {
                                    var txt2 = txt1.Substring(index);
                                    var i1 = txt2.IndexOf("度:");
                                    var i2 = txt2.LastIndexOf("度:");
                                    var i3 = txt2.IndexOf("址:");

                                    sheet1.SetValue(rowIndex1, 1, rdir.Name);
                                    sheet1.SetValue(rowIndex1, 2, fileInfo.Name);
                                    sheet1.SetValue(rowIndex1, 3, txt2.Substring(2, i1 - 2));
                                    sheet1.SetValue(rowIndex1, 4, txt2.Substring(i1 + 2, i2 - i1 - 2));
                                    sheet1.SetValue(rowIndex1, 5, txt2.Substring(i2 + 2, i3 - i2 - 2));
                                    sheet1.SetValue(rowIndex1, 6, txt2.Substring(i3 + 2));
                                    sheet1.SetValue(rowIndex1, 7, fileInfo.FullName);
                                    rowIndex1 += 1;

                                    Console.WriteLine($"識(shí)別成功...");
                                    //Console.WriteLine($"時(shí)間:{txt2.Substring(2, i1 - 2)}");
                                    //Console.WriteLine($"經(jīng)度:{txt2.Substring(i1 + 2, i2 - i1 - 2)}");
                                    //Console.WriteLine($"緯度:{txt2.Substring(i2 + 2, i3 - i2 - 2)}");
                                    //Console.WriteLine($"地址:{txt2.Substring(i3 + 2)}");
                                }
                            }
                        }
                       
                    }
                    catch(Exception ex)
                    {
                        sheet2.SetValue(rowIndex2, 1, rdir.Name);
                        sheet2.SetValue(rowIndex2, 2, fileInfo.Name);
                        sheet2.SetValue(rowIndex2, 3, fileInfo.FullName);
                        sheet2.SetValue(rowIndex2, 4, ex.Message);
                        rowIndex2 += 1;
                        Console.WriteLine($"識(shí)別異常:{ex.Message}");
                    }
                }
            }

            foreach (string dir in Directory.GetDirectories(path))
            {
                TraverseDirectory(dir, sheet1, sheet2, rowIndex1, rowIndex2);
            }
        }
    }
}

效果:


image.png

原圖:


image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市界阁,隨后出現(xiàn)的幾起案子侯繁,更是在濱河造成了極大的恐慌,老刑警劉巖泡躯,帶你破解...
    沈念sama閱讀 207,248評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件贮竟,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡较剃,警方通過(guò)查閱死者的電腦和手機(jī)咕别,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評(píng)論 2 381
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)重付,“玉大人顷级,你說(shuō)我怎么就攤上這事凫乖∪返妫” “怎么了?”我有些...
    開封第一講書人閱讀 153,443評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵帽芽,是天一觀的道長(zhǎng)删掀。 經(jīng)常有香客問(wèn)我,道長(zhǎng)导街,這世上最難降的妖魔是什么披泪? 我笑而不...
    開封第一講書人閱讀 55,475評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮搬瑰,結(jié)果婚禮上款票,老公的妹妹穿的比我還像新娘控硼。我一直安慰自己,他們只是感情好艾少,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,458評(píng)論 5 374
  • 文/花漫 我一把揭開白布卡乾。 她就那樣靜靜地躺著,像睡著了一般缚够。 火紅的嫁衣襯著肌膚如雪幔妨。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,185評(píng)論 1 284
  • 那天谍椅,我揣著相機(jī)與錄音误堡,去河邊找鬼。 笑死雏吭,一個(gè)胖子當(dāng)著我的面吹牛锁施,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播杖们,決...
    沈念sama閱讀 38,451評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼沾谜,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了胀莹?” 一聲冷哼從身側(cè)響起基跑,我...
    開封第一講書人閱讀 37,112評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎描焰,沒想到半個(gè)月后媳否,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,609評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡荆秦,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,083評(píng)論 2 325
  • 正文 我和宋清朗相戀三年篱竭,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片步绸。...
    茶點(diǎn)故事閱讀 38,163評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡掺逼,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出瓤介,到底是詐尸還是另有隱情吕喘,我是刑警寧澤,帶...
    沈念sama閱讀 33,803評(píng)論 4 323
  • 正文 年R本政府宣布刑桑,位于F島的核電站氯质,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏祠斧。R本人自食惡果不足惜闻察,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,357評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧辕漂,春花似錦呢灶、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,357評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至隧期,卻和暖如春飒责,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背仆潮。 一陣腳步聲響...
    開封第一講書人閱讀 31,590評(píng)論 1 261
  • 我被黑心中介騙來(lái)泰國(guó)打工宏蛉, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人性置。 一個(gè)月前我還...
    沈念sama閱讀 45,636評(píng)論 2 355
  • 正文 我出身青樓拾并,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親鹏浅。 傳聞我的和親對(duì)象是個(gè)殘疾皇子嗅义,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,925評(píng)論 2 344

推薦閱讀更多精彩內(nèi)容