如何識(shí)別電子發(fā)票中的二維碼(java實(shí)現(xiàn))

項(xiàng)目中有個(gè)ocr軟件識(shí)別發(fā)票信息的需求漓库,實(shí)際使用中發(fā)現(xiàn)識(shí)別率有點(diǎn)低吧黄。后來(lái)發(fā)現(xiàn)對(duì)于電子發(fā)票柬帕,可以直接識(shí)別二維碼讀取部分票面信息,然后用這部分信息作為參數(shù)铅搓,通過調(diào)用稅務(wù)的接口獲取全票面信息瑟押。只要是正常的電子發(fā)票,識(shí)別率差不多是100%星掰。

創(chuàng)作不易多望,轉(zhuǎn)載請(qǐng)注明出處


        <dependency>
            <groupId>org.apache.pdfbox</groupId>
            <artifactId>pdfbox</artifactId>
            <version>2.0.20</version>
        </dependency>
        <dependency>
            <groupId>com.google.zxing</groupId>
            <artifactId>core</artifactId>
            <version>3.1.0</version>
        </dependency>
        <dependency>
            <groupId>com.google.zxing</groupId>
            <artifactId>javase</artifactId>
            <version>3.1.0</version>
        </dependency>



        /**
     * 獲取電子發(fā)票pdf文件中的發(fā)票信息
     * @param filePath 電子發(fā)票路徑
     * @return 發(fā)票信息
     */
    public Invoice getInvoiceInfo(String filePath) {
        try {
            List<BufferedImage> imageList = extractImage(new File(filePath));
            if (imageList.isEmpty()) {
                logger.info("pdf中未解析出圖片嫩舟,返回空");
                return null;
            }
            
            MultiFormatReader formatReader = new MultiFormatReader();
            //正常解析出來(lái)有3張圖片,第一張是二維碼怀偷,其他兩張圖片是發(fā)票上蓋的章
            BinaryBitmap binaryBitmap = new BinaryBitmap(new HybridBinarizer(new BufferedImageLuminanceSource(imageList.get(0))));
            Map hints = new HashMap<>();
            hints.put(EncodeHintType.CHARACTER_SET, "utf-8");
            Result result = formatReader.decode(binaryBitmap);
            if (result == null || StringUtils.isEmpty(result.getText())) {
                logger.info("pdf中的第一張圖片沒有解析了字符串信息家厌,直接返回空");
                return null;
            }
            
            logger.info("從電子發(fā)票中識(shí)別出的信息為:{}",  result.getText());
            
            // 讀取到的信息為 : 01,發(fā)票類型椎工,發(fā)票代碼饭于,發(fā)票號(hào)碼,發(fā)票金額维蒙,開票日期掰吕,校驗(yàn)碼,隨機(jī)產(chǎn)生的摘要信息
            String[] infos = result.getText().split(",");
            if (infos.length != 8) {
                logger.info("pdf中的第一張圖片解析出的字符串?dāng)?shù)組長(zhǎng)度不為8颅痊,返回空畴栖。");
                return null;
            }
            
            Invoice invoice = new Invoice();
            invoice.setInvoiceType(infos[1]); //發(fā)票類型
            invoice.setInvoiceCode(infos[2]); //發(fā)票代碼
            invoice.setInvoiceNo(infos[3]); // 發(fā)票號(hào)碼
            invoice.setAmount(new BigDecimal(infos[4])); // 發(fā)票金額
            invoice.setInvoiceDate(DateUtils.parseDate(infos[5], "yyyyMMdd")); //開票日期
            invoice.setCheckCode(infos[6]); // 校驗(yàn)碼
            
            return invoice;
        } catch (Exception e) {
            logger.info("解析pdf中的二維碼出現(xiàn)異常", e);
            return null;
        }
    }


       /**
     * 提取電子發(fā)票里面的圖片
     * @param pdfFile 電子發(fā)票文件對(duì)象
     * @return pdf中解析出的圖片列表
     * @throws Exception
     */
    private List<BufferedImage>  extractImage(File pdfFile) throws Exception {
        List<BufferedImage> imageList = new ArrayList<BufferedImage>();
        
        PDDocument document = PDDocument.load(pdfFile);
        PDPage page = document.getPage(0); //電子發(fā)票只有一頁(yè)
        PDResources resources = page.getResources();
        
        for (COSName name : resources.getXObjectNames()) {
            if (resources.isImageXObject(name)) {
                PDImageXObject obj = (PDImageXObject)resources.getXObject(name);
                imageList.add(obj.getImage());
            }
        }
        return imageList;
    }

創(chuàng)作不易,轉(zhuǎn)載請(qǐng)注明出處

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末八千,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子燎猛,更是在濱河造成了極大的恐慌恋捆,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,546評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件重绷,死亡現(xiàn)場(chǎng)離奇詭異沸停,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)昭卓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門愤钾,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人候醒,你說(shuō)我怎么就攤上這事能颁。” “怎么了倒淫?”我有些...
    開封第一講書人閱讀 164,911評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵伙菊,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我敌土,道長(zhǎng)镜硕,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,737評(píng)論 1 294
  • 正文 為了忘掉前任返干,我火速辦了婚禮兴枯,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘矩欠。我一直安慰自己财剖,他們只是感情好悠夯,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著峰伙,像睡著了一般疗疟。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上瞳氓,一...
    開封第一講書人閱讀 51,598評(píng)論 1 305
  • 那天策彤,我揣著相機(jī)與錄音,去河邊找鬼匣摘。 笑死店诗,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的音榜。 我是一名探鬼主播庞瘸,決...
    沈念sama閱讀 40,338評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼赠叼!你這毒婦竟也來(lái)了擦囊?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,249評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤嘴办,失蹤者是張志新(化名)和其女友劉穎瞬场,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體涧郊,經(jīng)...
    沈念sama閱讀 45,696評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡贯被,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了妆艘。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片彤灶。...
    茶點(diǎn)故事閱讀 40,013評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖批旺,靈堂內(nèi)的尸體忽然破棺而出幌陕,到底是詐尸還是另有隱情,我是刑警寧澤汽煮,帶...
    沈念sama閱讀 35,731評(píng)論 5 346
  • 正文 年R本政府宣布苞轿,位于F島的核電站,受9級(jí)特大地震影響逗物,放射性物質(zhì)發(fā)生泄漏搬卒。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評(píng)論 3 330
  • 文/蒙蒙 一翎卓、第九天 我趴在偏房一處隱蔽的房頂上張望契邀。 院中可真熱鬧,春花似錦失暴、人聲如沸坯门。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)古戴。三九已至欠橘,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間现恼,已是汗流浹背肃续。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留叉袍,地道東北人始锚。 一個(gè)月前我還...
    沈念sama閱讀 48,203評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像喳逛,于是被迫代替她去往敵國(guó)和親瞧捌。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 漸變的面目拼圖要我怎么拼曙砂? 我是疲乏了還是投降了? 不是不允許自己墜落赠法, 我沒有滴水不進(jìn)的保護(hù)膜。 就是害怕變得面...
    悶熱當(dāng)乘涼閱讀 4,246評(píng)論 0 13
  • 夜鶯2517閱讀 127,720評(píng)論 1 9
  • 版本:ios 1.2.1 亮點(diǎn): 1.app角標(biāo)可以實(shí)時(shí)更新天氣溫度或選擇空氣質(zhì)量乔夯,建議處女座就不要選了砖织,不然老想...
    我就是沉沉閱讀 6,896評(píng)論 1 6
  • 我是一名過去式的高三狗,很可悲末荐,在這三年里我沒有戀愛侧纯,看著同齡的小伙伴們一對(duì)兒一對(duì)兒的,我的心不好受甲脏。怎么說(shuō)呢眶熬,高...
    小娘紙閱讀 3,388評(píng)論 4 7
  • 那一年,我選擇了獨(dú)立遠(yuǎn)行块请,火車帶著我在前進(jìn)的軌道上爬行了超過23個(gè)小時(shí)娜氏; 那一年宝恶,我走過泥濘的柏油路衣吠,在那個(gè)遠(yuǎn)離故...
    木芽閱讀 1,637評(píng)論 4 5