PDFBox轉(zhuǎn)圖片小工具

1. 效果

(1)轉(zhuǎn)換pdf所有頁面:

# 運行
java -jar pdftransfer-1.0.jar D:\test\mypdflocation\文件.pdf
轉(zhuǎn)化pdf所有頁面.png

轉(zhuǎn)化結(jié)果.png

(2)轉(zhuǎn)化指定頁面

# 運行,注意第二個參數(shù),代表頁面號,多個頁面用空格隔開
java -jar pdftransfer-1.0.jar D:\test\mypdflocation\文件.pdf 5 6 7
轉(zhuǎn)化指定頁面.png
image.png

2. 源碼

JDK:
建議1.8

maven依賴:

<dependency>
       <groupId>com.levigo.jbig2</groupId>
       <artifactId>levigo-jbig2-imageio</artifactId>
       <version>2.0</version>
</dependency>
<dependency>
       <groupId>com.twelvemonkeys.imageio</groupId>
       <artifactId>imageio-jpeg</artifactId>
       <version>3.4.1</version>
</dependency>
<dependency>
       <groupId>org.apache.pdfbox</groupId>
       <artifactId>pdfbox</artifactId>
       <version>2.0.17</version>
</dependency>
<dependency>
       <groupId>com.github.jai-imageio</groupId>
       <artifactId>jai-imageio-core</artifactId>
       <version>1.4.0</version>
</dependency>
<dependency>
      <groupId>com.github.jai-imageio</groupId>
      <artifactId>jai-imageio-jpeg2000</artifactId>
      <version>1.3.0</version>
</dependency>

文件源碼

package com.qzh;

import org.apache.pdfbox.cos.COSObject;
import org.apache.pdfbox.pdmodel.DefaultResourceCache;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.graphics.PDXObject;
import org.apache.pdfbox.rendering.PDFRenderer;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.EOFException;
import java.io.File;
import java.io.IOException;
import java.io.Serializable;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;
import java.util.concurrent.*;

/**
 * 參數(shù)1:路徑
 * 參數(shù)2:指定頁數(shù)
 *
 * @author qu.zh
 * @date 2019/12/11 17:24
 */
public class PdfTransfer {

    private static String FILE_NAME = "";

    /**
     * 文件輸出路徑
     */
    private static String FILE_OUTPUT_PATH = "d:/pdf/output/";

    /**
     * 隊列
     */
    private volatile static ArrayBlockingQueue<DataEntity> queue = new ArrayBlockingQueue<DataEntity>(500);

    /**
     * CPU核心線程數(shù)
     */
    private static final int CPU_CORE = 7;

    /**
     * 默認DPI独泞,可以用參數(shù)進行擴展
     */
    private static final int DEFAULT_DPI = 400;


    static {
        System.setProperty("sun.java2d.cmm", "sun.java2d.cmm.kcms.KcmsServiceProvider");
    }

    public static void main(String[] args) {
        // pdf名稱
        if (args == null || args.length == 0) {
            System.err.println("請傳入路徑");
            return;
        }
        String name = args[0];

        List<Integer> needTransferList = new ArrayList<>();
        if (args.length > 1) {
            for (int i = 1; i < args.length; i++) {
                needTransferList.add(Integer.valueOf(args[i]));
                System.out.println("打印頁數(shù):" + args[i]);
            }
        }

        FILE_NAME = name;

        if (FILE_NAME == null || "".equals(FILE_NAME)) {
            System.err.println("pdf名稱不能為空");
            return;
        }


        ThreadPoolExecutor executor = new ThreadPoolExecutor(CPU_CORE, CPU_CORE,
                1200, TimeUnit.SECONDS, new SynchronousQueue<>(), new ThreadPoolExecutor.CallerRunsPolicy());
        // i7+16G+8核的機器
        // 20進程 62秒
        // 14進程 46秒
        // 10進程 44秒
        // 8進程  40秒
        // 6進程  42秒
        // 4線程  49秒
        // 趨近核數(shù)最快
        for (int i = 0; i < CPU_CORE; i++) {
            executor.submit(new MyTask(queue));
        }

        File file = new File(FILE_NAME);
        int end = file.getName().lastIndexOf(".");
        String folderName = file.getName().substring(0, end);
        File fileParent = new File(file.getParent());
        if (!fileParent.exists()) {
            file.mkdirs();
        }

        FILE_OUTPUT_PATH = FILE_OUTPUT_PATH + File.separator + folderName + File.separator;
        File output = new File(FILE_OUTPUT_PATH);
        if (!output.exists()) {
            output.mkdirs();
        }


        PDDocument pdDocument = null;
        try {
            Date startDate = new Date();
            System.out.println();
            pdDocument = PDDocument.load(new File(FILE_NAME));

            pdDocument.setResourceCache(new MyResourceCache());
            int pageCount = pdDocument.getNumberOfPages();

            PDFRenderer renderer = new PDFRenderer(pdDocument);
            CountDownLatch countDownLatch = new CountDownLatch(needTransferList.size() > 0 ? needTransferList.size() : pageCount);
            System.out.println("轉(zhuǎn)換頁數(shù)頁數(shù)一共:" + needTransferList.size());
            if (needTransferList.size() > 0) {
                for (int i = 0; i < needTransferList.size(); i++) {
                    int curPage = needTransferList.get(i);
                    DataEntity dataEntity = new DataEntity();
                    dataEntity.setPageNum(curPage - 1);
                    dataEntity.setPdfRenderer(renderer);
                    dataEntity.setCountDownLatch(countDownLatch);
                    dataEntity.setPageCount(pageCount);
                    queue.put(dataEntity);
                }
            } else {
                for (int j = 0; j < pageCount; j++) {
                    DataEntity dataEntity = new DataEntity();
                    dataEntity.setPageNum(j);
                    dataEntity.setPdfRenderer(renderer);
                    dataEntity.setCountDownLatch(countDownLatch);
                    dataEntity.setPageCount(pageCount);
                    int imageCount = 0;

                    int fontCount = 0;
                    // 圖片內(nèi)容
                    PDPage page = pdDocument.getPage(j);
                    PDResources resources = page.getResources();
                    Iterable<COSName> cosNames = resources.getXObjectNames();
                    BufferedImage bufferedImage = null;
                    if (cosNames != null) {
                        Iterator<COSName> cosNamesIter = cosNames.iterator();
                        while (cosNamesIter.hasNext()) {
                            COSName cosName = cosNamesIter.next();
                            PDFont font = resources.getFont(cosName);
                            if (resources.isImageXObject(cosName)) {
                                imageCount++;
                                PDImageXObject Ipdmage = (PDImageXObject) resources.getXObject(cosName);
                                bufferedImage = Ipdmage.getImage();

                            }
                            if (font != null) {
                                fontCount++;
                            }
                        }
                    }
                   // 如果每一頁只有一張圖片,直接提出來就行次坡,不然效率低
                    if (fontCount == 0 && imageCount == 1) {
                        String imageFileName = FILE_OUTPUT_PATH + "number_" + (j + 1) + "_page.png";
                        FileOutputStream out = new FileOutputStream(imageFileName);
                        try {
                            ImageIO.write(bufferedImage, "png", out);
                        } catch (IOException e) {
                        } finally {
                            try {
                                out.close();
                            } catch (IOException e) {
                                e.printStackTrace();
                            }
                        }
                    } else {
                        queue.put(dataEntity);
                    }
                }
            }

            countDownLatch.await(200, TimeUnit.SECONDS);
            System.out.println("執(zhí)行完畢S募摺9堋Q渡1姆妗!E费俊@虻唷!渐裸!");
            System.out.println("頁數(shù):" + pageCount);
            Date endDate = new Date();
            System.out.println("用時:" + (endDate.getTime() - startDate.getTime()) / 1000 + "秒");

        } catch (IOException e) {
            e.printStackTrace();
            System.err.println("IOException");
        } catch (InterruptedException e) {
            e.printStackTrace();
            System.err.println("InterruptedException");
        } catch (Throwable throwable) {
            throwable.printStackTrace();
        } finally {
            try {
                if (pdDocument != null) {
                    pdDocument.close();
                }
            } catch (IOException e) {
                e.printStackTrace();
                System.err.println("IOException");
            }
        }
        System.out.println("按ctrl+c結(jié)束");
    }

    /**
     * 緩存優(yōu)化巫湘,官網(wǎng)說這個指定為空會禁止使用緩存
     */
    private static class MyResourceCache extends DefaultResourceCache {
        @Override
        public void put(COSObject indirect, PDXObject xobject) throws IOException {
            // super .put(indirect,xobject);
        }
    }

    /**
     * 任務(wù)
     */
    public static class MyTask implements Runnable {

        private ArrayBlockingQueue<DataEntity> queue;

        public MyTask(ArrayBlockingQueue queue) {
            this.queue = queue;
        }

        @Override
        public void run() {
            while (true) {
                DataEntity dataEntity = null;
                BufferedImage image = null;
                try {
                    // 取出任務(wù)
                    dataEntity = queue.take();
                    PDFRenderer renderer = dataEntity.getPdfRenderer();
                    int pageNum = dataEntity.getPageNum();
                    String imageFileName = FILE_OUTPUT_PATH + "第" + (pageNum + 1) + "頁.png";
                    // 進行轉(zhuǎn)圖片
                    System.out.println("============第" + (pageNum + 1) + "頁轉(zhuǎn)換中============");

                    // renderer是不安全的昏鹃,所以得加鎖,雖然會影響性能
                    synchronized (renderer) {
                        image = renderer.renderImageWithDPI(pageNum, DEFAULT_DPI);
                    }

                    ImageIO.write(image, "png", new File(imageFileName));
                } catch (InterruptedException e) {
                    e.printStackTrace();
                    System.err.println("InterruptedException==========");
                } catch (IOException e) {
                    if (e instanceof EOFException) {
                        System.err.println("EOFException========");
                    } else {
                        System.err.println("IOException========");
                        e.printStackTrace();
                    }


                } catch (Exception throwable) {
                    System.out.println("=================Throwable==========================");
                    throwable.printStackTrace();
                } finally {
                    if (image != null) {
                        image.flush();
                    }

                    if (dataEntity != null) {
                        CountDownLatch countDownLatch = dataEntity.getCountDownLatch();
                        countDownLatch.countDown();
                    }
                }
            }
        }
    }

    /**
     * 任務(wù)實體
     */
    private static class DataEntity implements Serializable {
        public static final long serialVersionUID = -1;
        private PDFRenderer pdfRenderer;

        private int pageNum;

        private CountDownLatch countDownLatch;

        private int pageCount;

        public int getPageCount() {
            return pageCount;
        }

        public void setPageCount(int pageCount) {
            this.pageCount = pageCount;
        }

        public PDFRenderer getPdfRenderer() {
            return pdfRenderer;
        }

        public CountDownLatch getCountDownLatch() {
            return countDownLatch;
        }

        public void setCountDownLatch(CountDownLatch countDownLatch) {
            this.countDownLatch = countDownLatch;
        }

        public void setPdfRenderer(PDFRenderer pdfRenderer) {
            this.pdfRenderer = pdfRenderer;
        }

        public int getPageNum() {
            return pageNum;
        }

        public void setPageNum(int pageNum) {
            this.pageNum = pageNum;
        }
    }
}



如果需要指定main執(zhí)行的話:

<build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-assembly-plugin</artifactId>
                <version>2.3</version>
                <configuration>
                    <appendAssemblyId>false</appendAssemblyId>
                    <descriptorRefs>
                        <descriptorRef>jar-with-dependencies</descriptorRef>
                    </descriptorRefs>
                    <archive>
                        <manifest>
                            <addClasspath>true</addClasspath>
                            <classpathPrefix>lib/</classpathPrefix>
                            <mainClass>com.qzh.PdfTransfer</mainClass>
                        </manifest>
                    </archive>
                </configuration>
                <executions>
                    <execution>
                        <id>make-assembly</id>
                        <phase>package</phase>
                        <goals>
                            <goal>assembly</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>
        </plugins>
    </build>

3. 說明

(1)核心線程數(shù)可以根據(jù)實際環(huán)境來調(diào)整诀诊,建議為cpu核數(shù)(加一或者減一)洞渤。
(2)出現(xiàn)其他問題請參考:http://www.reibang.com/p/c85017f8577a

image.png

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市属瓣,隨后出現(xiàn)的幾起案子载迄,更是在濱河造成了極大的恐慌,老刑警劉巖抡蛙,帶你破解...
    沈念sama閱讀 218,451評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件护昧,死亡現(xiàn)場離奇詭異,居然都是意外死亡粗截,警方通過查閱死者的電腦和手機惋耙,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,172評論 3 394
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來熊昌,“玉大人绽榛,你說我怎么就攤上這事⌒鲆伲” “怎么了灭美?”我有些...
    開封第一講書人閱讀 164,782評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長昂利。 經(jīng)常有香客問我届腐,道長铁坎,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,709評論 1 294
  • 正文 為了忘掉前任犁苏,我火速辦了婚禮硬萍,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘傀顾。我一直安慰自己襟铭,他們只是感情好,可當我...
    茶點故事閱讀 67,733評論 6 392
  • 文/花漫 我一把揭開白布短曾。 她就那樣靜靜地躺著寒砖,像睡著了一般。 火紅的嫁衣襯著肌膚如雪嫉拐。 梳的紋絲不亂的頭發(fā)上哩都,一...
    開封第一講書人閱讀 51,578評論 1 305
  • 那天,我揣著相機與錄音婉徘,去河邊找鬼漠嵌。 笑死,一個胖子當著我的面吹牛盖呼,可吹牛的內(nèi)容都是我干的儒鹿。 我是一名探鬼主播,決...
    沈念sama閱讀 40,320評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼几晤,長吁一口氣:“原來是場噩夢啊……” “哼约炎!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起蟹瘾,我...
    開封第一講書人閱讀 39,241評論 0 276
  • 序言:老撾萬榮一對情侶失蹤圾浅,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后憾朴,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體狸捕,經(jīng)...
    沈念sama閱讀 45,686評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,878評論 3 336
  • 正文 我和宋清朗相戀三年众雷,在試婚紗的時候發(fā)現(xiàn)自己被綠了灸拍。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,992評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡报腔,死狀恐怖株搔,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情纯蛾,我是刑警寧澤纤房,帶...
    沈念sama閱讀 35,715評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站翻诉,受9級特大地震影響炮姨,放射性物質(zhì)發(fā)生泄漏捌刮。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,336評論 3 330
  • 文/蒙蒙 一舒岸、第九天 我趴在偏房一處隱蔽的房頂上張望绅作。 院中可真熱鬧,春花似錦蛾派、人聲如沸俄认。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,912評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽眯杏。三九已至,卻和暖如春壳澳,著一層夾襖步出監(jiān)牢的瞬間岂贩,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,040評論 1 270
  • 我被黑心中介騙來泰國打工巷波, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留萎津,地道東北人。 一個月前我還...
    沈念sama閱讀 48,173評論 3 370
  • 正文 我出身青樓抹镊,卻偏偏與公主長得像锉屈,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子垮耳,可洞房花燭夜當晚...
    茶點故事閱讀 44,947評論 2 355