Java使用Openoffice將word仔掸、ppt轉(zhuǎn)換為PDF

項(xiàng)目中要實(shí)現(xiàn)WORD的文件預(yù)覽功能脆贵,我們可以通過(guò)將WORD轉(zhuǎn)換成PDF或者HTML,然后通過(guò)瀏覽器預(yù)覽起暮。

OpenOffice

OpenOffice.org 是一套跨平臺(tái)的辦公室軟件套件卖氨,能在 Windows、Linux鞋怀、MacOS X (X11)双泪、和 Solaris 等操作系統(tǒng)上執(zhí)行持搜。它與各個(gè)主要的辦公室軟件套件兼容密似。OpenOffice.org 是自由軟件,任何人都可以免費(fèi)下載葫盼、使用残腌、及推廣它。

下載地址

http://www.openoffice.org/

JodConverter

jodconverter-2.2.2.zip 下載地址:

http://sourceforge.net/projects/jodconverter/files/JODConverter/

Word轉(zhuǎn)換

啟動(dòng)OpenOffice的服務(wù)

進(jìn)入openoffice安裝目錄,通過(guò)cmd啟動(dòng)一個(gè)soffice服務(wù)抛猫,啟動(dòng)的命令是soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;"

如果覺得后臺(tái)運(yùn)行OpenOffice服務(wù)比較麻煩蟆盹,可以通過(guò)運(yùn)行代碼

public class PDFDemo {

    public static boolean officeToPDF(String sourceFile, String destFile) {
        try {

            File inputFile = new File(sourceFile);
            if (!inputFile.exists()) {
                // 找不到源文件, 則返回false
                return false;
            }
            // 如果目標(biāo)路徑不存在, 則新建該路徑
            File outputFile = new File(destFile);
            if (!outputFile.getParentFile().exists()) {
                outputFile.getParentFile().mkdirs();
            }
            //如果目標(biāo)文件存在,則刪除
            if (outputFile.exists()) {
                outputFile.delete();
            }
            DateFormat df = new SimpleDateFormat("yyyy-MM-dd HH:mm");
            OpenOfficeConnection connection = new SocketOpenOfficeConnection("127.0.0.1", 8100);
            connection.connect();
            //用于測(cè)試openOffice連接時(shí)間
            System.out.println("連接時(shí)間:" + df.format(new Date()));
            DocumentConverter converter = new StreamOpenOfficeDocumentConverter(
                    connection);
            converter.convert(inputFile, outputFile);
            //測(cè)試word轉(zhuǎn)PDF的轉(zhuǎn)換時(shí)間
            System.out.println("轉(zhuǎn)換時(shí)間:" + df.format(new Date()));
            connection.disconnect();
            return true;
        } catch (ConnectException e) {
            e.printStackTrace();
            System.err.println("openOffice連接失敼虢稹逾滥!請(qǐng)檢查IP,端口");
        } catch (Exception e) {
            e.printStackTrace();
        }
        return false;
    }

    public static void main(String[] args) {
        officeToPDF("E:\\test.docx", "E:\\test.pdf");
    }
}

Word、ppt轉(zhuǎn)Html

只需要將后綴名從.pdf改為.html即可败匹。

public static void main(String[] args) {
    officeToPDF("E:\\test.docx", "E:\\test.html");
}

Maven配置

Maven依賴

<dependency>
    <groupId>com.artofsolving</groupId>
    <artifactId>jodconverter</artifactId>
    <version>2.2.1</version>
</dependency>
<dependency>
    <groupId>org.openoffice</groupId>
    <artifactId>jurt</artifactId>
    <version>3.0.1</version>
</dependency>
<dependency>
    <groupId>org.openoffice</groupId>
    <artifactId>ridl</artifactId>
    <version>3.0.1</version>
</dependency>
<dependency>
    <groupId>org.openoffice</groupId>
    <artifactId>juh</artifactId>
    <version>3.0.1</version>
</dependency>
<dependency>
    <groupId>org.openoffice</groupId>
    <artifactId>unoil</artifactId>
    <version>3.0.1</version>
</dependency>
<dependency>
    <groupId>org.slf4j</groupId>
    <artifactId>slf4j-jdk14</artifactId>
    <version>1.4.3</version>
</dependency>

Maven只有 2.2.1版本寨昙,2.2.1版本有一個(gè)問(wèn)題,那就是不兼容docx和pptx掀亩,如果你們不使用jodconverter-2.2.2 中l(wèi)ib舔哪,而想要使用2.2.1版本,需要修改一下 BasicDocumentFormatRegistry 類中的 getFormatByFileExtension方法:

新建包 com.artofsolving.jodconverter
新建類BasicDocumentFormatRegistry槽棍,復(fù)制下面代碼

package com.artofsolving.jodconverter;

/**
 * @author 李文浩
 * @date 2017/12/25
 */

import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;

public class BasicDocumentFormatRegistry implements DocumentFormatRegistry {
    private List documentFormats = new ArrayList();

    public BasicDocumentFormatRegistry() {
    }

    public void addDocumentFormat(DocumentFormat documentFormat) {
        this.documentFormats.add(documentFormat);
    }

    protected List getDocumentFormats() {
        return this.documentFormats;
    }

    public DocumentFormat getFormatByFileExtension(String extension) {
        if (extension == null) {
            return null;
        } else {
            if (extension.indexOf("doc") >= 0) {
                extension = "doc";
            }
            if (extension.indexOf("ppt") >= 0) {
                extension = "ppt";
            }
            if (extension.indexOf("xls") >= 0) {
                extension = "xls";
            }
            String lowerExtension = extension.toLowerCase();
            Iterator it = this.documentFormats.iterator();

            DocumentFormat format;
            do {
                if (!it.hasNext()) {
                    return null;
                }

                format = (DocumentFormat)it.next();
            } while(!format.getFileExtension().equals(lowerExtension));

            return format;
        }
    }

    public DocumentFormat getFormatByMimeType(String mimeType) {
        Iterator it = this.documentFormats.iterator();

        DocumentFormat format;
        do {
            if (!it.hasNext()) {
                return null;
            }

            format = (DocumentFormat)it.next();
        } while(!format.getMimeType().equals(mimeType));

        return format;
    }
}

下面是增加的部分捉蚤,僅僅增加了將docx按照doc的處理方式處理。而2.2.2版本已經(jīng)默認(rèn)增加了炼七。

if (extension.indexOf("doc") >= 0) {
    extension = "doc";
}
if (extension.indexOf("ppt") >= 0) {
    extension = "ppt";
}
if (extension.indexOf("xls") >= 0) {
    extension = "xls";
}
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末缆巧,一起剝皮案震驚了整個(gè)濱河市推汽,隨后出現(xiàn)的幾起案子终畅,更是在濱河造成了極大的恐慌搂妻,老刑警劉巖怨愤,帶你破解...
    沈念sama閱讀 210,978評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件诚纸,死亡現(xiàn)場(chǎng)離奇詭異怨喘,居然都是意外死亡延塑,警方通過(guò)查閱死者的電腦和手機(jī)羞福,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門逞敷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)狂秦,“玉大人,你說(shuō)我怎么就攤上這事推捐×盐剩” “怎么了?”我有些...
    開封第一講書人閱讀 156,623評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵牛柒,是天一觀的道長(zhǎng)堪簿。 經(jīng)常有香客問(wèn)我,道長(zhǎng)皮壁,這世上最難降的妖魔是什么椭更? 我笑而不...
    開封第一講書人閱讀 56,324評(píng)論 1 282
  • 正文 為了忘掉前任,我火速辦了婚禮蛾魄,結(jié)果婚禮上虑瀑,老公的妹妹穿的比我還像新娘湿滓。我一直安慰自己,他們只是感情好舌狗,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,390評(píng)論 5 384
  • 文/花漫 我一把揭開白布叽奥。 她就那樣靜靜地躺著,像睡著了一般痛侍。 火紅的嫁衣襯著肌膚如雪朝氓。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,741評(píng)論 1 289
  • 那天主届,我揣著相機(jī)與錄音膀篮,去河邊找鬼。 笑死岂膳,一個(gè)胖子當(dāng)著我的面吹牛誓竿,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播谈截,決...
    沈念sama閱讀 38,892評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼筷屡,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了簸喂?” 一聲冷哼從身側(cè)響起毙死,我...
    開封第一講書人閱讀 37,655評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎喻鳄,沒(méi)想到半個(gè)月后扼倘,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,104評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡除呵,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年再菊,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片颜曾。...
    茶點(diǎn)故事閱讀 38,569評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡纠拔,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出泛豪,到底是詐尸還是另有隱情稠诲,我是刑警寧澤,帶...
    沈念sama閱讀 34,254評(píng)論 4 328
  • 正文 年R本政府宣布诡曙,位于F島的核電站臀叙,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏价卤。R本人自食惡果不足惜劝萤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,834評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望荠雕。 院中可真熱鬧稳其,春花似錦、人聲如沸炸卑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,725評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)盖文。三九已至嘱蛋,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間五续,已是汗流浹背洒敏。 一陣腳步聲響...
    開封第一講書人閱讀 31,950評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留疙驾,地道東北人凶伙。 一個(gè)月前我還...
    沈念sama閱讀 46,260評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像它碎,于是被迫代替她去往敵國(guó)和親函荣。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,446評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容