Java 生成 PDF 文檔

最近項(xiàng)目需要實(shí)現(xiàn)PDF下載的功能壹甥,由于沒(méi)有這方面的經(jīng)驗(yàn)救巷,從網(wǎng)上花了很長(zhǎng)時(shí)間才找到相關(guān)的資料。整理之后句柠,發(fā)現(xiàn)有如下幾個(gè)框架可以實(shí)現(xiàn)這個(gè)功能浦译。

1. 開(kāi)源框架支持

  • iText,生成PDF文檔溯职,還支持將XML精盅、Html文件轉(zhuǎn)化為PDF文件;
  • Apache PDFBox谜酒,生成叹俏、合并PDF文檔;
  • docx4j僻族,生成docx粘驰、pptx、xlsx文檔述么,支持轉(zhuǎn)換為PDF格式蝌数。

比較:

  • iText開(kāi)源協(xié)議為AGPL,而其他兩個(gè)框架協(xié)議均為Apache License v2.0度秘。
  • 使用PDFBox生成PDF就像畫(huà)圖似的顶伞,文字和圖像根據(jù)頁(yè)面坐標(biāo)畫(huà)上去的,需要根據(jù)字?jǐn)?shù)手動(dòng)換行剑梳。
  • docx4j用來(lái)生成docx文檔唆貌,提供了將WORD文檔轉(zhuǎn)換為PDF文檔的功能,并不能直接生成PDF文檔阻荒。

2. 實(shí)現(xiàn)方案

格式復(fù)雜 格式簡(jiǎn)單
數(shù)據(jù)量大 docx4j+freemarker docx4j或PDFBox
數(shù)據(jù)量小 docx4j PDFBox

2.1 純數(shù)據(jù)生成PDF

1.docx4j挠锥,適用于生成格式簡(jiǎn)單或格式復(fù)雜且數(shù)據(jù)量小的PDF文檔;
2.Apache PDFBox侨赡,適用于生成格式簡(jiǎn)單且數(shù)據(jù)量小的PDF文檔。

1.docx4j
docx4j是一個(gè)開(kāi)源Java庫(kù),用于創(chuàng)建和操作Microsoft Open XML(Word docx羊壹,Powerpoint pptx和Excel xlsx)文件蓖宦。它類(lèi)似于Microsoft的OpenXML SDK,但適用于Java油猫。docx4j使用JAXB來(lái)創(chuàng)建內(nèi)存中的對(duì)象表示稠茂,程序員需要花時(shí)間了解JAXB和Open XML文件結(jié)構(gòu) 。

// word對(duì)象
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage();
// 文檔主體
MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();
// 換行符
Br br = objectFactory.createBr();
// 段落
P p = objectFactory.createP();
// 段落設(shè)置
PPr ppr = objectFactory.createPPr();
// 文字位置
Jc jc = new Jc();
jc.setVal(je);
ppr.setJc(jc);
// 行設(shè)置
RPr rpr = objectFactory.createRPr();
// 字體設(shè)置
RFonts rFonts = objectFactory.createRFonts();
rFonts.setAscii("Times New Roman");
rFonts.setEastAsia("宋體");
rpr.setRFonts(rFonts);
// 行
R r = objectFactory.createR();
// 文本
Text text = objectFactory.createText();
text.setValue("這是一段普通文本");
r.setRPr(rpr);
r.getContent().add(br);
r.getContent().add(text);
p.getContent().add(r);
p.setPPr(ppr);
// 添加到正文中
mainDocumentPart.addObject(p);
// 導(dǎo)出
//..

2.Apache PDFBox
Apache PDFBox是處理PDF文檔的一個(gè)開(kāi)源的Java工具情妖。該項(xiàng)目允許創(chuàng)建新的PDF文檔睬关,處理現(xiàn)有文檔以及從文檔中提取內(nèi)容的功能。Apache PDFBox還包括幾個(gè)命令行實(shí)用程序毡证。

String formTemplate = "/Users/xiaoming/Desktop/test_pdfbox.pdf";
// 定義文檔對(duì)象
PDDocument document = new PDDocument();
// 定義一頁(yè)电爹,大小A4
PDPage page = new PDPage(PDRectangle.A4);
document.addPage(page);
// 獲取字體
PDType0Font font = PDType0Font.load(document, new File("/Users/xiaoming/work/tmp/simsun.ttf"));
// 定義頁(yè)面內(nèi)容流
PDPageContentStream stream = new PDPageContentStream(document, page);
// 設(shè)置字體及文字大小
stream.setFont(font, 12);
// 設(shè)置畫(huà)筆顏色
stream.setNonStrokingColor(Color.BLACK);
// 添加矩形
stream.addRect(29, 797, 100, 14);
// 填充矩形
stream.fill();
stream.setNonStrokingColor(Color.BLACK);
// 文本填充開(kāi)始
stream.beginText();
// 設(shè)置行距
stream.setLeading(18f);
// 設(shè)置文字位置
stream.newLineAtOffset(30, 800);
// 填充文字
stream.showText("呵呵");
// 換行
stream.newLine();
stream.showText("哈哈");
stream.newLine();
stream.showText("嘻嘻");
// 文本填充結(jié)束
stream.endText();
// 關(guān)閉流
stream.close();
// 保存
document.save(formTemplate);
// 釋放資源
document.close();

2.2 模版+數(shù)據(jù)生成PDF

FreeMarker+docx4j,適用于生成格式復(fù)雜且數(shù)據(jù)量大的PDF文檔

Apache FreeMarker是一個(gè)模板引擎料睛,用于根據(jù)模板和更改數(shù)據(jù)生成文本輸出(HTML網(wǎng)頁(yè)丐箩,電子郵件,配置文件恤煞,源代碼等)屎勘。模板是用FreeMarker模板語(yǔ)言(FTL)編寫(xiě)的,是一種簡(jiǎn)單的專(zhuān)用語(yǔ)言居扒。

Office2003以上概漱,Word是可以以XML文本格式存儲(chǔ)的。先將要生成的PDF轉(zhuǎn)換為Word文檔 喜喂,再將其保存為XML文本瓤摧,通過(guò)模版引擎將數(shù)據(jù)填充到XML文本中,最后再反向轉(zhuǎn)換為PDF文檔夜惭。簡(jiǎn)單來(lái)說(shuō)就是PDF->Word->XML->Word->PDF的流程姻灶。

步驟 描述 工具
1 word -> xml 手動(dòng)
2 xml -> ftl 手動(dòng),參考《XML格式Word文檔常用標(biāo)簽介紹》
3 ftl + obj = xml freemarker
4 xml -> pdf docx4j
步驟
  • 1 把pdf文檔對(duì)應(yīng)的word(docx)制作出來(lái)


    簡(jiǎn)歷.png
  • 2 把word文檔另存為xml文件


    另存為xml
  • 3 將xml文件制作為freemarker模版(ftl)文件


    制作模版文件
  • 4 將數(shù)據(jù)和ftl文件組裝為xml文本
Map<String, Object> map = new HashMap<>();
map.put("name", "小明");
map.put("address", "北京市朝陽(yáng)區(qū)");
map.put("email", "xiaoming@abc.com");
StringWriter stringWriter = new StringWriter();
BufferedWriter writer = new BufferedWriter(stringWriter);
template.process(map, writer);
String xmlStr = stringWriter.toString();
  • 5 使用docx4j將xml文本加載為word文檔對(duì)象
ByteArrayInputStream in = new ByteArrayInputStream(xmlStr.getBytes());
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(in);
  • 6 使用docx4j將word文檔轉(zhuǎn)存為pdf文檔
String outputfilepath = "/Users/xiaoming/簡(jiǎn)歷.pdf";
FileOutputStream os = new FileOutputStream(new File(outputFilePath));
FOSettings foSettings = Docx4J.createFOSettings();
foSettings.setWmlPackage(wordMLPackage);
Docx4J.toFO(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL);
// Docx4J.toPDF(wordMLPackage, new FileOutputStream(new File(outputfilepath)));

2.3 Word轉(zhuǎn)PDF

docx4j

WordprocessingMLPackage mlPackage = WordprocessingMLPackage.load(new File("abc.docx"));
Mapper fontMapper = new IdentityPlusMapper();  
// fontMapper.put("華文行楷", PhysicalFonts.get("STXingkai"));  
mlPackage.setFontMapper(fontMapper);  
OutputStream os = new java.io.FileOutputStream("abc.pdf");    
FOSettings foSettings = Docx4J.createFOSettings();  
foSettings.setWmlPackage(mlPackage);  
Docx4J.toFO(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL);  

2.4 合并多個(gè)PDF

Apache PDFBox诈茧,將多個(gè)PDF文檔合并

String folderName = "/Users/xiaoming/pdfs";
String destPath = "/Users/xiaoming/all.pdf";
PDFMergerUtility mergePdf = new PDFMergerUtility();
String[] filesInFolder = getFiles(folderName);
Arrays.sort(filesInFolder, new Comparator<String>() {
      @Override
      public int compare(String o1, String o2) {
          return o1.compareTo(o2);
      }
});
for (int i = 0; i < filesInFolder.length; i++) {
     mergePdf.addSource(folderName + File.separator + filesInFolder[i]);
}
mergePdf.setDestinationFileName(destPath);
mergePdf.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());

示例代碼

https://github.com/brandonbai/pdfDemo

鏈接

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末产喉,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子敢会,更是在濱河造成了極大的恐慌曾沈,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,695評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件鸥昏,死亡現(xiàn)場(chǎng)離奇詭異塞俱,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)吏垮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)障涯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)罐旗,“玉大人,你說(shuō)我怎么就攤上這事唯蝶【判悖” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,130評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵粘我,是天一觀(guān)的道長(zhǎng)鼓蜒。 經(jīng)常有香客問(wèn)我,道長(zhǎng)征字,這世上最難降的妖魔是什么都弹? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,648評(píng)論 1 297
  • 正文 為了忘掉前任,我火速辦了婚禮匙姜,結(jié)果婚禮上畅厢,老公的妹妹穿的比我還像新娘。我一直安慰自己搁料,他們只是感情好或详,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,655評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著郭计,像睡著了一般霸琴。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上昭伸,一...
    開(kāi)封第一講書(shū)人閱讀 52,268評(píng)論 1 309
  • 那天梧乘,我揣著相機(jī)與錄音,去河邊找鬼庐杨。 笑死选调,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的灵份。 我是一名探鬼主播仁堪,決...
    沈念sama閱讀 40,835評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼填渠!你這毒婦竟也來(lái)了弦聂?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,740評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤氛什,失蹤者是張志新(化名)和其女友劉穎莺葫,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體枪眉,經(jīng)...
    沈念sama閱讀 46,286評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡捺檬,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,375評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了贸铜。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片堡纬。...
    茶點(diǎn)故事閱讀 40,505評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡聂受,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出隐轩,到底是詐尸還是另有隱情饺饭,我是刑警寧澤渤早,帶...
    沈念sama閱讀 36,185評(píng)論 5 350
  • 正文 年R本政府宣布职车,位于F島的核電站,受9級(jí)特大地震影響鹊杖,放射性物質(zhì)發(fā)生泄漏悴灵。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,873評(píng)論 3 333
  • 文/蒙蒙 一骂蓖、第九天 我趴在偏房一處隱蔽的房頂上張望积瞒。 院中可真熱鬧,春花似錦登下、人聲如沸茫孔。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,357評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)缰贝。三九已至,卻和暖如春畔濒,著一層夾襖步出監(jiān)牢的瞬間剩晴,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,466評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工侵状, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留赞弥,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,921評(píng)論 3 376
  • 正文 我出身青樓趣兄,卻偏偏與公主長(zhǎng)得像绽左,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子艇潭,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,515評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • Spring Web MVC Spring Web MVC 是包含在 Spring 框架中的 Web 框架拼窥,建立于...
    Hsinwong閱讀 22,435評(píng)論 1 92
  • 最近做的項(xiàng)目闯团,需要將一些信息導(dǎo)出到word中。在網(wǎng)上找了好多解決方案仙粱,現(xiàn)在將這幾天的總結(jié)分享一下房交。 目前來(lái)看,ja...
    代碼墨白閱讀 471評(píng)論 0 1
  • Spring Boot 參考指南 介紹 轉(zhuǎn)載自:https://www.gitbook.com/book/qbgb...
    毛宇鵬閱讀 46,855評(píng)論 6 342
  • FreeMarker的模板文件并不比HTML頁(yè)面復(fù)雜多少,FreeMarker模板文件主要由如下4個(gè)部分組成: 1...
    年輕小伙程序員閱讀 3,010評(píng)論 0 5
  • Spring Cloud為開(kāi)發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見(jiàn)模式的工具(例如配置管理伐割,服務(wù)發(fā)現(xiàn)候味,斷路器刃唤,智...
    卡卡羅2017閱讀 134,702評(píng)論 18 139