package per.qy.dexter.fileoperate;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.util.List;
import java.util.UUID;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.model.PicturesTable;
import org.apache.poi.hwpf.usermodel.Picture;
import org.apache.poi.ooxml.extractor.POIXMLTextExtractor;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFPictureData;
import org.junit.Test;
public class WordTest {
@Test
public void testWord() {
// String path = "D:\\temp\\temp\\test.doc";
String path = "D:\\temp\\temp\\test.docx";
String content = null;
File file = new File(path);
if (file.exists() && file.isFile()) {
InputStream is = null;
HWPFDocument doc = null;
XWPFDocument docx = null;
POIXMLTextExtractor extractor = null;
try {
is = new FileInputStream(file);
if (path.endsWith(".doc")) {
doc = new HWPFDocument(is);
// 文檔文本內(nèi)容
content = doc.getDocumentText();
// 文檔圖片內(nèi)容
PicturesTable picturesTable = doc.getPicturesTable();
List<Picture> pictures = picturesTable.getAllPictures();
for (Picture picture : pictures) {
// 輸出圖片到磁盤
OutputStream out = new FileOutputStream(
new File("D:\\temp\\" + UUID.randomUUID() + "." + picture.suggestFileExtension()));
picture.writeImageContent(out);
out.close();
}
} else if (path.endsWith("docx")) {
docx = new XWPFDocument(is);
extractor = new XWPFWordExtractor(docx);
// 文檔文本內(nèi)容
content = extractor.getText();
// 文檔圖片內(nèi)容
List<XWPFPictureData> pictures = docx.getAllPictures();
for (XWPFPictureData picture : pictures) {
byte[] bytev = picture.getData();
// 輸出圖片到磁盤
FileOutputStream out = new FileOutputStream(
"D:\\temp\\temp\\" + UUID.randomUUID() + picture.getFileName());
out.write(bytev);
out.close();
}
} else {
System.out.println("此文件不是word文件鹦聪!");
}
System.out.println(content);
} catch (FileNotFoundException e) {
} catch (IOException e) {
} finally {
try {
if (doc != null) {
doc.close();
}
if (extractor != null) {
extractor.close();
}
if (docx != null) {
docx.close();
}
if (is != null) {
is.close();
}
} catch (IOException e) {
}
}
}
}
}
java-poi4.0.1讀取word文本和圖片
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
- 文/潘曉璐 我一進(jìn)店門造成,熙熙樓的掌柜王于貴愁眉苦臉地迎上來显熏,“玉大人,你說我怎么就攤上這事晒屎〈。” “怎么了?”我有些...
- 文/不壞的土叔 我叫張陵鼓鲁,是天一觀的道長蕴轨。 經(jīng)常有香客問我,道長骇吭,這世上最難降的妖魔是什么橙弱? 我笑而不...
- 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上棘脐,老公的妹妹穿的比我還像新娘斜筐。我一直安慰自己,他們只是感情好蛀缝,可當(dāng)我...
- 文/花漫 我一把揭開白布顷链。 她就那樣靜靜地躺著,像睡著了一般屈梁。 火紅的嫁衣襯著肌膚如雪嗤练。 梳的紋絲不亂的頭發(fā)上,一...
- 文/蒼蘭香墨 我猛地睜開眼蝗碎,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了旗扑?” 一聲冷哼從身側(cè)響起蹦骑,我...
- 正文 年R本政府宣布脱吱,位于F島的核電站智政,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏箱蝠。R本人自食惡果不足惜续捂,卻給世界環(huán)境...
- 文/蒙蒙 一垦垂、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧疾忍,春花似錦乔外、人聲如沸。這莊子的主人今日做“春日...
- 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至聂渊,卻和暖如春差购,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背汉嗽。 一陣腳步聲響...
推薦閱讀更多精彩內(nèi)容
- 前兩天和一個妹子約飯陈惰,我問她是不是交男朋友了,在三亞的照片拍的挺好看呀毕籽。 什么呀抬闯,我談戀愛還能不告訴你呀,自拍的呀...
- 第一次認(rèn)識到CALayer是在某次面試時被問到“l(fā)ayer跟view是什么關(guān)系”,對layer的一些東西也在開發(fā)重...
- 我為何因為一頓飯選擇離婚 講述者百草記者劉冰 50歲開啟第二段人生,她以為用愛去擁抱勿负,回報她的必定也會是一個溫暖的...