poi讀取word(doc,docx)表格,針對自己的表格合并單元格

image.png
package com.zt.haide.util.easyWord;

import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.usermodel.*;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.apache.poi.xwpf.usermodel.*;

import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;

public class ReadWordTable {
    public static void main(String[] args) {
        String path = "C:\\Users\\Administrator\\Desktop\\lzq1.doc";
        List<List<String>> lists = readWord(path);
        lists.forEach(list->{
            System.out.println("-------");
            list.forEach(str-> System.out.println(str));});
    }


    /**
     * 讀word的表格
     * @param path
     * @return
     */
    public static List<List<String>> readWord(String path){
        List<List<String>> list = new ArrayList<>();
        try {
            File file = new File(path);
            HashMap<String, String> map = new HashMap<>();
            map.put("str1", "");
            map.put("str2", "");
            map.put("str3", "");
            map.put("str4", "");
            InputStream is = new FileInputStream(file);
            if(path.toLowerCase().endsWith("docx")) {
            XWPFDocument docx = new XWPFDocument(is);
                List<XWPFTable> tables = docx.getTables();
                //遍歷word內的表格
                for (int i = 0; i < 1; i++) {
                    XWPFTable table = tables.get(i);
                    //讀取每一行數(shù)據(jù)

                    for (int j = 0; j < table.getNumberOfRows(); j++) {
                        if (j >= 1) {

                            List<String> stringList = new ArrayList<>();
                            //讀取表格的某一行的所有數(shù)據(jù)
                            XWPFTableRow row = table.getRow(j);
                            //讀取每一列的數(shù)據(jù)
                            List<XWPFTableCell> cells = row.getTableCells();
                            String text = "";
                            for (int k = 0; k < 4; k++) {
                                XWPFTableCell cell = cells.get(k);
                                List<XWPFParagraph> paragraphs1 = cell.getParagraphs();
                                text = "";
                                if (paragraphs1.size() <= 1) {
                                    //一格一條數(shù)據(jù)
                                    text = cell.getText();
                                } else if (paragraphs1.size() > 1) {
                                    //一格多條數(shù)據(jù)
                                    //表格內含有多個人的時候處理
                                    text = "";
                                    for (int h = 0; h < paragraphs1.size(); h++) {
                                        XWPFParagraph xwpfParagraph = paragraphs1.get(h);
                                        List<XWPFRun> runs = xwpfParagraph.getRuns();
//                                    if (h > 0){
//                                        text += ",";
//                                    }
                                        if (runs.size() > 1) {
                                            for (int b = 0; b < runs.size(); b++) {
                                                XWPFRun xwpfRun = runs.get(b);
                                                text += xwpfRun.getText(0);
                                            }
                                        } else {
                                            for (XWPFRun run : runs) {
                                                text += run.getText(0);
                                            }
                                        }
                                    }
                                }

                                if (("").equals(text)) {
                                    String s = map.get("str" + k);
                                    text = s;
                                }
                                map.put("str" + k, text);
                                stringList.add(text);
                            }
                            list.add(stringList);
                        }
                    }
                }
            }else {

                // 處理doc格式 即office2003版本
                POIFSFileSystem pfs = new POIFSFileSystem(is);
                HWPFDocument hwpf = new HWPFDocument(pfs);
                Range range = hwpf.getRange();//得到文檔的讀取范圍
                TableIterator it = new TableIterator(range);
                // 迭代文檔中的表格
                // 如果有多個表格只讀取需要的一個 set是設置需要讀取的第幾個表格量承,total是文件中表格的總數(shù)
                int set = 1, total = 4;
                int num = set;
                for (int i = 0; i < set - 1; i++) {
                    it.hasNext();
                    it.next();
                }
                while (it.hasNext()) {
                    Table tb = (Table) it.next();
                    //迭代行膜宋,默認從0開始,可以依據(jù)需要設置i的值,改變起始行數(shù)幌蚊,也可設置讀取到那行,只需修改循環(huán)的判斷條件即可
                    for (int i = 1; i < tb.numRows(); i++) {
                        ArrayList<String> strings = new ArrayList<>();
                        TableRow tr = tb.getRow(i);
                        //迭代列忽冻,默認從0開始
                        for (int j = 0; j < 4; j++) {
                            TableCell td = tr.getCell(j);//取得單元格
                            //取得單元格的內容
                            String text="";
                            for (int k = 0; k < td.numParagraphs(); k++) {
                                Paragraph para = td.getParagraph(k);
                                String s = para.text();
                                //去除后面的特殊符號
                                if (null != s && !"".equals(s)) {
                                    s = s.substring(0, s.length() - 1);
                                }
                                text+=s;
                            }
                            if (("").equals(text)) {
                                String s = map.get("str" + j);
                                text = s;
                            }
                            map.put("str" + j, text);
                            strings.add(text);
                        }
                        list.add(strings);
                    }
                    // 過濾多余的表格
                    while (num < total) {
                        it.hasNext();
                        it.next();
                        num += 1;
                    }

                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
        return list;
    }

    /**
     * 獲取文檔中備注(讀取Word段落的內容)
     * @param paragraphs
     * @return
     */
    public static String getNotes(List<XWPFParagraph> paragraphs){
        XWPFParagraph para = paragraphs.get(3);
        String notes = "";
        List<XWPFRun> runList = para.getRuns();
        if (runList.size() > 0) {
            for (XWPFRun r : runList) {
                notes += r.getText(0);
            }
            System.out.println("備注*:" + notes);
        }else {
            System.out.println("備注*:" + notes);
        }
        return notes;
    }
}
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市逾冬,隨后出現(xiàn)的幾起案子锥余,更是在濱河造成了極大的恐慌,老刑警劉巖源葫,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件诗越,死亡現(xiàn)場離奇詭異,居然都是意外死亡息堂,警方通過查閱死者的電腦和手機嚷狞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來荣堰,“玉大人床未,你說我怎么就攤上這事≌窦幔” “怎么了薇搁?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長渡八。 經(jīng)常有香客問我啃洋,道長传货,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任宏娄,我火速辦了婚禮问裕,結果婚禮上,老公的妹妹穿的比我還像新娘孵坚。我一直安慰自己僻澎,他們只是感情好,可當我...
    茶點故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布十饥。 她就那樣靜靜地躺著,像睡著了一般祖乳。 火紅的嫁衣襯著肌膚如雪逗堵。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天眷昆,我揣著相機與錄音蜒秤,去河邊找鬼。 笑死亚斋,一個胖子當著我的面吹牛作媚,可吹牛的內容都是我干的。 我是一名探鬼主播帅刊,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼纸泡,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了赖瞒?” 一聲冷哼從身側響起女揭,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎栏饮,沒想到半個月后吧兔,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡袍嬉,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年境蔼,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片伺通。...
    茶點故事閱讀 40,680評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡箍土,死狀恐怖,靈堂內的尸體忽然破棺而出罐监,到底是詐尸還是另有隱情涮帘,我是刑警寧澤,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布笑诅,位于F島的核電站调缨,受9級特大地震影響疮鲫,放射性物質發(fā)生泄漏。R本人自食惡果不足惜弦叶,卻給世界環(huán)境...
    茶點故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一俊犯、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧伤哺,春花似錦燕侠、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至蜓耻,卻和暖如春茫舶,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背刹淌。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工饶氏, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人有勾。 一個月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓疹启,卻偏偏與公主長得像,于是被迫代替她去往敵國和親蔼卡。 傳聞我的和親對象是個殘疾皇子喊崖,可洞房花燭夜當晚...
    茶點故事閱讀 45,691評論 2 361

推薦閱讀更多精彩內容