Java DOM結(jié)合XPath快速解析XML文件

如果要定位某個XML文檔中的一段特性信息,那么通過遍歷DOM樹的眾多節(jié)點來進行查找顯得有些麻煩。XPath是的訪問樹節(jié)點變得很容易熬北。

需要先了解Java XML解析嚎京,可以參考Java驗證解析XML

場景

<bookstore>  
    <book id="book1">  
        <name>Java 核心技術(shù)</name>  
        <author>Cornell </author>  
        <year>2014</year>  
        <price>89</price>  
    </book>  
    <book id="book2">  
        <name>深入淺出MyBatis</name>  
        <author>楊開振</author>  
        <year>2016</year>  
        <price>69</price>  
    </book>  
    <book id="book3">  
        <name>Java RESTful Web Service實戰(zhàn)</name>  
        <author>韓陸</author>  
        <year>2016</year>  
        <price>59</price>
    </book>  
</bookstore>  

如果需要得到author節(jié)點,可以通過XPath表達式/bookstore/book/author來得到所有的author節(jié)點业舍。java代碼如下玖详。

/**
* @author gethin
* @version 創(chuàng)建時間:2018年4月8日 下午3:17:04
* 類說明
*/
public class ReadXMLByDOMWithXpath {
    private static DocumentBuilderFactory dBuilderFactory = null;
    private static DocumentBuilder dBuilder = null;
    private static XPathFactory xPathFactory = null;
    private static XPath xPath = null;
    static {
        try {
            /**
             * 要讀入一個XML文檔,首先要有一個DocumentBuilder對象 可以從DocumentBuilderFactory中得到這個對象
             */
            dBuilderFactory = DocumentBuilderFactory.newInstance();
            //設(shè)置驗證
            dBuilderFactory.setValidating(true);
            //忽略空白字符節(jié)點
            dBuilderFactory.setIgnoringElementContentWhitespace(true);
            dBuilder = dBuilderFactory.newDocumentBuilder();
            xPathFactory = XPathFactory.newInstance();
            xPath = xPathFactory.newXPath();
            dBuilder.setErrorHandler(new ErrorHandler() {

                public void warning(SAXParseException exception) throws SAXException {
                    throw exception;

                }

                public void fatalError(SAXParseException exception) throws SAXException {
                    // TODO Auto-generated method stub
                    throw exception;

                }

                public void error(SAXParseException exception) throws SAXException {
                    // TODO Auto-generated method stub
                    throw exception;
                }
            });
        } catch (ParserConfigurationException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
    //獲得所有的author節(jié)點并輸出
    public static void showAuthorByXPath(String fileName) throws SAXException, IOException, XPathExpressionException {
        Document document = dBuilder.parse(fileName);
        NodeList nodeList = (NodeList) xPath.evaluate("/bookstore/book/author", document, XPathConstants.NODESET);
        for (int i = 0; i < nodeList.getLength(); i++) {
            Element author = (Element) nodeList.item(i);
            System.out.println(author.getTextContent().trim());
        }
    }

    public static List<Book> listBooksWithXpath(String fileName)
            throws XPathExpressionException, SAXException, IOException {
        List<Book> books = new ArrayList<Book>();
        // 可通過DocumentBuilder對象的parse()方法讀入整個文檔
        Document document = dBuilder.parse(fileName);
        // 獲得所有book節(jié)點
        NodeList nodeList = (NodeList) xPath.evaluate("/bookstore/book", document, XPathConstants.NODESET);
        for (int i = 0; i < nodeList.getLength(); i++) {
            Element bookElement = (Element) nodeList.item(i);
            // 獲得該book節(jié)點下的所有屬性節(jié)點
            NodeList bookAttribute = bookElement.getChildNodes();
            // 用來存儲第i個節(jié)點的內(nèi)容
            List<String> bookContent = new ArrayList<String>();
            Book book = new Book();
            book.setId(Integer.parseInt(bookElement.getAttribute("id").replace("book", "").trim()));
            for (int j = 0; j < bookAttribute.getLength(); j++) {
                Element atturbute = (Element) bookAttribute.item(j);
                bookContent.add(atturbute.getTextContent().trim());
            }
            book.setName(bookContent.get(0));
            book.setAuthor(bookContent.get(1));
            book.setYear(Integer.parseInt(bookContent.get(2)));
            book.setPrice(Integer.parseInt(bookContent.get(3)));
            books.add(book);
        }
        return books;
    }

    public static void main(String args[]) {
        String fileName = "./src/main/java/com/gethin/xmlparser/bookstore.xml";
        try {
             List<Book> books = ReadXMLByDOMWithXpath.listBooksWithXpath(fileName);
             for (Book book : books) {
             System.out.println(book);
             }
            showAuthorByXPath(fileName);
        } catch (Exception e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
}

運行截圖:


DOM結(jié)合XPath解析XML文檔

請參考勤讽,源碼github鏈接

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蟋座,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子脚牍,更是在濱河造成了極大的恐慌向臀,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件诸狭,死亡現(xiàn)場離奇詭異券膀,居然都是意外死亡,警方通過查閱死者的電腦和手機驯遇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,755評論 3 385
  • 文/潘曉璐 我一進店門芹彬,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人叉庐,你說我怎么就攤上這事舒帮。” “怎么了陡叠?”我有些...
    開封第一講書人閱讀 158,369評論 0 348
  • 文/不壞的土叔 我叫張陵玩郊,是天一觀的道長。 經(jīng)常有香客問我枉阵,道長译红,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,799評論 1 285
  • 正文 為了忘掉前任兴溜,我火速辦了婚禮侦厚,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘拙徽。我一直安慰自己刨沦,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,910評論 6 386
  • 文/花漫 我一把揭開白布斋攀。 她就那樣靜靜地躺著已卷,像睡著了一般。 火紅的嫁衣襯著肌膚如雪淳蔼。 梳的紋絲不亂的頭發(fā)上侧蘸,一...
    開封第一講書人閱讀 50,096評論 1 291
  • 那天裁眯,我揣著相機與錄音,去河邊找鬼讳癌。 笑死穿稳,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的晌坤。 我是一名探鬼主播逢艘,決...
    沈念sama閱讀 39,159評論 3 411
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼骤菠!你這毒婦竟也來了它改?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,917評論 0 268
  • 序言:老撾萬榮一對情侶失蹤商乎,失蹤者是張志新(化名)和其女友劉穎央拖,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體鹉戚,經(jīng)...
    沈念sama閱讀 44,360評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡鲜戒,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,673評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了抹凳。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片遏餐。...
    茶點故事閱讀 38,814評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖赢底,靈堂內(nèi)的尸體忽然破棺而出失都,到底是詐尸還是另有隱情,我是刑警寧澤颖系,帶...
    沈念sama閱讀 34,509評論 4 334
  • 正文 年R本政府宣布嗅剖,位于F島的核電站,受9級特大地震影響嘁扼,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜黔攒,卻給世界環(huán)境...
    茶點故事閱讀 40,156評論 3 317
  • 文/蒙蒙 一趁啸、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧督惰,春花似錦不傅、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至觉阅,卻和暖如春崖疤,著一層夾襖步出監(jiān)牢的瞬間秘车,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,123評論 1 267
  • 我被黑心中介騙來泰國打工劫哼, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留叮趴,地道東北人。 一個月前我還...
    沈念sama閱讀 46,641評論 2 362
  • 正文 我出身青樓权烧,卻偏偏與公主長得像眯亦,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子般码,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,728評論 2 351

推薦閱讀更多精彩內(nèi)容

  • 【引言】 目前在Java中用于解析XML的技術(shù)很多琢蛤,主流的有DOM、SAX抛虏、JDOM博其、DOM4j,下文主要介紹這4...
    低至一折起閱讀 1,060評論 0 7
  • ···lxml用法源自 lxml python 官方文檔迂猴,更多內(nèi)容請直接參閱官方文檔慕淡,本文對其進行翻譯與整理。lx...
    小豐豐_72a2閱讀 950評論 0 1
  • 非本人所寫沸毁,在學(xué)習(xí)的時候覺得寫的挺詳細(xì)的峰髓。分享一下。 XML文件是一種常用的文件格式息尺,例如WinForm里面的ap...
    畢竟是秀秀啊閱讀 2,665評論 0 2
  • 三年前的春節(jié),我完成了一件很重要的事情,那就是嘗試用一天的時間讀完一本書并级。 我讀的第一本就是奧巴馬的傳記拂檩,差不多有...
    宇楓Sai閱讀 1,173評論 1 0
  • 今天天氣晴朗,冬日里暖日怒放死遭,銀杏葉越加發(fā)黃的美麗广恢! 感覺有些沮喪,后悔之前不知道要進步呀潭,現(xiàn)在感覺牛人太多钉迷,自己做...
    林溪amanda閱讀 105評論 0 0