XML的解析技術(shù)

Xml解析方式分為兩種:

1.dom
document object model 即文檔對象模型,它是w3c組織推薦的解析xml的一種方式。

2.sax
simple api for xml 不是官方標(biāo)準(zhǔn),它是xml 社區(qū)事實上的標(biāo)準(zhǔn)吮铭,幾乎所有的xml解析器都支持它


Jaxp解析
Java api for xml programming 是sun公司的一套操作xml的API. Jaxp很好的支持了dom與sax解析方式。Jaxp開發(fā)包是javase的一部分,它是由javax.xml org.w3c.domoirg.xml.saq包及其子包組成
需要類:DocumentBuilderFactory
DocumentBuilder
Document element node 這三個屬性是理解xml的關(guān)鍵類栅表,分別指dom, 元素,<node> </node> 開頭的內(nèi)容

  • 要xml文件代碼
<?xml version="1.0" encoding="UTF-8"?>

<bookstore>
    <book catgrory="computer">
        <title>java從入門到放棄</title>
        <author>王二</author>
        <year>1009</year>
        <price>43.5</price>
    </book>
    <book catgrory="story">
        <title>mysql從入門到放棄</title>
        <author>龍達</author>
        <year>2011</year>
        <price>23.5</price>
    </book>
    
</bookstore>
  • dom代碼
    當(dāng)出現(xiàn)了#text ........ 是由于文檔間空格換行师枣,需要寫邏輯進行處理怪瓶。
package org.dgw.net;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class demo1 {
    public static void main(String[] args) throws ParserConfigurationException,
            FileNotFoundException, SAXException, IOException {
        // 構(gòu)建dom解析工廠
        DocumentBuilderFactory dom = DocumentBuilderFactory.newInstance();
        // 得到解決對象
        DocumentBuilder builder = dom.newDocumentBuilder();
        // 拿到dom對象
        Document document = builder
                .parse(new FileInputStream(new File("d://xmldemo.xml")));
        // 獲取根節(jié)點
        Element root = document.getDocumentElement();
        System.out.println(root.getNodeName());

        // 讀取database節(jié)點NodeList接口提供對節(jié)點的有序集合的抽象
        NodeList nodeList = root.getElementsByTagName("book");
        for (int i = 0; i < nodeList.getLength(); i++) {
            // 獲取一個節(jié)點
            Node node = nodeList.item(i);
            // 獲取該節(jié)點所有屬性
            NamedNodeMap attributes = node.getAttributes();
            for (int j = 0; j < attributes.getLength(); j++) {
                Node attribute = attributes.item(j);
                System.out.println(attribute.getNodeName() + ":"
                        + attribute.getNodeValue());
            }
            // 獲取所有子節(jié)點數(shù)據(jù)
            NodeList childNodes = node.getChildNodes();
            for (int j = 0; j < childNodes.getLength(); j++) {
                Node childNode = childNodes.item(j);
                if (childNode.getNodeType()==Document.ELEMENT_NODE) {
                    System.out.println(childNode.getNodeName() + ":"
                            + childNode.getTextContent());
                }
            }
        }
    }
}

  • 生成一個簡單文檔

類:TransformerFactory Transformer DOMSource StreamResult

package org.xml.tech;

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.TransformerFactoryConfigurationError;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;

public class domcreate {
    private static File file;
    private final static String path = "D://demo.xml";

    public static void main(String[] args) throws ParserConfigurationException,
            Exception, TransformerFactoryConfigurationError {
        DocumentBuilder builder = DocumentBuilderFactory.newInstance()
                .newDocumentBuilder();
        Document dom = builder.newDocument();
        // 標(biāo)注xml信息
        dom.setXmlVersion("1.0");
        dom.setXmlStandalone(true);
        // 開始構(gòu)建
        Element root = dom.createElement("root");
        root.setAttribute("lang", "zh");
        dom.appendChild(root);
        // 子節(jié)點
        Element book = dom.createElement("book");
        Element title = dom.createElement("title");
        String textContent = "hell wold";
        title.setTextContent(textContent);
        book.appendChild(title);
        root.appendChild(book);
        createXml(dom);

    }

    private static void createXml(Node dom)
            throws TransformerFactoryConfigurationError, TransformerException {
        Transformer transformer = TransformerFactory.newInstance()
                .newTransformer();
        DOMSource source = new DOMSource(dom);
        file = new File(path);
        StreamResult result = new StreamResult(file);
        transformer.transform(source, result);

    }
}


Sax解析
Sax是基于事件驅(qū)動(事件是預(yù)定義的,讀到什么內(nèi)容即可觸發(fā)相關(guān)事件)的方式來對xml進行處理践美。Sax它只能進行讀操作洗贰。它是讀取一行解析一行。大的xml文檔采用此讀取方式陨倡,是不可往復(fù)的敛滋,不可逆的

相關(guān)類: SAXParserFactory SAXParser XMLReader ContentHandler DefaultHandler

package org.xml.tech;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;

public class SaxDemo {
    public static void main(String[] args) throws ParserConfigurationException,
            SAXException, FileNotFoundException, IOException {
        SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
        XMLReader reader = parser.getXMLReader();
        reader.setContentHandler(new DefaultHandler() {

            @Override
            public void startDocument() throws SAXException {
                System.out.println("開始解析");
            }

            @Override
            public void endDocument() throws SAXException {
                System.out.println("結(jié)束解析");
            }

            @Override
            public void startElement(String uri, String localName, String qName,
                    Attributes attributes) throws SAXException {
                System.out.println("開始解析節(jié)點[" + qName + "]...");
                System.out.println("共有[" + attributes.getLength() + "]個屬性");
            }

            @Override
            public void characters(char[] ch, int start, int length)
                    throws SAXException {
                // 內(nèi)容解析
                /*
                 * String string = new String(ch, start, length);
                 * System.out.println(string);
                 */
                System.out.println(start);
                System.out.println(length);
                String string = new String(ch);
                System.out.println(string);

            }

            @Override
            public void endElement(String uri, String localName, String qName)
                    throws SAXException {
                System.out.println("結(jié)束解析XML節(jié)點...");
            }

        });
        // 文件源必須寫在末尾
        reader.parse(
                new InputSource(new FileInputStream(new File("D://demo.xml"))));
    }

}


Dom4j介紹
Dom4j它是一個優(yōu)秀操作xml的工具,在很開源的框架中大量使用dom4j, 例如Struts2 hibernate sping框架玫膀。dom4j是一個簡單的開源庫矛缨,用于處理XML、 XPath和XSLT帖旨,它基于Java平臺箕昭,使用Java的集合框架,全面集成了DOM解阅,SAX和JAXP落竹,是目前比較流行XML文檔解析方法。

要想使用dom4j必須下載dom4j jar包才可以使用货抄。
鏈接:::http://www.dom4j.org/dom4j-1.6.1/

package org.xml.tech;

import java.io.FileOutputStream;
import java.util.List;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;

public class Dom4jHandler {
    public void add() throws Exception {
        // 1.創(chuàng)建一個Document
        Document document = DocumentHelper.createDocument();
        // 2.給Document添加數(shù)據(jù)
        Element root = document.addElement("DataSource");
        // 添加注釋
        root.addComment("這是注釋信息");
        // 在root根節(jié)點下面添加一個子節(jié)點
        Element database = root.addElement("database");
        database.addAttribute("name", "mysql");
        database.addAttribute("version", "5.0");
        // 添加子節(jié)點
        database.addElement("driver").setText("com.mysql.jdbc.Driver");
        database.addElement("url")
                .setText("jdbc:mysql://localhost:3306/myjdbc");
        database.addElement("user").setText("root");
        database.addElement("password").setText("root");
        // 3.將Document寫出文件
        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");
        // FileOutputStream默認生成的路徑在根路徑
        XMLWriter xw = new XMLWriter(new FileOutputStream("db.xml"), format);
        xw.write(document);
        xw.close();
    }

    public void update(String fileName) throws Exception {
        // sax解析器
        SAXReader saxReader = new SAXReader();
        // 讀到對象
        Document document = saxReader
                .read(this.getClass().getResourceAsStream("/" + fileName));
        Element root = document.getRootElement();
        List<Element> databases_node = root.elements("database");
        for (Element database_node : databases_node) {
            if (database_node.attributeValue("name")
                    .equalsIgnoreCase("mysql")) {
                System.out
                        .println("old:" + database_node.attributeValue("name"));
                database_node.attribute("name").setText("Oracle");
                System.out.println(
                        "update:" + database_node.attributeValue("name"));

                database_node.element("driver").setText("oracel");
                database_node.element("url").setText("jdbc");

                // 刪除password節(jié)點
                database_node.remove(database_node.element("password"));

                // 刪除屬性
                database_node.remove(database_node.attribute("version"));
            }
        }

        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");
        // FileOutputStream默認生成的路徑在根路徑
        XMLWriter xw = new XMLWriter(new FileOutputStream("db2.xml"), format);
        xw.write(document);
        xw.close();
    }

    public void read(String fileName) throws Exception {
        // sax解析器
        SAXReader saxReader = new SAXReader();
        // 讀到對象
        Document document = saxReader
                .read(this.getClass().getResourceAsStream("/" + fileName));
        Element root = document.getRootElement();
        System.out.println("根節(jié)點:" + root.getName());

        // List<Element> childElements=root.elements();
        List<Element> childElements = root.elements("database");
        for (Element child : childElements) {
            // 獲取屬性 不知道屬性名稱時的遍歷方法
            List<Attribute> attributes = child.attributes();
            // for (Attribute attribute : attributes) {
            // System.out.println(attribute.getName()+":"+attribute.getValue());
            // }
            String name = child.attributeValue("name");
            // String version = child.attributeValue("version");
            String version = child.attribute("version").getValue();
            System.out.println(name + ":" + version);

            // //獲取子節(jié)點
            // List<Element> childs=child.elements();
            // for (Element element : childs) {
            // System.out.println(element.getName()+":"+element.getText());
            // }
            System.out.println(child.elementText("driver"));
            System.out.println(child.element("url").getText());
            System.out.println(child.elementTextTrim("user"));
            System.out.println(child.element("password").getTextTrim());

        }
    }

    public static void main(String[] args) throws Exception {
        // new Dom4jHandler().read("data-source.xml");
        // new Dom4jHandler().add();
        new Dom4jHandler().update("data-source.xml");
    }
}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末述召,一起剝皮案震驚了整個濱河市朱转,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌积暖,老刑警劉巖藤为,帶你破解...
    沈念sama閱讀 219,270評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異夺刑,居然都是意外死亡缅疟,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評論 3 395
  • 文/潘曉璐 我一進店門遍愿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來存淫,“玉大人,你說我怎么就攤上這事沼填∥ε兀” “怎么了?”我有些...
    開封第一講書人閱讀 165,630評論 0 356
  • 文/不壞的土叔 我叫張陵坞笙,是天一觀的道長岩饼。 經(jīng)常有香客問我,道長羞海,這世上最難降的妖魔是什么忌愚? 我笑而不...
    開封第一講書人閱讀 58,906評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮却邓,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘院水。我一直安慰自己腊徙,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,928評論 6 392
  • 文/花漫 我一把揭開白布檬某。 她就那樣靜靜地躺著撬腾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪恢恼。 梳的紋絲不亂的頭發(fā)上民傻,一...
    開封第一講書人閱讀 51,718評論 1 305
  • 那天,我揣著相機與錄音场斑,去河邊找鬼漓踢。 笑死,一個胖子當(dāng)著我的面吹牛漏隐,可吹牛的內(nèi)容都是我干的喧半。 我是一名探鬼主播,決...
    沈念sama閱讀 40,442評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼青责,長吁一口氣:“原來是場噩夢啊……” “哼挺据!你這毒婦竟也來了取具?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,345評論 0 276
  • 序言:老撾萬榮一對情侶失蹤扁耐,失蹤者是張志新(化名)和其女友劉穎暇检,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體婉称,經(jīng)...
    沈念sama閱讀 45,802評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡占哟,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,984評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了酿矢。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片榨乎。...
    茶點故事閱讀 40,117評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖瘫筐,靈堂內(nèi)的尸體忽然破棺而出蜜暑,到底是詐尸還是另有隱情,我是刑警寧澤策肝,帶...
    沈念sama閱讀 35,810評論 5 346
  • 正文 年R本政府宣布肛捍,位于F島的核電站,受9級特大地震影響之众,放射性物質(zhì)發(fā)生泄漏拙毫。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,462評論 3 331
  • 文/蒙蒙 一棺禾、第九天 我趴在偏房一處隱蔽的房頂上張望缀蹄。 院中可真熱鬧,春花似錦膘婶、人聲如沸缺前。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽衅码。三九已至,卻和暖如春脊岳,著一層夾襖步出監(jiān)牢的瞬間逝段,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評論 1 272
  • 我被黑心中介騙來泰國打工割捅, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留奶躯,地道東北人。 一個月前我還...
    沈念sama閱讀 48,377評論 3 373
  • 正文 我出身青樓棺牧,卻偏偏與公主長得像巫糙,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子颊乘,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,060評論 2 355

推薦閱讀更多精彩內(nèi)容