一舞吭、xml解析
注意:在解析xml文檔時(shí)如果有些內(nèi)容不想讓解析器解析兜畸,則可以使用<![CDATA[> …]]>將相關(guān)內(nèi)容包裹成CDATA區(qū)梧油。
1郑诺、解析方式
dom(文檔對(duì)象模型Document Object Model):是w3c組織推薦的處理xml的一種方式;實(shí)現(xiàn)起來(lái)很方便杉武,但是當(dāng)xml文件太大的時(shí)候辙诞,JVM很可能支持不了。JVM最大支持64M內(nèi)存轻抱。如果需要更大的內(nèi)存可以進(jìn)行修改飞涂。使用-Xmx80m可以改變支持內(nèi)存80M。一般我們使用此種方式解析祈搜。
Sax(Simple API for XML):不是官方標(biāo)準(zhǔn)较店,但是它是xml社區(qū)事實(shí)上的標(biāo)準(zhǔn),幾乎所有的xml解析器都支持它容燕。效率高梁呈,查找數(shù)據(jù)方便,但是不適合增刪改數(shù)據(jù)蘸秘。它是一行一行的解析官卡。查找時(shí)一般使用sax。
2醋虏、解析器
jaxp是標(biāo)準(zhǔn)寻咒,dom4j最好用。
3颈嚼、使用jaxp解析xml文檔
(1)調(diào)用DocumentBuilderFactory.newInstance()方法得到創(chuàng)建DOM解析器的工廠毛秘;
(2)調(diào)用工廠對(duì)象的newDocumentBuilder()方法得到DOM解析器對(duì)象;
(3)調(diào)用DOM解析器對(duì)象的parse()方法解析XML文檔阻课,得到代表整個(gè)文檔的Document對(duì)象熔脂,進(jìn)行可以利用DOM特性對(duì)整個(gè)XML文檔進(jìn)行操作了。
例子(工程jaxp):
xml/book.xml
<?xml version="1.0" encoding="UTF-8" standalone="no"?><書(shū)架>
<書(shū) name="yyy">
<售價(jià)>109</售價(jià)>
<售價(jià)>39元</售價(jià)>
<書(shū)名>Java就業(yè)培訓(xùn)教程</書(shū)名>
<作者>張孝祥</作者>
<售價(jià)>120</售價(jià)></書(shū)>
</書(shū)架>
src中
package cn.itcast;
import java.io.File;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Source;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class Demo1 {
public static void main(String[] args) throws Exception {
/*1.調(diào)用DocumentBuilderFactory.newInstance()方法得到創(chuàng)建DOM解析器的工廠柑肴;
2.調(diào)用工廠對(duì)象的newDocumentBuilder()方法得到DOM解析器對(duì)象;
3.調(diào)用DOM解析器對(duì)象的parse()方法解析XML文檔旬薯,得到代表整個(gè)文檔的*/
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("xml/book.xml"));
//read(document);
list(document);
}
//讀取文檔
private static void read(Document document) {
NodeList list = document.getElementsByTagName("售價(jià)");//取得所有的售價(jià)節(jié)點(diǎn)
Node price = list.item(0);//取第一個(gè)子節(jié)點(diǎn)晰骑,即價(jià)格
String value = price.getTextContent();//取得價(jià)格節(jié)點(diǎn)的文本內(nèi)容
System.out.println(value);
}
//對(duì)文檔進(jìn)行更新
@Test
public void update() throws Exception{
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("xml/book.xml"));
NodeList list = document.getElementsByTagName("售價(jià)");
Node price = list.item(0);
price.setTextContent("50");//設(shè)置價(jià)格節(jié)點(diǎn)的文本內(nèi)容
//注意:以上的操作都是在內(nèi)存中進(jìn)行操作,我們還需要將內(nèi)存中的內(nèi)容寫到xml文檔中
TransformerFactory t_factory = TransformerFactory.newInstance();//得到一個(gè)產(chǎn)生轉(zhuǎn)換器的工廠
Transformer transformer = t_factory.newTransformer();//得到一個(gè)轉(zhuǎn)換器
//transform的第一個(gè)參數(shù)是源绊序,第二個(gè)參數(shù)是目標(biāo)
transformer.transform(new DOMSource(document), new StreamResult(new File("xml/book.xml")));
}
//增加一個(gè)售價(jià)節(jié)點(diǎn)
@Test
public void add() throws Exception{
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("xml/book.xml"));
Node parent = document.getElementsByTagName("書(shū)").item(0);
//先要產(chǎn)生一個(gè)售價(jià)節(jié)點(diǎn)和其中的文本內(nèi)容
Node child = document.createElement("售價(jià)");
child.setTextContent("120");
parent.appendChild(child);
//還有一種插入的方法
//parent.insertBefore(child, document.getElementsByTagName("書(shū)名").item(0));
TransformerFactory t_factory = TransformerFactory.newInstance();
Transformer transformer = t_factory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult(new File("xml/book.xml")));
}
//刪除文檔的相關(guān)節(jié)點(diǎn)
@Test
public void delete() throws Exception{
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("xml/book.xml"));
NodeList list = document.getElementsByTagName("售價(jià)");
Node child = list.item(2);
child.getParentNode().removeChild(child);
TransformerFactory t_factory = TransformerFactory.newInstance();
Transformer transformer = t_factory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult(new File("xml/book.xml")));
}
//操作標(biāo)簽的屬性
@Test
public void updateAttribute() throws Exception{
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("xml/book.xml"));
Element element = (Element) document.getElementsByTagName("書(shū)").item(0);
element.setAttribute("name", "yyy");//可以用來(lái)增加屬性也可以用來(lái)改變已有屬性
TransformerFactory t_factory = TransformerFactory.newInstance();
Transformer transformer = t_factory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult(new File("xml/book.xml")));
}
//遍歷文檔
public static void list(Node node) throws Exception{
if(node.getNodeType() == Node.ELEMENT_NODE){//判斷當(dāng)前節(jié)點(diǎn)是不是元素
System.out.println(node.getNodeName());
}
NodeList list = node.getChildNodes();
for(int i = 0; i < list.getLength(); i++){
Node child = list.item(i);
list(child);
}
}
}