前言:公司的APP很早就有了,之前的接口結(jié)果處理都是通過XML的方式兑徘,并且在項(xiàng)目中刚盈,每個(gè)人處理XML的方式各種各樣,沒有統(tǒng)一的處理方式挂脑,所以在運(yùn)用中很苦惱藕漱,所以樓主每次在項(xiàng)目開發(fā)中,為了節(jié)省自己的時(shí)間崭闲,不在研究其他人員XML的解析方式肋联,只要遇到XML的地方,樓主就用DOM4J的方式解析刁俭。
關(guān)于XML的解析方式有好多種橄仍,DOM、SAX、JDOM等等侮繁,至于用法和原理這里就不在說了(ps:樓主也不知道用法和原理)虑粥。這篇文章主要說說DOM4J的簡單操作和用法。
DOM4J介紹
dom4j是一個(gè)Java的XML API宪哩,是jdom的升級品娩贷,用來讀寫XML文件的。dom4j是一個(gè)十分優(yōu)秀的JavaXML API锁孟,具有性能優(yōu)異彬祖、功能強(qiáng)大和極其易使用的特點(diǎn),它的性能超過sun公司官方的dom技術(shù)品抽,同時(shí)它也是一個(gè)開放源代碼的軟件储笑,可以在SourceForge上找到它。
Dom4j是一個(gè)易用的桑包、開源的庫南蓬,用于XML纺非,XPath和XSLT哑了。它應(yīng)用于Java平臺(tái),采用了Java集合框架并完全支持DOM烧颖,SAX和JAXP弱左。
這里用一個(gè)簡單的例子來介紹DOM4J的用法。
注意:使用DOM4J解析XML炕淮,需要在項(xiàng)目中引入DOM4J的jar包拆火。下載地址
XML文件
<Response T='203' T1='6' TaskID='20130800001963' MediaNum='3' Result = '1' Desc='查詢成功!' >
<Media Name='IMG_20130425_141838.jpg' Mediasource ='1' Type ='1' Code='/9j/4AAQSkZJRgABAQA0'>圖片1</Media>
<Media Name='IMG_20130425_141838.jpg' Mediasource ='2' Type ='1' Code='/9j/4AAQSkZJRgABAQA0'>圖片2</Media>
<Media Name='IMG_20130425_141838.jpg' Mediasource ='3' Type ='1' Code='/9j/4AAQSkZJRgABAQA0'>圖片3</Media>
</Response>
DOM4J使用詳解
步驟1:加載xml文件
加載xml可以分為主要的兩種方式
1、直接加載文件所在的路徑地址
2涂圆、加載字符串形式的xml(此方式主要是用在服務(wù)器返回結(jié)果中)
1.1们镜、直接加載文件路徑
SAXReader reader = new SAXReader();
Document document = null;
try {
document = reader.read(new File("E:\\CZBK\\day01\\caseUp.xml"));
} catch (DocumentException e) {
e.printStackTrace();
}
1.2、加載字符串形式的xml
SAXReader reader = new SAXReader();
Document document = null;
try {
//result是需要解析的字符串
//解析字符串需要轉(zhuǎn)換成流的形式润歉,可以指定轉(zhuǎn)換字符編碼
document = reader.read(new ByteArrayInputStream(result.getBytes("UTF-8")));
} catch (DocumentException e) {
e.printStackTrace();
}
步驟2:解析XML
在解析XML之前模狭,我們先來介紹下XML的結(jié)構(gòu)稱呼,清楚下面4個(gè)問題對解析XML很有幫助
什么是節(jié)點(diǎn)(node)踩衩?什么是元素(element)嚼鹉?什么是屬性(attribute)?什么是文本值(value)驱富?
節(jié)點(diǎn):“Response”锚赤、“Media”這些稱之為節(jié)點(diǎn)
元素:以一個(gè)完整的標(biāo)簽結(jié)束稱之為元素,包含整個(gè)元素內(nèi)容褐鸥。例如:<Media Name='IMG_20130425_141838.jpg' Mediasource ='1' Type ='1' Code='/9j/4AAQSkZJRgABAQA0'>圖片1</media》
屬性:節(jié)點(diǎn)的屬性值线脚,對節(jié)點(diǎn)內(nèi)容加之說明。例如:T='203' T1='6' TaskID='20130800001963' MediaNum='3' Result = '1' Desc='查詢成功!'
文本值:“圖片1”稱之為文本值。
在項(xiàng)目中無非就是圍繞元素浑侥、屬性和文本值進(jìn)行操作又憨,所以掌握好這三部分的取值方法,也就掌握了XML解析锭吨。
2.1蠢莺、獲取根節(jié)點(diǎn)
//獲取整個(gè)文檔
Element rootElement = document.getRootElement();
rootElement包含整個(gè)xml文檔的內(nèi)容,也就是Response標(biāo)簽包含的所有內(nèi)容
2.2零如、獲取Response節(jié)點(diǎn)的屬性值
//獲取Response節(jié)點(diǎn)的Result屬性值
String responseResult = rootElement.attributeValue("Result");
2.3躏将、獲取Media元素
//獲取第一個(gè)Media元素
Element mediaElement = rootElement.element("Media");
//獲取所有的Media元素
List allMeidaElements = rootElement.elements("Media");
2.4、獲取Media屬性值
//獲取第一個(gè)Media元素的Name屬性值
String mediaName = mediaElement.attributeValue("Name");
//遍歷所有的Media元素的Name屬性值
for (int i = 0; i < allMeidaElements.size(); i++) {
Element element = (Element) allMeidaElements.get(i);
String name = element.attributeValue("Name");
}
2.5考蕾、獲取Media標(biāo)簽的文本值
//獲取第一個(gè)Meida元素的文本值
String value = mediaElement.getText();
完整代碼
import java.io.File;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class Textxml {
public void xml() {
SAXReader reader = new SAXReader();
Document document = null;
try {
document = reader.read(new File("E:\\CZBK\\day01\\caseUp.xml"));
} catch (DocumentException e) {
e.printStackTrace();
}
//獲取整個(gè)文檔
Element rootElement = document.getRootElement();
System.out.println("整個(gè)文檔:"+rootElement.asXML());
//獲取Response節(jié)點(diǎn)的Result屬性值
String responseResult = rootElement.attributeValue("Result");
System.out.println("Response節(jié)點(diǎn)的Result屬性值:"+responseResult);
//獲取第一個(gè)Media元素
Element mediaElement = rootElement.element("Media");
System.out.println("第一個(gè)Media元素:"+mediaElement.asXML());
//獲取所有的Media元素
List allMeidaElements = rootElement.elements("Media");
//獲取第一個(gè)Media元素的Name屬性值
String mediaName = mediaElement.attributeValue("Name");
System.out.println("第一個(gè)Media元素的Name屬性值:"+mediaName);
//遍歷所有的Media元素的Name屬性值
for (int i = 0; i < allMeidaElements.size(); i++) {
Element element = (Element) allMeidaElements.get(i);
String name = element.attributeValue("Name");
}
//獲取第一個(gè)Meida元素的文本值
String value = mediaElement.getText();
System.out.println("第一個(gè)Meida元素的文本值:"+value);
}
public static void main(String[] args) {
Textxml textxml = new Textxml();
textxml.xml();
}
}
運(yùn)行結(jié)果
整個(gè)文檔:<Response T="203" T1="6" TaskID="20130800001963" MediaNum="3" Result="1" Desc="查詢成功!">
<Media Name="IMG_20130425_141838.jpg" Mediasource="1" Type="1" Code="/9j/4AAQSkZJRgABAQA0">圖片1</Media>
<Media Name="IMG_20130425_141838.jpg" Mediasource="2" Type="1" Code="/9j/4AAQSkZJRgABAQA0">圖片2</Media>
<Media Name="IMG_20130425_141838.jpg" Mediasource="3" Type="1" Code="/9j/4AAQSkZJRgABAQA0">圖片3</Media>
</Response>
Response節(jié)點(diǎn)的Result屬性值:1
第一個(gè)Media元素:<Media Name="IMG_20130425_141838.jpg" Mediasource="1" Type="1" Code="/9j/4AAQSkZJRgABAQA0">圖片1</Media>
第一個(gè)Media元素的Name屬性值:IMG_20130425_141838.jpg
第一個(gè)Meida元素的文本值:圖片1
后記
1祸憋、XML解析方式有很多中,未必每種都要掌握肖卧,把其中的一種解析弄清楚就夠用了蚯窥,至于性能上的差別樓主體會(huì)不出來,也不能解答這個(gè)問題
2塞帐、DOM4J的API有很多拦赠,這篇文章中只是介紹了最基本的最常用的幾種,如果有興趣可以自行研究使用