XML

XML:

  1. 概念:Extensible Markup Language 可擴(kuò)展標(biāo)記語(yǔ)言
    • 可擴(kuò)展:標(biāo)簽都是自定義的穷当。

    • 功能

      • 存儲(chǔ)數(shù)據(jù)
        1. 配置文件
        2. 在網(wǎng)絡(luò)中傳輸
    • xml與html的區(qū)別

      1. xml標(biāo)簽都是自定義的,html標(biāo)簽是預(yù)定義茴扁。
      2. xml的語(yǔ)法嚴(yán)格汪疮,html語(yǔ)法松散
      3. xml是存儲(chǔ)數(shù)據(jù)的,html是展示數(shù)據(jù)
    • w3c:萬(wàn)維網(wǎng)聯(lián)盟


  1. 語(yǔ)法
    • 基本語(yǔ)法:

      1. xml文檔的后綴名 .xml
      2. xml第一行必須定義為文檔聲明
      3. xml文檔中有且僅有一個(gè)根標(biāo)簽
      4. 屬性值必須使用引號(hào)(單雙都可)引起來(lái)
      5. 標(biāo)簽必須正確關(guān)閉
      6. xml標(biāo)簽名稱區(qū)分大小寫
    • 快速入門:
      <?xml version='1.0' ?>
         <users>
           <user id='1'>
             <name>zhangsan</name>
             <age>23</age>
             <gender>male</gender>
             <br/ >
           </user>
         </users>

    • 組成部分:

      1. 文檔聲明

        1. 格式:<?xml 屬性列表 ?>
        2. 屬性列表:
          • version:版本號(hào),必須的屬性
          • encoding:編碼方式纤勒。告知解析引擎當(dāng)前文檔使用的字符集摇天,默認(rèn)值:ISO-8859-1
          • standalone:是否獨(dú)立
            • 取值:
              • yes:不依賴其他文件
              • no:依賴其他文件
      2. 指令(了解):結(jié)合css的

        • <?xml-stylesheet type="text/css" href="a.css" ?>
      3. 標(biāo)簽:標(biāo)簽名稱自定義的

        • 規(guī)則:
          • 名稱可以包含字母恐仑、數(shù)字以及其他的字符
          • 名稱不能以數(shù)字或者標(biāo)點(diǎn)符號(hào)開始
          • 名稱不能以字母 xml(或者 XML为鳄、Xml 等等)開始
          • 名稱不能包含空格
      4. 屬性:
        id屬性值唯一

      5. 文本:

        • CDATA區(qū):在該區(qū)域中的數(shù)據(jù)會(huì)被原樣展示
          • 格式: <![CDATA[ 數(shù)據(jù) ]]>
    • 約束:規(guī)定xml文檔的書寫規(guī)則

      • 作為框架的使用者(程序員):

        1. 能夠在xml中引入約束文檔
        2. 能夠簡(jiǎn)單的讀懂約束文檔
      • 分類:

        1. DTD:一種簡(jiǎn)單的約束技術(shù)
        2. Schema:一種復(fù)雜的約束技術(shù)
      • DTD:

        • 引入dtd文檔到xml文檔中
          • 內(nèi)部dtd:將約束規(guī)則定義在xml文檔中
          • 外部dtd:將約束的規(guī)則定義在外部的dtd文件中
            • 本地:<!DOCTYPE 根標(biāo)簽名 SYSTEM "dtd文件的位置">
            • 網(wǎng)絡(luò):<!DOCTYPE 根標(biāo)簽名 PUBLIC "dtd文件名字" "dtd文件的位置URL">
      • Schema:

        <students xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
        xmlns="http://www.itcast.cn/xml"
        xsi:schemaLocation="http://www.itcast.cn/xml student.xsd">


  1. 解析:操作xml文檔歧斟,將文檔中的數(shù)據(jù)讀取到內(nèi)存中
    • 操作xml文檔

      1. 解析(讀取):將文檔中的數(shù)據(jù)讀取到內(nèi)存中
      2. 寫入:將內(nèi)存中的數(shù)據(jù)保存到xml文檔中偏形。持久化的存儲(chǔ)
    • 解析xml的方式:

      1. DOM:將標(biāo)記語(yǔ)言文檔一次性加載進(jìn)內(nèi)存,在內(nèi)存中形成一顆dom樹
        • 優(yōu)點(diǎn):操作方便队橙,可以對(duì)文檔進(jìn)行CRUD的所有操作
        • 缺點(diǎn):占內(nèi)存
      2. SAX:逐行讀取萨惑,基于事件驅(qū)動(dòng)的。
        • 優(yōu)點(diǎn):不占內(nèi)存解总。
        • 缺點(diǎn):只能讀取姐仅,不能增刪改
    • xml常見的解析器:

      1. JAXP:sun公司提供的解析器萍嬉,支持dom和sax兩種思想
      2. DOM4J:一款非常優(yōu)秀的解析器
      3. Jsoup:jsoup 是一款Java 的HTML解析器隙疚,可直接解析某個(gè)URL地址、HTML文本內(nèi)容行冰。它提供了一套非常省力的API伶丐,可通過DOM,CSS以及類似于jQuery的操作方法來(lái)取出和操作數(shù)據(jù)肛走。
      4. PULL:Android操作系統(tǒng)內(nèi)置的解析器录别,sax方式的邻吞。
    • Jsoup:jsoup 是一款Java 的HTML解析器抱冷,可直接解析某個(gè)URL地址梢褐、HTML文本內(nèi)容。它提供了一套非常省力的API耿眉,可通過DOM猪贪,CSS以及類似于jQuery的操作方法來(lái)取出和操作數(shù)據(jù)。

      • 快速入門:

        • 步驟:
          1. 導(dǎo)入jar包
          2. 獲取Document對(duì)象
          3. 獲取對(duì)應(yīng)的標(biāo)簽Element對(duì)象
          4. 獲取數(shù)據(jù)
      • 代碼:
        //2.1獲取student.xml的path
        String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();
        //2.2解析xml文檔西傀,加載文檔進(jìn)內(nèi)存拥褂,獲取dom樹--->Document
        Document document = Jsoup.parse(new File(path), "utf-8");
        //3.獲取元素對(duì)象 Element
        Elements elements = document.getElementsByTag("name");

        System.out.println(elements.size());
        //3.1獲取第一個(gè)name的Element對(duì)象
        Element element = elements.get(0);
        //3.2獲取數(shù)據(jù)
        String name = element.text();
        System.out.println(name);

    • 對(duì)象的使用:

      1. Jsoup:工具類牙寞,可以解析html或xml文檔,返回Document
        • parse:解析html或xml文檔悔详,返回Document
          • parse?(File in, String charsetName):解析xml或html文件的惹挟。
          • parse?(String html):解析xml或html字符串
          • parse?(URL url, int timeoutMillis):通過網(wǎng)絡(luò)路徑獲取指定的html或xml的文檔對(duì)象
      2. Document:文檔對(duì)象连锯。代表內(nèi)存中的dom樹
        • 獲取Element對(duì)象
          • getElementById?(String id):根據(jù)id屬性值獲取唯一的element對(duì)象
          • getElementsByTag?(String tagName):根據(jù)標(biāo)簽名稱獲取元素對(duì)象集合
          • getElementsByAttribute?(String key):根據(jù)屬性名稱獲取元素對(duì)象集合
          • getElementsByAttributeValue?(String key, String value):根據(jù)對(duì)應(yīng)的屬性名和屬性值獲取元素對(duì)象集合
      3. Elements:元素Element對(duì)象的集合∑雌可以當(dāng)做 ArrayList<Element>來(lái)使用
      4. Element:元素對(duì)象
        1. 獲取子元素對(duì)象

          • getElementById?(String id):根據(jù)id屬性值獲取唯一的element對(duì)象
          • getElementsByTag?(String tagName):根據(jù)標(biāo)簽名稱獲取元素對(duì)象集合
          • getElementsByAttribute?(String key):根據(jù)屬性名稱獲取元素對(duì)象集合
          • getElementsByAttributeValue?(String key, String value):根據(jù)對(duì)應(yīng)的屬性名和屬性值獲取元素對(duì)象集合
        2. 獲取屬性值

          • String attr(String key):根據(jù)屬性名稱獲取屬性值
        3. 獲取文本內(nèi)容

          • String text():獲取文本內(nèi)容
          • String html():獲取標(biāo)簽體的所有內(nèi)容(包括字標(biāo)簽的字符串內(nèi)容)
      5. Node:節(jié)點(diǎn)對(duì)象
        • 是Document和Element的父類
    • 快捷查詢方式:

      1. selector:選擇器
        • 使用的方法:Elements select?(String cssQuery)
          • 語(yǔ)法:參考Selector類中定義的語(yǔ)法
      2. XPath:XPath即為XML路徑語(yǔ)言吻氧,它是一種用來(lái)確定XML(標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言的子集)文檔中某部分位置的語(yǔ)言
        • 使用Jsoup的Xpath需要額外導(dǎo)入jar包。
        • 查詢w3cshool參考手冊(cè)砸狞,使用xpath的語(yǔ)法完成查詢
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末镀梭,一起剝皮案震驚了整個(gè)濱河市报账,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌榜晦,老刑警劉巖羽圃,帶你破解...
    沈念sama閱讀 212,884評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件朽寞,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡脑融,警方通過查閱死者的電腦和手機(jī)肘迎,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,755評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)姻蚓,“玉大人匣沼,你說(shuō)我怎么就攤上這事。” “怎么了枢贿?”我有些...
    開封第一講書人閱讀 158,369評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵局荚,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我耀态,道長(zhǎng)首装,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,799評(píng)論 1 285
  • 正文 為了忘掉前任驰吓,我火速辦了婚禮系奉,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘翁涤。我一直安慰自己萌踱,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,910評(píng)論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著能真,像睡著了一般。 火紅的嫁衣襯著肌膚如雪疼约。 梳的紋絲不亂的頭發(fā)上蝙泼,一...
    開封第一講書人閱讀 50,096評(píng)論 1 291
  • 那天汤踏,我揣著相機(jī)與錄音,去河邊找鬼搂擦。 笑死哗脖,一個(gè)胖子當(dāng)著我的面吹牛扳还,可吹牛的內(nèi)容都是我干的橱夭。 我是一名探鬼主播,決...
    沈念sama閱讀 39,159評(píng)論 3 411
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼呈础!你這毒婦竟也來(lái)了而钞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,917評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤撬陵,失蹤者是張志新(化名)和其女友劉穎网缝,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體草添,經(jīng)...
    沈念sama閱讀 44,360評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡远寸,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,673評(píng)論 2 327
  • 正文 我和宋清朗相戀三年驰后,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了矗愧。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,814評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡夜涕,死狀恐怖属愤,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤只壳,帶...
    沈念sama閱讀 34,509評(píng)論 4 334
  • 正文 年R本政府宣布,位于F島的核電站锅必,受9級(jí)特大地震影響惕艳,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜劣纲,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,156評(píng)論 3 317
  • 文/蒙蒙 一癞季、第九天 我趴在偏房一處隱蔽的房頂上張望倘潜。 院中可真熱鬧,春花似錦废睦、人聲如沸养泡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)输硝。三九已至,卻和暖如春橘荠,著一層夾襖步出監(jiān)牢的瞬間郎逃,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,123評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工匀泊, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留朵你,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,641評(píng)論 2 362
  • 正文 我出身青樓躲因,卻偏偏與公主長(zhǎng)得像忌傻,于是被迫代替她去往敵國(guó)和親水孩。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,728評(píng)論 2 351

推薦閱讀更多精彩內(nèi)容