使用Python讀寫xml文件

原文鏈接:http://wyb0.com/posts/python-read-and-write-xml/

0x00 解析XML的方法

  1. SAX (simple API for XML)
    python 標準庫包含SAX解析器赂蕴,SAX用事件驅(qū)動模型,通過在解析XML的過程中觸發(fā)一個個的事件并調(diào)用用戶定義的回調(diào)函數(shù)來處理XML文件难衰。

  2. DOM(Document Object Model)
    將XML數(shù)據(jù)在內(nèi)存中解析成一個樹偿短,通過對樹的操作來操作XML铅檩。

  3. ElementTree(元素樹)
    ElementTree就像一個輕量級的DOM国拇,具有方便友好的API沪么。代碼可用性好捅位,速度快,消耗內(nèi)存少拱层。

  • 我在這里使用ElementTree

0x01 Element對象的屬性

每個Element對象都具有以下屬性:

  • tag:string對象弥臼,表示數(shù)據(jù)代表的種類
  • attrib:dictionary對象,表示附有的屬性
  • text:string對象根灯,表示element的內(nèi)容
  • tail:string對象径缅,表示element閉合之后的尾跡
  • 若干子元素(child elements)
>>> from xml.etree import ElementTree as ET
>>> xml = """<books>
...   <book id='37476'>aaaa</book>
...   <book id='83727'>bbbb</book>
... </books>"""
>>> root = ET.fromstring(xml)
>>> root.tag
'books'
>>> child = root.getchildren()
>>> child
[<Element 'book' at 0x106f59410>, <Element 'book' at 0x106f59450>]
>>> child[0].tag
'book'
>>> child[0].attrib
{'id': '37476'}
>>> child[0].text
'aaaa'

0x02 文件內(nèi)容

<?xml version='1.0' encoding='UTF-8'?>
<books>
  <book>
    <name>Python黑帽子</name>
    <date>2015</date>
    <price>37¥</price>
    <description>用python寫一些程序</description>
  </book>
  <book>
    <name>Web安全深度剖析</name>
    <date>2014</date>
    <price>39¥</price>
    <description>講述web滲透的基礎(chǔ)知識</description>
  </book>
  <book>
    <name>白帽子講web安全</name>
    <date>2013</date>
    <price>44¥</price>
    <description>道哥力作</description>
  </book>
</books>

0x03 讀取xml節(jié)點

#!/usr/bin/env python
# -*- coding: utf-8 -*-

from xml.etree import ElementTree as ET

tree = ET.parse('test.xml')
root = tree.getroot()
# root = ET.fromstring(country_data_as_string) #通過字符串導(dǎo)入,直接獲取根
childs = root.getchildren()

books = []
for child0 in childs:
    book = {}
    for child00 in child0.getchildren():
        # print child00.tag #標簽名,即name烙肺、date纳猪、price、description
        # print child00.text
        book[child00.tag] = child00.text
    books.append(book)

print books
"""
books = [
    {'name': 'Python黑帽子','date': '2015','price': '37¥','description': '用python寫一些程序'},
    {'name': 'Web安全深度剖析','date': '2014','price': '39¥','description': '講述web滲透的基礎(chǔ)知識'},
    {'name': '白帽子講web安全','date': '2013','price': '44¥','description': '道哥力作'}        
]
"""

0x04 寫入xml文件

#!/usr/bin/env python
# -*- coding: utf-8 -*-

from xml.etree.ElementTree import Element,ElementTree

books = [
    {
        'name': u'Python黑帽子',
        'date': '2015',
        'price': u'37¥',
        'description': u'用python寫一些程序'
    },
    {
        'name': u'Web安全深度剖析',
        'date': '2014',
        'price': u'39¥',
        'description': u'講述web滲透的基礎(chǔ)知識'
    },
    {
        'name': u'白帽子講web安全',
        'date': '2013',
        'price': u'44¥',
        'description': u'道哥力作'
    }        
]

def indent(elem, level=0):
    """美化寫入文件的內(nèi)容"""
    i = "\n" + level*"  "
    if len(elem):
        if not elem.text or not elem.text.strip():
            elem.text = i + "  "
        if not elem.tail or not elem.tail.strip():
            elem.tail = i
        for elem in elem:
            indent(elem, level+1)
        if not elem.tail or not elem.tail.strip():
            elem.tail = i
    else:
        if level and (not elem.tail or not elem.tail.strip()):
            elem.tail = i


root = Element('books')
tree = ElementTree(root)

for book in books:
    child0 = Element('book')
    root.append(child0)

    for k,v in book.items():
        child00 = Element(k)
        child00.text = v
        child0.append(child00)

indent(root,0)
tree.write('aa.xml', 'UTF-8')
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末桃笙,一起剝皮案震驚了整個濱河市氏堤,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌搏明,老刑警劉巖鼠锈,帶你破解...
    沈念sama閱讀 219,270評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異星著,居然都是意外死亡购笆,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評論 3 395
  • 文/潘曉璐 我一進店門虚循,熙熙樓的掌柜王于貴愁眉苦臉地迎上來同欠,“玉大人,你說我怎么就攤上這事横缔∑趟欤” “怎么了?”我有些...
    開封第一講書人閱讀 165,630評論 0 356
  • 文/不壞的土叔 我叫張陵茎刚,是天一觀的道長襟锐。 經(jīng)常有香客問我,道長膛锭,這世上最難降的妖魔是什么捌斧? 我笑而不...
    開封第一講書人閱讀 58,906評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮泉沾,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘妇押。我一直安慰自己跷究,他們只是感情好,可當我...
    茶點故事閱讀 67,928評論 6 392
  • 文/花漫 我一把揭開白布敲霍。 她就那樣靜靜地躺著俊马,像睡著了一般丁存。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上柴我,一...
    開封第一講書人閱讀 51,718評論 1 305
  • 那天解寝,我揣著相機與錄音,去河邊找鬼艘儒。 笑死聋伦,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的界睁。 我是一名探鬼主播觉增,決...
    沈念sama閱讀 40,442評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼翻斟!你這毒婦竟也來了逾礁?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,345評論 0 276
  • 序言:老撾萬榮一對情侶失蹤访惜,失蹤者是張志新(化名)和其女友劉穎嘹履,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體债热,經(jīng)...
    沈念sama閱讀 45,802評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡砾嫉,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,984評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了阳柔。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片焰枢。...
    茶點故事閱讀 40,117評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖舌剂,靈堂內(nèi)的尸體忽然破棺而出济锄,到底是詐尸還是另有隱情,我是刑警寧澤霍转,帶...
    沈念sama閱讀 35,810評論 5 346
  • 正文 年R本政府宣布荐绝,位于F島的核電站,受9級特大地震影響避消,放射性物質(zhì)發(fā)生泄漏低滩。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,462評論 3 331
  • 文/蒙蒙 一岩喷、第九天 我趴在偏房一處隱蔽的房頂上張望恕沫。 院中可真熱鬧,春花似錦纱意、人聲如沸婶溯。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽迄委。三九已至褐筛,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間叙身,已是汗流浹背渔扎。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留信轿,地道東北人晃痴。 一個月前我還...
    沈念sama閱讀 48,377評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像虏两,于是被迫代替她去往敵國和親愧旦。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,060評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語法定罢,類相關(guān)的語法笤虫,內(nèi)部類的語法,繼承相關(guān)的語法祖凫,異常的語法琼蚯,線程的語...
    子非魚_t_閱讀 31,643評論 18 399
  • 1 場景問題# 1.1 讀取配置文件## 考慮這樣一個實際的應(yīng)用,維護系統(tǒng)自定義的配置文件惠况。 幾乎每個實際的應(yīng)用系...
    七寸知架構(gòu)閱讀 3,109評論 2 56
  • 1. XML總結(jié) 1.1. XML簡介 XML : 可擴展的標記語言遭庶。(和HTML非常類似的) 可擴展的。 自定義...
    Ethan_Walker閱讀 3,034評論 0 12
  • 一. Java基礎(chǔ)部分.................................................
    wy_sure閱讀 3,811評論 0 11
  • 當你累了稠屠, 在飛過整片森林之后峦睡。 于是在風中小憩, 準備著后面無盡的海洋权埠。 你無法停止飛翔榨了, 就像你無法停止尋找歸...
    安非他閱讀 474評論 5 2