Python改寫maven的pom.xml文件

前陣子工作中用Python對(duì)xml格式的配置文件的內(nèi)容進(jìn)行修改,使用的模塊是Python內(nèi)置的xml.etree.cElementTree攀操。然后修改maven的pom.xml的時(shí)候遇到2個(gè)問題齿兔,在這里分享下遇到的坑。
以改下面中的pom.xml為例:

<?xml version='1.0' encoding='utf-8'?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>javaTest</groupId>
    <artifactId>javatest</artifactId>
    <version>1.0-SNAPSHOT</version>
    <dependencies>
        <dependency>
            <groupId>com.alibaba</groupId>
            <artifactId>fastjson</artifactId>
            <version>1.2.9</version>
        </dependency>
        <dependency>
            <groupId>org.testng</groupId>
            <artifactId>testng</artifactId>
            <version>6.9</version>
            <scope>test</scope>
        </dependency>
    </dependencies>
</project>

現(xiàn)在需要改文件中的testng的版本號(hào),因?yàn)閜om.xml中的標(biāo)簽均沒有屬性善涨,所以只能通過標(biāo)簽的內(nèi)容來定位標(biāo)簽。思想是:首先先定位內(nèi)容為testng的artifactId標(biāo)簽草则,那么該標(biāo)簽的后繼兄弟標(biāo)簽即為version標(biāo)簽钢拧,其中的內(nèi)容即為我們要改掉的版本號(hào)。
python代碼如下:

# coding: utf-8
import xml.etree.cElementTree as ET
import re

class ConfigXMLFile(object):

    def __init__(self, file):
        self.config = file  # 配置文件path
        self.tree = None

    def readXML(self, type):
        '''
        讀取并解析xml文件
        return: ElementTree
        '''
        self.tree = ET.ElementTree()
        self.tree.parse(self.config)

    def writeXML(self, out_path):
        '''
        將xml文件寫出
        out_path: 寫出路徑
        '''
        self.tree.write(out_path, encoding="utf-8", xml_declaration=True)

    def configPOMVer(self, artifactId, version, out_path):
        '''
        修改pom中的依賴包的version
        :param artifactId: artifactId
        :param version: version
        :param out_path: 修改后的配置文件路徑
        :return:
        '''
        pre_sibling = None
        root = self.tree.getroot()  # 根node
        for child in root.iter("dependency"):
            for sub_child in child:
                if sub_child.text == artifactId:
                    pre_sibling = sub_child
                if sub_child.tag == "version" and pre_sibling is not None:
                    sub_child.text = version
                    self.writeXML(out_path)  # 修改version
                    print("修改" + str(artifactId) + "的version為:" + str(version))
                    return

        if pre_sibling is None:
            print("Error: 沒找到對(duì)應(yīng)結(jié)點(diǎn)!\n")
            print(" ")

if __name__ == "__main__":
    pom_config = r"E:\llf_test\llf_java\pom.xml"
    artifactId = "testng"
    version = "6.10"
    # 修改pom.xml
    pom_xml = ConfigXMLFile(pom_config)
    pom_xml.readXML("pom")
    pom_xml.configPOMVer(artifactId, version, pom_config)
    print("修改pom.xml完成炕横!")

運(yùn)行代碼后報(bào)錯(cuò)源内,提示找不到標(biāo)簽。找原因找了好久份殿,后來網(wǎng)上搜答案膜钓,看到一個(gè)老外在stack overflow上同樣提出了這個(gè)問題塔鳍,后來他自己找到了答案。我們回頭再看pom.xml呻此,根標(biāo)簽為project轮纫。我們?cè)诖a里看下根標(biāo)簽是不是project。

def getRootTag(self):
        root = self.tree.getroot()  # 根node
        print(root.tag)

運(yùn)行結(jié)果為:

{http://maven.apache.org/POM/4.0.0}project

好奇怪焚鲜,根元素是“{http://maven.apache.org/POM/4.0.0}project”掌唾。
我們?cè)賮砜聪挛募懈氐暮⒆釉氐臉?biāo)簽是什么?

def getChildrenOfRoot(self):
        root = self.tree.getroot()
        for child in root:
            print(child.tag)

運(yùn)行結(jié)果為:

{http://maven.apache.org/POM/4.0.0}modelVersion
{http://maven.apache.org/POM/4.0.0}groupId
{http://maven.apache.org/POM/4.0.0}artifactId
{http://maven.apache.org/POM/4.0.0}version
{http://maven.apache.org/POM/4.0.0}dependencies

同樣忿磅,所有標(biāo)簽都有前綴“{http://maven.apache.org/POM/4.0.0}”糯彬。回過頭再看pom.xml葱她,發(fā)現(xiàn)根元素project標(biāo)簽有一些屬性:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">

這個(gè)xmlns是xml文件的命名空間的概念撩扒,搜了下概念引用如下:

XML Namespace (xmlns) 屬性
XML 命名空間屬性被放置于元素的開始標(biāo)簽之中,并使用以下的語法:
xmlns:namespace-prefix="namespaceURI"
當(dāng)命名空間被定義在元素的開始標(biāo)簽中時(shí)吨些,所有帶有相同前綴的子元素都會(huì)與同一個(gè)命名空間相關(guān)聯(lián)搓谆。
默認(rèn)的命名空間(Default Namespaces)
為元素定義默認(rèn)的命名空間可以讓我們省去在所有的子元素中使用前綴的工作。使用語法如下:
xmlns="namespaceURI"

所以豪墅,pom.xml里每個(gè)元素的前綴{http://maven.apache.org/POM/4.0.0}即為namespaceURI泉手,我們看pom中project的屬性xmlns="http://maven.apache.org/POM/4.0.0",從這里可以知道偶器,namespace-prefix是沒有的斩萌。
因?yàn)槲覀兊哪康氖歉牡粑募膬?nèi)容,現(xiàn)在找不到標(biāo)簽屏轰,發(fā)現(xiàn)所有標(biāo)簽都有namespaceURI颊郎,那我們就把代碼中我們要定位的標(biāo)簽名前加上namespaceURI就好了。代碼如下:

def configPOMVer(self, artifactId, version, out_path):
        '''
        修改pom中的依賴包的version
        :param name: 服務(wù)名
        :param host: 服務(wù)host
        :param out_path: 修改后的配置文件路徑
        :return:
        '''
        pre_sibling = None
        root = self.tree.getroot()  # 根node
        pre = (re.split('project', root.tag))[0]  # 獲取pom元素tag的pre

        for child in root.iter(pre + "dependency"):
            for sub_child in child:
                if sub_child.text == artifactId:
                    pre_sibling = sub_child
                if sub_child.tag == (pre + "version") and pre_sibling is not None:
                    sub_child.text = version
                    self.writeXML(out_path)  # 修改version
                    print("修改" + str(artifactId) + "的version為:" + str(version))
                    return

        if pre_sibling is None:
            print("Error: 沒找到對(duì)應(yīng)結(jié)點(diǎn)!\n")
            print(" ")

運(yùn)行程序霎苗,輸出結(jié)果:

修改testng的version為:6.10
修改pom.xml完成姆吭!

看來是ok了,我們?nèi)ッ橐谎鄹倪^的pom.xml文件叨粘。

<?xml version='1.0' encoding='utf-8'?>
<ns0:project xmlns:ns0="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <ns0:modelVersion>4.0.0</ns0:modelVersion>

    <ns0:groupId>javaTest</ns0:groupId>
    <ns0:artifactId>javatest</ns0:artifactId>
    <ns0:version>1.0-SNAPSHOT</ns0:version>
    <ns0:dependencies>
        <ns0:dependency>
            <ns0:groupId>com.alibaba</ns0:groupId>
            <ns0:artifactId>fastjson</ns0:artifactId>
            <ns0:version>1.2.9</ns0:version>
        </ns0:dependency>
        <ns0:dependency>
            <ns0:groupId>org.testng</ns0:groupId>
            <ns0:artifactId>testng</ns0:artifactId>
            <ns0:version>6.10</ns0:version>
            <ns0:scope>test</ns0:scope>
        </ns0:dependency>
    </ns0:dependencies>

</ns0:project>

尼瑪猾编!文件中所有標(biāo)簽都加了個(gè)前綴ns0瘤睹,這個(gè)ns0就是namespace-prefix升敲。為什么會(huì)這里會(huì)出現(xiàn)ns0,這跟xml.etree.cElementTree模塊本身有關(guān)轰传。解決方法是使用xml.etree.ElementTree.register_namespace(prefix,uri)方法驴党,去重新定義我們的namespace-prefix,否則的話會(huì)默認(rèn)將namespace-prefix設(shè)置為ns0获茬。我們看下該方法的官方說明:

"""Register a namespace prefix.

    The registry is global, and any existing mapping for either the
    given prefix or the namespace URI will be removed.

    *prefix* is the namespace prefix, *uri* is a namespace uri. Tags and
    attributes in this namespace will be serialized with prefix if possible.

    ValueError is raised if prefix is reserved or is invalid.

    """

這里的prefix即為namespace-prefix港庄,url即為namespaceURI倔既。
這里我們?cè)囼?yàn)一下,設(shè)置這2個(gè)變量的值如下:

def readXML(self, type):
        '''
        讀取并解析xml文件
        return: ElementTree
        '''
        self.tree = ET.ElementTree()
        if type == "pom":
            XML_NS_NAME = "hello"
            XML_NS_VALUE = "http://maven.apache.org/POM/4.0.0"
            ET.register_namespace(XML_NS_NAME, XML_NS_VALUE)
        self.tree.parse(self.config)

運(yùn)行后鹏氧,查看pom.xml文件內(nèi)容:

<?xml version='1.0' encoding='utf-8'?>
<hello:project xmlns:hello="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <hello:modelVersion>4.0.0</hello:modelVersion>

    <hello:groupId>javaTest</hello:groupId>
    <hello:artifactId>javatest</hello:artifactId>
    <hello:version>1.0-SNAPSHOT</hello:version>
    <hello:dependencies>
        <hello:dependency>
            <hello:groupId>com.alibaba</hello:groupId>
            <hello:artifactId>fastjson</hello:artifactId>
            <hello:version>1.2.9</hello:version>
        </hello:dependency>
        <hello:dependency>
            <hello:groupId>org.testng</hello:groupId>
            <hello:artifactId>testng</hello:artifactId>
            <hello:version>6.10</hello:version>
            <hello:scope>test</hello:scope>
        </hello:dependency>
    </hello:dependencies>

</hello:project>

哈哈渤涌,看到?jīng)],標(biāo)簽前的ns0換為hello了把还。前面提到实蓬,pom.xml中project的屬性xmlns="http://maven.apache.org/POM/4.0.0"是沒有設(shè)置namespace-prefix的
,所以這里就將XML_NS_NAME賦值為空字符串就好吊履,如下:

def readXML(self, type):
    '''
    讀取并解析xml文件
    return: ElementTree
    '''
    self.tree = ET.ElementTree()
    if type == "pom":
        XML_NS_NAME = ""
        XML_NS_VALUE = "http://maven.apache.org/POM/4.0.0"
        ET.register_namespace(XML_NS_NAME, XML_NS_VALUE)
    self.tree.parse(self.config)

運(yùn)行后安皱,查看pom.xml:

<?xml version='1.0' encoding='utf-8'?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>javaTest</groupId>
    <artifactId>javatest</artifactId>
    <version>1.0-SNAPSHOT</version>
    <dependencies>
        <dependency>
            <groupId>com.alibaba</groupId>
            <artifactId>fastjson</artifactId>
            <version>1.2.9</version>
        </dependency>
        <dependency>
            <groupId>org.testng</groupId>
            <artifactId>testng</artifactId>
            <version>6.10</version>
            <scope>test</scope>
        </dependency>
    </dependencies>

</project>

ok,這下標(biāo)簽沒有前綴了艇炎。
最后總結(jié)下酌伊,因?yàn)閜om.xml有命名空間,所以改該類文件需要注意兩點(diǎn)缀踪,
1居砖、遍歷標(biāo)簽時(shí),標(biāo)簽名前要加前綴驴娃。
2悯蝉、解析文件時(shí),記得設(shè)置環(huán)境變量XML_NS_NAME和XML_NS_VALUE托慨,這里pom.xml的namespace-prefix沒有鼻由,所以XML_NS_NAME設(shè)置為“”。
希望我遇到的這2個(gè)坑厚棵,對(duì)相關(guān)同學(xué)有所幫助蕉世。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市婆硬,隨后出現(xiàn)的幾起案子狠轻,更是在濱河造成了極大的恐慌,老刑警劉巖彬犯,帶你破解...
    沈念sama閱讀 218,640評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件向楼,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡谐区,警方通過查閱死者的電腦和手機(jī)湖蜕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,254評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來宋列,“玉大人昭抒,你說我怎么就攤上這事。” “怎么了灭返?”我有些...
    開封第一講書人閱讀 165,011評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵盗迟,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我熙含,道長(zhǎng)罚缕,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,755評(píng)論 1 294
  • 正文 為了忘掉前任怎静,我火速辦了婚禮怕磨,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘消约。我一直安慰自己肠鲫,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,774評(píng)論 6 392
  • 文/花漫 我一把揭開白布或粮。 她就那樣靜靜地躺著导饲,像睡著了一般。 火紅的嫁衣襯著肌膚如雪氯材。 梳的紋絲不亂的頭發(fā)上渣锦,一...
    開封第一講書人閱讀 51,610評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音氢哮,去河邊找鬼袋毙。 笑死,一個(gè)胖子當(dāng)著我的面吹牛冗尤,可吹牛的內(nèi)容都是我干的听盖。 我是一名探鬼主播,決...
    沈念sama閱讀 40,352評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼裂七,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼皆看!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起背零,我...
    開封第一講書人閱讀 39,257評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤腰吟,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后徙瓶,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體毛雇,經(jīng)...
    沈念sama閱讀 45,717評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,894評(píng)論 3 336
  • 正文 我和宋清朗相戀三年侦镇,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了灵疮。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,021評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡虽缕,死狀恐怖始藕,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情氮趋,我是刑警寧澤伍派,帶...
    沈念sama閱讀 35,735評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站剩胁,受9級(jí)特大地震影響诉植,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜昵观,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,354評(píng)論 3 330
  • 文/蒙蒙 一晾腔、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧啊犬,春花似錦灼擂、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,936評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至语御,卻和暖如春峻贮,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背应闯。 一陣腳步聲響...
    開封第一講書人閱讀 33,054評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工纤控, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人碉纺。 一個(gè)月前我還...
    沈念sama閱讀 48,224評(píng)論 3 371
  • 正文 我出身青樓船万,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親骨田。 傳聞我的和親對(duì)象是個(gè)殘疾皇子唬涧,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,974評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn)盛撑,斷路器碎节,智...
    卡卡羅2017閱讀 134,657評(píng)論 18 139
  • 一、概述 ??當(dāng)我們使用Maven來管理和構(gòu)建我們的項(xiàng)目的時(shí)候抵卫,我們會(huì)不可避免的遇到pom文件狮荔。雖然已經(jīng)配置過po...
    騎著烏龜去看海閱讀 7,554評(píng)論 1 15
  • 我想很多初學(xué)者對(duì)上圖 標(biāo)簽內(nèi)的:xmlns殖氏、xmlns:xsi、schemaLocation都表示不解姻采,那么今天就...
    魯克巴克詩閱讀 1,697評(píng)論 0 2
  • 1. XML簡(jiǎn)介 以下內(nèi)容來自于http://www.w3school.com.cn/xml 基本知識(shí) XML 和...
    WebSSO閱讀 1,916評(píng)論 1 7
  • 簡(jiǎn)介 概述 Maven 是一個(gè)項(xiàng)目管理和整合工具 Maven 為開發(fā)者提供了一套完整的構(gòu)建生命周期框架 Maven...
    閩越布衣閱讀 4,293評(píng)論 6 39