读取xml数据

2024年 7月 29日上午8:06 • 激活谷笔记

读取xml数据如何使用Python读取xml文件目录　什么是xml？获得标签属性获得子标签获得标签属性值获得标签对之间的数据方法一方法二什么是xml？xml即可扩展标记语言，它可以用来标记数据、定义数据类型，是一种允许用户对

如何使用Python读取xml文件　　目录　什么是xml？获得标签属性获得子标签获得标签属性值获得标签对之间的数据方法一方法二　　什么是xml？　　xml即可扩展标记语言，它可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。　　abc.xml 　　<?xml version=”1.0″ encoding=”utf-8″?> 　　<catalog> 　　<maxid>4</maxid> 　　<login username=”pytest” passw=”> 　　<caption>Python</caption> 　　<item id=”4″> 　　<caption>测试</caption> 　　</item> 　　</login> 　　<item id=”2″> 　　<caption>Zope</caption> 　　</item> 　　</catalog> 　　Ok ,从结构上，它很像我们常见的HTML超文本标记语言。但他们被设计的目的是不同的，超文本标记语言被设计用来显示数据，其焦点是数据的外观。它被设计用来传输和存储数据，其焦点是数据的内容。　　那么它有如下特征：　　首先，它是有标签对组成，<aa></aa> 　　标签可以有属性：<aa id=’123’></aa> 　　标签对可以嵌入数据：<aa>abc</aa> 　　标签可以嵌入子标签（具有层级关系）：　　<aa> 　　 <bb></bb> 　　</aa> 　　获得标签属性　　那么，下面来介绍如何用python来读取这种类型的文件。　　#coding=utf-8 　　import xml.dom.minidom 　　#打开xml文档　　dom = xml.dom.minidom.parse(‘abc.xml’) 　　#得到文档素对象　　root = dom.documentElement 　　print root.nodeName 　　print root.nodeValue 　　print root.nodeType 　　print root.ELEMENT_NODE 　　mxl.dom.minidom 模块被用来处理xml文件，所以要先引入。　　xml.dom.minidom.parse() 用于打开一个xml文件，并将这个文件对象dom变量。　　documentElement 用于得到dom对象的文档素，并把获得的对象给root 　　每一个结点都有它的nodeName，nodeValue，nodeType属性。　　nodeName为结点名字。　　nodeValue是结点的值，只对文本结点有效。　　nodeType是结点的类型。catalog是ELEMENT_NODE类型　　现在有以下几种：　　’ATTRIBUTE_NODE”CDATA_SECTION_NODE”COMMENT_NODE”DOCUMENT_FRAGMENT_NODE”DOCUMENT_NODE”DOCUMENT_TYPE_NODE”ELEMENT_NODE”ENTITY_NODE”ENTITY_REFERENCE_NODE”NOTATION_NODE”PROCESSING_INSTRUCTION_NODE”TEXT_NODE’NodeTypes – 有名常数　　获得子标签　　现在要获得catalog的子标签以的标签name 　　<?xml version=”1.0″ encoding=”utf-8″?> 　　<catalog> 　　<maxid>4</maxid> 　　<login username=”pytest” passw=”> 　　<caption>Python</caption> 　　<item id=”4″> 　　<caption>测试</caption> 　　</item> 　　</login> 　　<item id=”2″> 　　<caption>Zope</caption> 　　</item> 　　</catalog> 　　对于知道素名字的子素，可以使用getElementsByTagName方法：　　#coding=utf-8 　　import xml.dom.minidom 　　#打开xml文档　　dom = xml.dom.minidom.parse(‘abc.xml’) 　　#得到文档素对象　　root = dom.documentElement 　　bb = root.getElementsByTagName(‘maxid’) 　　b= bb[0] 　　print b.nodeName 　　bb = root.getElementsByTagName(‘login’) 　　b= bb[0] 　　print b.nodeName 　　如何区分相同标签名字的标签：　　<?xml version=”1.0″ encoding=”utf-8″?> 　　<catalog> 　　<maxid>4</maxid> 　　<login username=”pytest” passw=”> 　　<caption>Python</caption> 　　<item id=”4″> 　　<caption>测试</caption> 　　</item> 　　</login> 　　<item id=”2″> 　　<caption>Zope</caption> 　　</item> 　　</catalog> 　　<caption>和<item>标签不止一个如何区分？　　#coding=utf-8 　　import xml.dom.minidom 　　#打开xml文档　　dom = xml.dom.minidom.parse(‘abc.xml’) 　　#得到文档素对象　　root = dom.documentElement 　　bb = root.getElementsByTagName(‘caption’) 　　b= bb[2] 　　print b.nodeName 　　bb = root.getElementsByTagName(‘item’) 　　b= bb[1] 　　print b.nodeName 　　root.getElementsByTagName(‘caption’) 获得的是标签为caption 一组标签，b[0]表示一组标签中的第一个；b[2] ，表示这一组标签中的第三个。　　获得标签属性值　　<?xml version=”1.0″ encoding=”utf-8″?> 　　<catalog> 　　<maxid>4</maxid> 　　<login username=”pytest” passw=”> 　　<caption>Python</caption> 　　<item id=”4″> 　　<caption>测试</caption> 　　</item> 　　</login> 　　<item id=”2″> 　　<caption>Zope</caption> 　　</item> 　　</catalog> 　　<login>和<item>标签是有属性的，如何获得他们的属性？　　#coding=utf-8 　　import xml.dom.minidom 　　#打开xml文档　　dom = xml.dom.minidom.parse(‘abc.xml’) 　　#得到文档素对象　　root = dom.documentElement 　　itemlist = root.getElementsByTagName(‘login’) 　　item = itemlist[0] 　　un=item.getAttribute(“username”) 　　print un 　　pd=item.getAttribute(“passwd”) 　　print pd 　　ii = root.getElementsByTagName(‘item’) 　　i1 = ii[0] 　　i=i1.getAttribute(“id”) 　　print i 　　i2 = ii[1] 　　i=i2.getAttribute(“id”) 　　print i 　　getAttribute方法可以获得素的属性所对应的值。　　获得标签对之间的数据　　<?xml version=”1.0″ encoding=”utf-8″?> 　　<catalog> 　　<maxid>4</maxid> 　　<login username=”pytest” passw=”> 　　<caption>Python</caption> 　　<item id=”4″> 　　<caption>测试</caption> 　　</item> 　　</login> 　　<item id=”2″> 　　<caption>Zope</caption> 　　</item> 　　</catalog> 　　获得标签对之间的数据有多种方法，　　方法一　　#coding=utf-8 　　import xml.dom.minidom 　　#打开xml文档　　dom = xml.dom.minidom.parse(‘abc.xml’) 　　#得到文档素对象　　root = dom.documentElement 　　cc=dom.getElementsByTagName(‘caption’) 　　c1=cc[0] 　　print c1.firstChild.data 　　c2=cc[1] 　　print c2.firstChild.data 　　c3=cc[2] 　　print c3.firstChild.data 　　firstChild 属性返回被选节点的第一个子节点，.data表示该节点人数据。　　方法二　　#coding=utf-8 　　from xml.etree import ElementTree as ET 　　per=ET.parse(‘abc.xml’) 　　p=per.findall(‘https://sigusoft.com/article/login/item’) 　　for oneper in p: 　　for child in oneper.getchildren(): 　　print child.tag,’:’,child.text 　　p=per.findall(‘https://sigusoft.com/article/item’) 　　for oneper in p: 　　for child in oneper.getchildren(): 　　print child.tag,’:’,child.text 　　方法二有点复杂，所引用模块也与前面的不一样，findall用于指定在哪一级标签下开始遍历。　　getchildren方法按照文档顺序返回所有子标签。并输出标签名（child.tag）和标签的数据（child.text）　　其实，方法二的作用不在于此，它核心功能是可以遍历某一级标签下的所有子标签。　　到此这篇关于如何使用Python读取xml文件的文章就介绍到这了,更多相关Python读取xml内容请搜索全栈程序员社区以前的文章或继续浏览下面的相关文章希望大家以后多多支持全栈程序员社区！　　您可能感兴趣的文章:Python爬虫lxml库处理XML和HTML文档python中lxml模块的使用详解python如何提取xml指定内容python中的txt文件转换为XMLpython中xml格式的转换方法Python XML模块数据解析与生成利器的使用掌握

2024定义指针数组的格式

上一篇 2024年 7月 29日

异步和同步的区别在哪

下一篇 2024年 7月 29日

激活谷笔记

Rider2024.1.5激活码(Pycharm2024激活)

Rider2024.1.5激活码(Pycharm2024激活)

2024年 8月 12日
Navicat Premium 16.2.7激活(如何使用Navicat修改mysql用户密码？)

Navicat Premium 16.2.7激活(如何使用Navicat修改mysql用户密码？)

激活谷笔记 2024年 8月 18日
linux 测试性能_Linux软件大全

linux 测试性能_Linux软件大全软件测试题汇总｜性能测试问答（附答案）本篇文章主要归纳一些关于性能测试方面的面试题，也是在面试过程、工作中常见的问题，供大家参考。软件测试面试题1.计算机网络知识与数据库2.接口测试面试题3.UI自动化测试4.w

激活谷笔记 2024年 9月 1日
激活谷笔记

l298n灯亮但电机不转_电机怎么接线

l298n灯亮但电机不转_电机怎么接线直流电机驱动芯片选择(l298n电机驱动模块原理图)我焊接了基于L298N电动机的驱动电路，并根据以下电路图进行了焊接，以了解电动机的驱动。上图左侧的TLP521是一个光耦合器。让我们做一个特写。我们需要知道正在发生什么，但我们也需要知道为什么。一起，让我

2024年 9月 2日
红黑树的优点缺点_红漆树生长在什么地方

红黑树的优点缺点_红漆树生长在什么地方用通俗的语言解释一下红黑树有什么用处?高中生,学习编程.最近正在拜读算法界的Bible<算法导论>,读到关于红黑树的介绍时基本理解了其概念,但是依然不清楚红黑树在算法中具体的作用.希望各位神犇能用通俗的语言帮我解释一下红黑树的用处.谢谢!

激活谷笔记 2024年 9月 1日
激活谷笔记

arm芯片和cpu_arm芯片是什么意思

arm芯片和cpu_arm芯片是什么意思dsp芯片是什么意思？和arm芯片有什么区别dsp芯片是什么意思？dsp芯片和arm芯片有什么区别？针对这两个问题，小编搜集整理到了一些答案，一起来看看吧！一、dsp芯片是什么意思DSP芯片又称数字信号处理器，常用于军事、医疗、家用电器等领域。根据其工作时钟

2024年 8月 3日
激活谷笔记

安装ise_服务器iscsi存储挂载

安装ise_服务器iscsi存储挂载ISCSI服务目录一.准备1.准备一个分区2.安装服务端软件3.安装客户端软件二.服务端配置1.配置1.1利用命令targetcli 进入1.2 ls可以查看1.3 cd到block下1.4创建一个bloc

2024年 9月 11日
激活谷笔记

Clion激活2022.2.1(CLion 2022.2.4激活成功教程教程详细图解mac,windows,linux均适用)

Clion激活2022.2.1(CLion 2022.2.4激活成功教程教程详细图解mac,windows,linux均适用)

2024年 7月 31日
激活谷笔记

存储器分为哪两大类?每一大类的作用和特点分别是什么?_外存储器的特点

存储器分为哪两大类?每一大类的作用和特点分别是什么?_外存储器的特点Untitled Document实际上，Cache、主存、磁盘这三个存储器可以分别构成”Cache-主存”和”主存-磁盘”两个存储系统，也可以构成”Cache－主存－磁盘”一个存储系统，或没有主存储器，构成一个”Cache

2024年 9月 11日
mysql有开窗函数吗_函数都是一一映射吗

mysql有开窗函数吗_函数都是一一映射吗分析函数、窗口函数、开窗函数整理一下oracle、sqlserver、mysql三大数据库用法不一样。ORACLE开窗函数和分组函数oracle开窗函数有很多，用的比较多的是over(…)，一般是和order、p

激活谷笔记 2024年 8月 28日
Clion激活2024.1.4(JetBrains CLion 2024.1.4 Crack)

Clion激活2024.1.4(JetBrains CLion 2024.1.4 Crack)

激活谷笔记 2024年 7月 10日
激活谷笔记

win10找不到gpedit.msc怎家庭中文版么办_win10找不到gpedit.msc怎么办？

win10找不到gpedit.msc怎家庭中文版么办_win10找不到gpedit.msc怎么办？WIN10家庭版没有本地组策略（gpedit.msc）怎么办？Windows 家庭版用户最大的心结，可能就是没有本地组策略编辑器（Win+R后输入gpedit.msc）了。今天就来帮大家了却心结，家庭版用户用上组策略编辑器不再是梦！先新建一个

2024年 5月 23日

读取xml数据

相关推荐