python之xml解析DOM解析(一)

Post author:xfxia
Post published:2023年10月20日
Post category:python

1.xml是一种文件

2.区分大小写

3.标签要正确嵌套

4.开始部分<?xml version=’1.0′ encoding=’utf-8′>

5.只能有一个根节点

6.节点可以有属性

为什么写程序时使用xml:

（1）平台兼容非常好，跨平台，语妄言通用

（2）传递数据，保存数据

（3）结构化存储，永久存储

（4）多应用于配置文件，框架中使用

解析xml文件中的内容，也就是读取xml文件内容

首先做个练习，写个xml文件:

练习：2个图书对象信息

建一个xml文件后缀名是.xml

注意：当多个人在使用xml文件里有可能会出现错误，所以我们需要用DTD(document Type Definition)约束xml文件限制

下面我们来介绍下如何解析xml

(1)1.dom(文档对象模型)：把解析的xml整个加载到内在，组织成object树

w3c dom dom4

(2)第二种解析sax: 事件驱动式解析，不会在内存中加载整个文档，只会根据自己编缉的事上保存数据

下边是dom 解析案例 Node—–节点(包含范围大，包括空格换行) Element—-元素不包含空格及元素

导入模块

from xml.dom.minidom imporrt parse

class Book(object):
    def __init__(self,bname=None,price=None,bookWriter=None):
        self.bname=bname
        self.price=price
        self.bookWriter=bookWriter
    def __str__(self):
        return '书名'+self.bname+'\t价格'+self.price+"\t作者"+self.bookWriter
books = []
doc=parse('xml1.xml')
# 得到根节点
root=doc.documentElement
book=root.getElementsByTagName('book')
for b in book:
    bname=b.getElementsByTagName('bookname')[0].childNodes[0].data
    price=b.getElementsByTagName('bookPrice')[0].childNodes[0].data
    bookWriter=b.getElementsByTagName('bookWriter')[0].childNodes[0].data
    books.append(Book(bname,price,bookWriter))
print('书名：\t\t价格：\t作者')
for book in books:
    print(book)

原文链接：https://blog.csdn.net/baiyan_er/article/details/79416417

你可能也喜欢