python之xml解析DOM解析(一)

  • Post author:
  • Post category:python


1.xml是一种文件

2.区分大小写

3.标签要正确嵌套

4.开始部分<?xml version=’1.0′ encoding=’utf-8′>

5.只能有一个根节点

6.节点可以有属性

为什么写程序时使用xml:

(1)平台兼容非常好,跨平台,语妄言通用

(2)传递数据,保存数据

(3)结构化存储,永久存储

(4)多应用于配置文件,框架中使用

解析xml文件中的内容,也就是读取xml文件内容

首先做个练习,写个xml文件:

练习:2个图书对象信息

建一个xml文件后缀名是.xml

注意:当多个人在使用xml文件里有可能会出现错误,所以我们需要用DTD(document Type Definition)约束xml文件限制

下面我们来介绍下如何解析xml

(1)1.dom(文档对象模型):把解析的xml整个加载到内在,组织成object树

w3c dom dom4

(2)第二种解析sax: 事件驱动式解析,不会在内存中加载整个文档,只会根据自己编缉的事上保存数据

下边是dom 解析案例 Node—–节点(包含范围大,包括空格换行) Element—-元素 不包含空格及元素

导入模块

from xml.dom.minidom imporrt parse

class Book(object):
    def __init__(self,bname=None,price=None,bookWriter=None):
        self.bname=bname
        self.price=price
        self.bookWriter=bookWriter
    def __str__(self):
        return '书名'+self.bname+'\t价格'+self.price+"\t作者"+self.bookWriter
books = []
doc=parse('xml1.xml')
# 得到根节点
root=doc.documentElement
book=root.getElementsByTagName('book')
for b in book:
    bname=b.getElementsByTagName('bookname')[0].childNodes[0].data
    price=b.getElementsByTagName('bookPrice')[0].childNodes[0].data
    bookWriter=b.getElementsByTagName('bookWriter')[0].childNodes[0].data
    books.append(Book(bname,price,bookWriter))
print('书名:\t\t价格:\t作者')
for book in books:
    print(book)



版权声明:本文为baiyan_er原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。