python：xml.dom.minidom --- 最小化的 DOM 实现

最新推荐文章于 2025-03-03 08:15:00 发布

实战大师

最新推荐文章于 2025-03-03 08:15:00 发布

阅读量986

点赞数 1

文章标签： python xml java

本文链接：https://blog.csdn.net/weixin_39145520/article/details/129398112

版权

xml.dom.minidom是Python中用于XML处理的简化DOM实现，提供parse()和parseString()函数进行XML解析。它支持DOM1.0和部分DOM2特性，如命名空间。用户可以通过getDOMImplementation()创建Document，然后添加子节点构建DOM树。DOM对象的方法如unlink()、writexml()和toxml()用于操作和输出XML数据。示例程序展示了如何使用minidom解析和处理XML文档。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

xml.dom.minidom 是文档对象模型接口的最小化实现，具有与其他语言类似的 API。它的目标是比完整 DOM 更简单并且更为小巧。对于 DOM 还不十分熟悉的用户则应当考虑改用 xml.etree.ElementTree 模块来进行 XML 处理。
DOM 应用程序通常会从将某个 XML 解析为 DOM 开始。使用 xml.dom.minidom 时，这是通过各种解析函数来完成的:

from xml.dom.minidom import parse, parseString

dom1 = parse('c:\\temp\\mydata.xml')  # parse an XML file by name

datasource = open('c:\\temp\\mydata.xml')
dom2 = parse(datasource)  # parse an open file

dom3 = parseString('<myxml>Some data<empty/> some more data</myxml>')

parse() 函数可接受一个文件名或者打开的文件对象。

xml.dom.minidom.parse(filename_or_file, parser=None, bufsize=None)
根据给定的输入返回一个 Document。 filename_or_file 可以是一个文件名，或是一个文件类对象。如果给定 parser 则它必须是一个 SAX2 解析器对象。此函数将修改解析器的处理程序并激活命名空间支持；其他解析器配置（例如设置一个实体求解器）必须已经提前完成。

如果你将 XML 存放为字符串形式，则可以改用 parseString() 函数:

xml.dom.minidom.parseString(string, parser=None)
返回一个代表 string 的 Document。此方法会为指定字符串创建一个 io.StringIO 对象并将其传递给 parse()。

两个函数均返回一个代表文档内容的 Document 对象。object representing the content of the document.

parse() 和 parseString() 函数所做的是将 XML 解析器连接到一个 “DOM 构建器”，它可以从任意 SAX 解析器接收解析事件并将其转换为 DOM 树结构。这两个函数的名称可能有些误导性，但在学习此接口时是很容易掌握的。文档解析操作将在这两个函数返回之前完成；简单地说这两个函数本身并不提供解析器实现。

你也可以通过在一个 “DOM 实现” 对象上调用方法来创建 Document。此对象可通过调用 xml.dom 包或者 xml.dom.minidom 模块中的 getDOMImplementation() 函数来获取。一旦你获得了一个 Document&