python:xml.dom.minidom --- 最小化的 DOM 实现
xml.dom.minidom 是文档对象模型接口的最小化实现,具有与其他语言类似的 API。 它的目标是比完整 DOM 更简单并且更为小巧。 对于 DOM 还不十分熟悉的用户则应当考虑改用 xml.etree.ElementTree 模块来进行 XML 处理。
DOM 应用程序通常会从将某个 XML 解析为 DOM 开始。 使用 xml.dom.minidom 时,这是通过各种解析函数来完成的:
from xml.dom.minidom import parse, parseString
dom1 = parse('c:\\temp\\mydata.xml') # parse an XML file by name
datasource = open('c:\\temp\\mydata.xml')
dom2 = parse(datasource) # parse an open file
dom3 = parseString('<myxml>Some data<empty/> some more data</myxml>')
parse() 函数可接受一个文件名或者打开的文件对象。
xml.dom.minidom.parse(filename_or_file, parser=None, bufsize=None)
根据给定的输入返回一个 Document。 filename_or_file 可以是一个文件名,或是一个文件类对象。 如果给定 parser 则它必须是一个 SAX2 解析器对象。 此函数将修改解析器的处理程序并激活命名空间支持;其他解析器配置(例如设置一个实体求解器)必须已经提前完成。
如果你将 XML 存放为字符串形式,则可以改用 parseString() 函数:
xml.dom.minidom.parseString(string, parser=None)
返回一个代表 string 的 Document。 此方法会为指定字符串创建一个 io.StringIO 对象并将其传递给 parse()。
两个函数均返回一个代表文档内容的 Document 对象。object representing the content of the document.
parse() 和 parseString() 函数所做的是将 XML 解析器连接到一个 “DOM 构建器”,它可以从任意 SAX 解析器接收解析事件并将其转换为 DOM 树结构。 这两个函数的名称可能有些误导性,但在学习此接口时是很容易掌握的。 文档解析操作将在这两个函数返回之前完成;简单地说这两个函数本身并不提供解析器实现。
你也可以通过在一个 “DOM 实现” 对象上调用方法来创建 Document。 此对象可通过调用 xml.dom 包或者 xml.dom.minidom 模块中的 getDOMImplementation() 函数来获取。 一旦你获得了一个 Document&