结构化标记处理工具¶
Python 支持多种模块来处理各种形式的结构化数据标记。这包括用于处理标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及用于处理可扩展标记语言(XML)的多个接口。
html--- 超文本标记语言支持html.parser--- 简单的 HTML 和 XHTML 解析器html.entities--- HTML 通用实体定义- XML 处理模块
xml.etree.ElementTree--- ElementTree XML APIxml.dom--- 文档对象模型 APIxml.dom.minidom--- 最小 DOM 实现xml.dom.pulldom--- 支持构建部分 DOM 树xml.sax--- 对 SAX2 解析器的支持xml.sax.handler--- SAX 处理程序的基类xml.sax.saxutils--- SAX 工具xml.sax.xmlreader--- XML 解析器接口xml.parsers.expat--- 使用 Expat 快速解析 XML