结构化标记处理工具¶
Python 支持各种模块来处理各种形式的结构化数据标记。这包括用于处理标准通用标记语言 (SGML) 和超文本标记语言 (HTML) 的模块,以及用于处理可扩展标记语言 (XML) 的多个接口。
html
— 超文本标记语言支持html.parser
— 简单 HTML 和 XHTML 解析器html.entities
— HTML 常规实体的定义- XML 处理模块
xml.etree.ElementTree
— ElementTree XML APIxml.dom
— 文档对象模型 APIxml.dom.minidom
— 最小 DOM 实现xml.dom.pulldom
— 对构建部分 DOM 树的支持xml.sax
— 对 SAX2 解析器的支持xml.sax.handler
— SAX 处理程序的基类xml.sax.saxutils
— SAX 工具xml.sax.xmlreader
— XML 解析器接口xml.parsers.expat
— 使用 Expat 进行快速 XML 解析