html --- 超文本标记语言支持¶
源代码: Lib/html/__init__.py
此模块定义了用于操作 HTML 的工具。
- html.escape(s, quote=True)¶
将字符串 s 中的字符
&、<和>转换为 HTML 安全的序列。 如果你需要在 HTML 中显示可能包含此类字符的文本,请使用此函数。如果可选的标志 quote 为真值(默认),字符 (") 与 (') 也同样会被转换;这有助于将其包含在由引号分隔的 HTML 属性值中,如<a href="...">。如果 quote 被设置为 false,则字符 (") 和 (') 将不被翻译。在 3.2 版本加入。
- html.unescape(s)¶
将字符串 s 中所有的命名和数字字符引用(例如
>、>、>)转换为相应的 Unicode 字符。 此函数会使用 HTML 5 标准为有效和无效字符引用所定义的规则,以及HTML 5 命名字符引用列表。在 3.4 版本加入。
html 包中的子模块有:
html.parser– 具有宽松解析模式的 HTML/XHTML 解析器html.entities– HTML 实体定义