html
— 超文本标记语言支持¶
源代码: Lib/html/__init__.py
此模块定义了用于操作 HTML 的实用工具。
- html.escape(s, quote=True)¶
将字符串 *s* 中的字符
&
、<
和>
转换为 HTML 安全的序列。 如果需要在 HTML 中显示可能包含此类字符的文本,请使用此方法。 如果可选标志 *quote* 为 true,则字符("
)和('
)也会被转换; 这有助于将其包含在以引号分隔的 HTML 属性值中,例如<a href="...">
。3.2 版本新增。
- html.unescape(s)¶
将字符串 *s* 中的所有命名和数字字符引用(例如,
>
、>
、>
)转换为相应的 Unicode 字符。 此函数使用 HTML 5 标准定义的规则来处理有效和无效的字符引用,以及HTML 5 命名字符引用的列表
。3.4 版本新增。
html
包中的子模块是
html.parser
– 具有宽松解析模式的 HTML/XHTML 解析器html.entities
– HTML 实体定义