html
— 超文本标记语言支持¶
源代码: Lib/html/__init__.py
此模块定义了用于操作 HTML 的实用程序。
- html.escape(s, quote=True)¶
将字符串 s 中的字符
&
、<
和>
转换为 HTML 安全序列。如果您需要显示可能包含此类字符的文本,请使用此函数。如果可选标志 quote 为 true,则字符 ("
) 和 ('
) 也会被转换;这有助于将其包含在由引号分隔的 HTML 属性值中,例如<a href="...">
。3.2 版新增。
- html.unescape(s)¶
将字符串 s 中的所有命名和数字字符引用(例如
>
、>
、>
)转换为相应的 Unicode 字符。此函数对有效和无效字符引用使用 HTML 5 标准定义的规则,以及HTML 5 命名字符引用列表
。3.4 版新增。
html
包中的子模块有
html.parser
– 采用宽松解析模式的 HTML/XHTML 解析器html.entities
– HTML 实体定义