html
--- 超文本标记语言支持¶
源代码: Lib/html/__init__.py
此模块定义了用于操作 HTML 的工具。
- html.escape(s, quote=True)¶
将字符串 s 中的字符
&
、<
和>
转换为 HTML 安全的序列。 如果你需要在 HTML 中显示可能包含此类字符的文本,请使用此函数。如果可选的标志 quote 为真值(默认),字符 ("
) 与 ('
) 也同样会被转换;这有助于将其包含在由引号分隔的 HTML 属性值中,如<a href="...">
。如果 quote 被设置为 false,则字符 ("
) 和 ('
) 将不被翻译。在 3.2 版本加入。
- html.unescape(s)¶
将字符串 s 中所有的命名和数字字符引用(例如
>
、>
、>
)转换为相应的 Unicode 字符。 此函数会使用 HTML 5 标准为有效和无效字符引用所定义的规则,以及HTML 5 命名字符引用列表
。在 3.4 版本加入。
html
包中的子模块有:
html.parser
– 具有宽松解析模式的 HTML/XHTML 解析器html.entities
– HTML 实体定义