注解最佳实践¶
- 作者:
Larry Hastings
在 Python 3.10 及更高版本中访问对象的注解字典¶
Python 3.10 向标准库添加了一个新函数:inspect.get_annotations()
。在 Python 3.10 及更高版本中,调用此函数是访问任何支持注解的对象的注解字典的最佳实践。此函数还可以为您“解字符串化”字符串化注解。
如果由于某种原因 inspect.get_annotations()
不适用于您的用例,您可以手动访问 __annotations__
数据成员。Python 3.10 中此操作的最佳实践也发生了变化:从 Python 3.10 开始,保证 o.__annotations__
始终适用于 Python 函数、类和模块。如果您确定您正在检查的对象是这三个特定对象之一,则可以直接使用 o.__annotations__
来访问对象的注解字典。
但是,其他类型的可调用对象(例如,由 functools.partial()
创建的可调用对象)可能没有定义 __annotations__
属性。在 Python 3.10 及更高版本中,当访问可能未知的对象的 __annotations__
时,最佳实践是使用三个参数调用 getattr()
,例如 getattr(o, '__annotations__', None)
。
在 Python 3.10 之前,访问没有定义注解但具有带注解的父类的类将返回父类的 __annotations__
。在 Python 3.10 及更高版本中,子类的注解将为空字典。
在 Python 3.9 及更低版本中访问对象的注解字典¶
在 Python 3.9 及更低版本中,访问对象的注解字典比在更高版本中复杂得多。问题在于这些旧版本 Python 中的设计缺陷,特别是与类注解有关。
访问其他对象(函数、其他可调用对象和模块)的注解字典的最佳实践与 3.10 的最佳实践相同,假设您没有调用 inspect.get_annotations()
:您应该使用三参数的 getattr()
来访问对象的 __annotations__
属性。
不幸的是,这并不是类的最佳实践。问题在于,由于 __annotations__
在类上是可选的,并且由于类可以从其基类继承属性,因此访问类的 __annotations__
属性可能会无意中返回基类的注解字典。例如
class Base:
a: int = 3
b: str = 'abc'
class Derived(Base):
pass
print(Derived.__annotations__)
这将打印 Base
的注解字典,而不是 Derived
的。
如果您正在检查的对象是类 (isinstance(o, type)
),您的代码将必须具有单独的代码路径。在这种情况下,最佳实践依赖于 Python 3.9 及更早版本的实现细节:如果一个类定义了注解,它们将存储在该类的 __dict__
字典中。由于类可能定义了也可能没有定义注解,因此最佳实践是调用类字典的 get()
方法。
总而言之,以下是一些示例代码,可在 Python 3.9 及更早版本中安全地访问任意对象上的 __annotations__
属性
if isinstance(o, type):
ann = o.__dict__.get('__annotations__', None)
else:
ann = getattr(o, '__annotations__', None)
运行此代码后,ann
应该是一个字典或 None
。我们建议您在使用 isinstance()
进一步检查之前,仔细检查 ann
的类型。
请注意,某些特殊的或格式错误的类型对象可能没有 __dict__
属性,因此为了更加安全,您可能还希望使用 getattr()
来访问 __dict__
。
手动解字符串化字符串化注解¶
在某些注解可能是“字符串化”的情况下,并且您希望计算这些字符串以生成它们所代表的 Python 值,最好调用 inspect.get_annotations()
来为您完成这项工作。
如果您使用的是 Python 3.9 或更早版本,或者由于某种原因无法使用 inspect.get_annotations()
,则需要复制其逻辑。我们建议您检查当前 Python 版本中 inspect.get_annotations()
的实现并遵循类似的方法。
简而言之,如果您希望计算任意对象 o
上的字符串化注解
如果
o
是模块,则在调用eval()
时使用o.__dict__
作为globals
。如果
o
是一个类,则在调用eval()
时,使用sys.modules[o.__module__].__dict__
作为globals
,使用dict(vars(o))
作为locals
。如果
o
是使用functools.update_wrapper()
、functools.wraps()
或functools.partial()
包装的可调用对象,则通过访问o.__wrapped__
或o.func
(视情况而定)迭代地解包它,直到找到根未包装的函数。如果
o
是可调用对象(但不是类),则在调用eval()
时,使用o.__globals__
作为全局变量。
但是,并非所有用作注解的字符串值都可以通过 eval()
成功转换为 Python 值。理论上,字符串值可以包含任何有效的字符串,并且在实践中,存在有效的用例,即类型提示需要使用 无法 求值的字符串值进行注释。例如:
PEP 604 使用
|
的联合类型,在 Python 3.10 添加对此的支持之前。运行时不需要的定义,仅在
typing.TYPE_CHECKING
为真时导入。
如果 eval()
尝试求值此类值,则会失败并引发异常。因此,在设计使用注解的库 API 时,建议仅在调用方明确请求时才尝试求值字符串值。
所有 Python 版本中 __annotations__
的最佳实践¶
您应避免直接分配给对象的
__annotations__
成员。让 Python 管理设置__annotations__
。如果您确实直接分配给对象的
__annotations__
成员,则应始终将其设置为dict
对象。如果您直接访问对象的
__annotations__
成员,则应确保它是一个字典,然后再尝试检查其内容。您应避免修改
__annotations__
字典。您应避免删除对象的
__annotations__
属性。
__annotations__
的怪癖¶
在所有 Python 3 版本中,如果该对象上未定义任何注解,则函数对象会延迟创建注解字典。您可以使用 del fn.__annotations__
删除 __annotations__
属性,但是如果您随后访问 fn.__annotations__
,则该对象将创建一个新的空字典,并将其存储并作为其注解返回。在函数延迟创建其注解字典之前删除函数上的注解会抛出 AttributeError
;连续两次使用 del fn.__annotations__
保证始终抛出 AttributeError
。
以上段落中的所有内容也适用于 Python 3.10 及更高版本中的类和模块对象。
在所有 Python 3 版本中,您可以将函数对象上的 __annotations__
设置为 None
。但是,随后使用 fn.__annotations__
访问该对象上的注解将按照本节第一段的说明延迟创建一个空字典。这对于任何 Python 版本中的模块和类都不适用;这些对象允许将 __annotations__
设置为任何 Python 值,并将保留设置的任何值。
如果 Python 为您字符串化注解(使用 from __future__ import annotations
),并且您指定一个字符串作为注解,则该字符串本身将被引用。实际上,注解被引用了两次。例如:
from __future__ import annotations
def foo(a: "str"): pass
print(foo.__annotations__)
这将打印 {'a': "'str'"}
。这不应真正被视为“怪癖”;在此提及只是因为它可能令人惊讶。