ctypes
— Python 的外部函数库¶
源代码: Lib/ctypes
ctypes
是 Python 的一个外部函数库。它提供与 C 兼容的数据类型,并允许调用 DLL 或共享库中的函数。它可用于在纯 Python 中封装这些库。
ctypes 教程¶
注意:本教程中的代码示例使用 doctest
来确保它们确实有效。由于某些代码示例在 Linux、Windows 或 macOS 下的行为有所不同,因此它们在注释中包含 doctest 指令。
注意:某些代码示例引用了 ctypes 的 c_int
类型。在 sizeof(long) == sizeof(int)
的平台上,它是 c_long
的别名。因此,如果您期望 c_int
时打印 c_long
,请不要感到困惑——它们实际上是相同的类型。
加载动态链接库¶
ctypes
导出 cdll 对象,在 Windows 上导出 windll 和 oledll 对象,用于加载动态链接库。
您可以通过将它们作为这些对象的属性访问来加载库。cdll 加载使用标准 cdecl
调用约定导出函数的库,而 windll 库使用 stdcall
调用约定调用函数。oledll 也使用 stdcall
调用约定,并假定函数返回 Windows HRESULT
错误代码。当函数调用失败时,该错误代码用于自动引发 OSError
异常。
在 3.3 版本中更改: Windows 错误曾经引发 WindowsError
,现在是 OSError
的别名。
以下是一些 Windows 示例。请注意,msvcrt
是包含大多数标准 C 函数的 MS 标准 C 库,并使用 cdecl
调用约定
>>> from ctypes import *
>>> print(windll.kernel32)
<WinDLL 'kernel32', handle ... at ...>
>>> print(cdll.msvcrt)
<CDLL 'msvcrt', handle ... at ...>
>>> libc = cdll.msvcrt
>>>
Windows 会自动追加常用的 .dll
文件后缀。
注意
通过 cdll.msvcrt
访问标准 C 库将使用该库的过时版本,该版本可能与 Python 使用的版本不兼容。如果可能,请使用原生 Python 功能,或者导入并使用 msvcrt
模块。
在 Linux 上,需要指定包括扩展名的文件名才能加载库,因此不能使用属性访问来加载库。应使用 dll 加载器的 LoadLibrary()
方法,或者应通过调用构造函数创建 CDLL 实例来加载库
>>> cdll.LoadLibrary("libc.so.6")
<CDLL 'libc.so.6', handle ... at ...>
>>> libc = CDLL("libc.so.6")
>>> libc
<CDLL 'libc.so.6', handle ... at ...>
>>>
访问已加载的 dll 中的函数¶
函数作为 dll 对象的属性访问
>>> libc.printf
<_FuncPtr object at 0x...>
>>> print(windll.kernel32.GetModuleHandleA)
<_FuncPtr object at 0x...>
>>> print(windll.kernel32.MyOwnFunction)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "ctypes.py", line 239, in __getattr__
func = _StdcallFuncPtr(name, self)
AttributeError: function 'MyOwnFunction' not found
>>>
请注意,像 kernel32
和 user32
这样的 win32 系统 dll 通常会导出函数的 ANSI 版本以及 UNICODE 版本。UNICODE 版本导出时名称后附加 W
,而 ANSI 版本导出时名称后附加 A
。win32 GetModuleHandle
函数(它返回给定模块名称的模块句柄)具有以下 C 原型,并且根据是否定义了 UNICODE,使用宏来将其中一个公开为 GetModuleHandle
/* ANSI version */
HMODULE GetModuleHandleA(LPCSTR lpModuleName);
/* UNICODE version */
HMODULE GetModuleHandleW(LPCWSTR lpModuleName);
windll 不会尝试通过魔术来选择其中一个,您必须通过显式指定 GetModuleHandleA
或 GetModuleHandleW
来访问所需的版本,然后分别使用字节或字符串对象来调用它。
有时,dll 导出的函数名称不是有效的 Python 标识符,例如 "??2@YAPAXI@Z"
。在这种情况下,您必须使用 getattr()
来检索该函数
>>> getattr(cdll.msvcrt, "??2@YAPAXI@Z")
<_FuncPtr object at 0x...>
>>>
在 Windows 上,某些 dll 导出的函数不是按名称而是按序号。可以通过使用序号索引 dll 对象来访问这些函数
>>> cdll.kernel32[1]
<_FuncPtr object at 0x...>
>>> cdll.kernel32[0]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "ctypes.py", line 310, in __getitem__
func = _StdcallFuncPtr(name, self)
AttributeError: function ordinal 0 not found
>>>
调用函数¶
您可以像调用任何其他 Python 可调用对象一样调用这些函数。此示例使用 rand()
函数,该函数不接受任何参数并返回一个伪随机整数
>>> print(libc.rand())
1804289383
在 Windows 上,您可以调用 GetModuleHandleA()
函数,它返回 win32 模块句柄(将 None
作为单个参数传递,以便使用 NULL
指针调用它)
>>> print(hex(windll.kernel32.GetModuleHandleA(None)))
0x1d000000
>>>
当您使用 cdecl
调用约定调用 stdcall
函数时,或者反之亦然时,将引发 ValueError
>>> cdll.kernel32.GetModuleHandleA(None)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: Procedure probably called with not enough arguments (4 bytes missing)
>>>
>>> windll.msvcrt.printf(b"spam")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: Procedure probably called with too many arguments (4 bytes in excess)
>>>
要找出正确的调用约定,您必须查看 C 头文件或您要调用的函数的文档。
在 Windows 上,ctypes
使用 win32 结构化异常处理来防止在调用函数时使用无效的参数值时出现一般保护错误而崩溃。
>>> windll.kernel32.GetModuleHandleA(32)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
OSError: exception: access violation reading 0x00000020
>>>
然而,使用 ctypes
仍然有足够的方法使 Python 崩溃,因此您应该始终小心。faulthandler
模块有助于调试崩溃(例如,由错误的 C 库调用产生的段错误)。
None
、整数、字节对象和(unicode)字符串是唯一可以直接用作这些函数调用参数的原生 Python 对象。None
作为 C NULL
指针传递,字节对象和字符串作为指向包含其数据的内存块的指针传递(char* 或 wchar_t*)。Python 整数作为平台的默认 C int 类型传递,它们的值被屏蔽以适合 C 类型。
在我们继续调用具有其他参数类型的函数之前,我们必须更多地了解 ctypes
数据类型。
基本数据类型¶
ctypes
定义了一些原始的 C 兼容数据类型。
ctypes 类型 |
C 类型 |
Python 类型 |
---|---|---|
_Bool |
bool (1) |
|
char |
1 字符字节对象 |
|
|
1 字符字符串 |
|
char |
int |
|
unsigned char |
int |
|
short |
int |
|
unsigned short |
int |
|
int |
int |
|
unsigned int |
int |
|
long |
int |
|
unsigned long |
int |
|
__int64 或 long long |
int |
|
unsigned __int64 或 unsigned long long |
int |
|
|
int |
|
|
int |
|
|
int |
|
float |
float |
|
double |
float |
|
long double |
float |
|
char* (NUL 终止) |
字节对象或 |
|
wchar_t* (NUL 终止) |
字符串或 |
|
void* |
整数或 |
构造函数接受任何具有真值的对象。
所有这些类型都可以通过使用正确类型和值的可选初始化器来调用它们来创建。
>>> c_int()
c_long(0)
>>> c_wchar_p("Hello, World")
c_wchar_p(140018365411392)
>>> c_ushort(-3)
c_ushort(65533)
>>>
由于这些类型是可变的,因此它们的值也可以在之后更改。
>>> i = c_int(42)
>>> print(i)
c_long(42)
>>> print(i.value)
42
>>> i.value = -99
>>> print(i.value)
-99
>>>
将新值分配给指针类型 c_char_p
、 c_wchar_p
和 c_void_p
的实例会更改它们指向的 *内存位置*,*而不是* 内存块的 *内容*(当然不是,因为 Python 字节对象是不可变的)。
>>> s = "Hello, World"
>>> c_s = c_wchar_p(s)
>>> print(c_s)
c_wchar_p(139966785747344)
>>> print(c_s.value)
Hello World
>>> c_s.value = "Hi, there"
>>> print(c_s) # the memory location has changed
c_wchar_p(139966783348904)
>>> print(c_s.value)
Hi, there
>>> print(s) # first object is unchanged
Hello, World
>>>
但是,您应该小心,不要将它们传递给期望指向可变内存的指针的函数。如果需要可变内存块,则 ctypes 具有 create_string_buffer()
函数,该函数以各种方式创建它们。可以使用 raw
属性访问(或更改)当前内存块的内容;如果您想将其作为 NUL 终止的字符串访问,请使用 value
属性。
>>> from ctypes import *
>>> p = create_string_buffer(3) # create a 3 byte buffer, initialized to NUL bytes
>>> print(sizeof(p), repr(p.raw))
3 b'\x00\x00\x00'
>>> p = create_string_buffer(b"Hello") # create a buffer containing a NUL terminated string
>>> print(sizeof(p), repr(p.raw))
6 b'Hello\x00'
>>> print(repr(p.value))
b'Hello'
>>> p = create_string_buffer(b"Hello", 10) # create a 10 byte buffer
>>> print(sizeof(p), repr(p.raw))
10 b'Hello\x00\x00\x00\x00\x00'
>>> p.value = b"Hi"
>>> print(sizeof(p), repr(p.raw))
10 b'Hi\x00lo\x00\x00\x00\x00\x00'
>>>
create_string_buffer()
函数取代了旧的 c_buffer()
函数(仍然可用作别名)。要创建包含 C 类型 wchar_t
的 unicode 字符的可变内存块,请使用 create_unicode_buffer()
函数。
调用函数,继续¶
请注意,printf 打印到真实的标准输出通道,*而不是* sys.stdout
,因此这些示例仅在控制台提示符下有效,在 IDLE 或 PythonWin 中无效。
>>> printf = libc.printf
>>> printf(b"Hello, %s\n", b"World!")
Hello, World!
14
>>> printf(b"Hello, %S\n", "World!")
Hello, World!
14
>>> printf(b"%d bottles of beer\n", 42)
42 bottles of beer
19
>>> printf(b"%f bottles of beer\n", 42.5)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ctypes.ArgumentError: argument 2: TypeError: Don't know how to convert parameter 2
>>>
如前所述,除整数、字符串和字节对象之外的所有 Python 类型都必须包装在它们对应的 ctypes
类型中,以便可以将它们转换为所需的 C 数据类型。
>>> printf(b"An int %d, a double %f\n", 1234, c_double(3.14))
An int 1234, a double 3.140000
31
>>>
调用可变参数函数¶
在许多平台上,通过 ctypes 调用可变参数函数与调用具有固定数量参数的函数完全相同。在某些平台,特别是 Apple 平台的 ARM64 上,可变参数函数的调用约定与常规函数的调用约定不同。
在这些平台上,需要为常规的非可变参数函数参数指定 argtypes
属性。
libc.printf.argtypes = [ctypes.c_char_p]
由于指定该属性不会抑制可移植性,因此建议始终为所有可变参数函数指定 argtypes
。
使用您自己的自定义数据类型调用函数¶
您还可以自定义 ctypes
参数转换,以允许将您自己的类的实例用作函数参数。ctypes
查找 _as_parameter_
属性,并将其用作函数参数。该属性必须是整数、字符串、字节、 ctypes
实例或具有 _as_parameter_
属性的对象。
>>> class Bottles:
... def __init__(self, number):
... self._as_parameter_ = number
...
>>> bottles = Bottles(42)
>>> printf(b"%d bottles of beer\n", bottles)
42 bottles of beer
19
>>>
如果您不想将实例的数据存储在 _as_parameter_
实例变量中,则可以定义一个 property
,该属性使该属性可在请求时使用。
指定所需的参数类型(函数原型)¶
可以通过设置 argtypes
属性来指定从 DLL 导出的函数的所需参数类型。
argtypes
必须是 C 数据类型的序列(printf()
函数可能不是一个很好的例子,因为它根据格式字符串采用可变数量和不同类型的参数,另一方面,这对于尝试此功能非常方便)。
>>> printf.argtypes = [c_char_p, c_char_p, c_int, c_double]
>>> printf(b"String '%s', Int %d, Double %f\n", b"Hi", 10, 2.2)
String 'Hi', Int 10, Double 2.200000
37
>>>
指定格式可以防止不兼容的参数类型(就像 C 函数的原型一样),并尝试将参数转换为有效类型。
>>> printf(b"%d %d %d", 1, 2, 3)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ctypes.ArgumentError: argument 2: TypeError: 'int' object cannot be interpreted as ctypes.c_char_p
>>> printf(b"%s %d %f\n", b"X", 2, 3)
X 2 3.000000
13
>>>
如果您定义了自己的类,并将其传递给函数调用,则必须为这些类实现 from_param()
类方法,以便能够在 argtypes
序列中使用它们。from_param()
类方法接收传递给函数调用的 Python 对象,它应该执行类型检查或任何必要的操作,以确保该对象是可以接受的,然后返回对象本身,其 _as_parameter_
属性,或者您希望在这种情况下作为 C 函数参数传递的任何内容。同样,结果应该是一个整数、字符串、字节、一个 ctypes
实例,或者一个具有 _as_parameter_
属性的对象。
返回类型¶
默认情况下,假定函数返回 C int 类型。可以通过设置函数对象的 restype
属性来指定其他返回类型。
time()
的 C 原型是 time_t time(time_t *)
。因为 time_t
的类型可能与默认返回类型 int 不同,所以您应该指定 restype
属性
>>> libc.time.restype = c_time_t
可以使用 argtypes
来指定参数类型
>>> libc.time.argtypes = (POINTER(c_time_t),)
要使用 NULL
指针作为第一个参数调用函数,请使用 None
>>> print(libc.time(None))
1150640792
这是一个更高级的示例,它使用了 strchr()
函数,该函数需要一个字符串指针和一个 char,并返回一个指向字符串的指针
>>> strchr = libc.strchr
>>> strchr(b"abcdef", ord("d"))
8059983
>>> strchr.restype = c_char_p # c_char_p is a pointer to a string
>>> strchr(b"abcdef", ord("d"))
b'def'
>>> print(strchr(b"abcdef", ord("x")))
None
>>>
如果您想避免上面的 ord("x")
调用,则可以设置 argtypes
属性,第二个参数将从一个单字符 Python 字节对象转换为 C char
>>> strchr.restype = c_char_p
>>> strchr.argtypes = [c_char_p, c_char]
>>> strchr(b"abcdef", b"d")
b'def'
>>> strchr(b"abcdef", b"def")
Traceback (most recent call last):
ctypes.ArgumentError: argument 2: TypeError: one character bytes, bytearray or integer expected
>>> print(strchr(b"abcdef", b"x"))
None
>>> strchr(b"abcdef", b"d")
b'def'
>>>
如果外部函数返回一个整数,您还可以使用可调用的 Python 对象(例如函数或类)作为 restype
属性。将使用 C 函数返回的整数调用该可调用对象,并且此调用的结果将用作函数调用的结果。这对于检查错误返回值并自动引发异常很有用
>>> GetModuleHandle = windll.kernel32.GetModuleHandleA
>>> def ValidHandle(value):
... if value == 0:
... raise WinError()
... return value
...
>>>
>>> GetModuleHandle.restype = ValidHandle
>>> GetModuleHandle(None)
486539264
>>> GetModuleHandle("something silly")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "<stdin>", line 3, in ValidHandle
OSError: [Errno 126] The specified module could not be found.
>>>
WinError
是一个函数,它将调用 Windows FormatMessage()
api 以获取错误代码的字符串表示形式,并返回一个异常。WinError
接受一个可选的错误代码参数,如果没有使用该参数,它将调用 GetLastError()
来检索该参数。
请注意,通过 errcheck
属性可以使用更强大的错误检查机制;有关详细信息,请参见参考手册。
传递指针(或:按引用传递参数)¶
有时,C api 函数需要一个指向数据类型的指针作为参数,可能是为了写入相应的位置,或者如果数据太大而无法按值传递。这也称为按引用传递参数。
ctypes
导出 byref()
函数,该函数用于按引用传递参数。可以使用 pointer()
函数实现相同的效果,尽管 pointer()
会执行更多的工作,因为它会构造一个真实的指针对象,因此如果您在 Python 本身中不需要该指针对象,则使用 byref()
会更快
>>> i = c_int()
>>> f = c_float()
>>> s = create_string_buffer(b'\000' * 32)
>>> print(i.value, f.value, repr(s.value))
0 0.0 b''
>>> libc.sscanf(b"1 3.14 Hello", b"%d %f %s",
... byref(i), byref(f), s)
3
>>> print(i.value, f.value, repr(s.value))
1 3.1400001049 b'Hello'
>>>
结构体和联合体¶
结构体和联合体必须从 Structure
和 Union
基类派生,这些基类在 ctypes
模块中定义。每个子类都必须定义一个 _fields_
属性。_fields_
必须是一个 2 元组的列表,其中包含一个字段名称和一个字段类型。
字段类型必须是一个 ctypes
类型,如 c_int
,或任何其他派生的 ctypes
类型:结构体、联合体、数组、指针。
这是一个 POINT 结构的简单示例,其中包含两个名为 x 和 y 的整数,并且还展示了如何在构造函数中初始化结构体
>>> from ctypes import *
>>> class POINT(Structure):
... _fields_ = [("x", c_int),
... ("y", c_int)]
...
>>> point = POINT(10, 20)
>>> print(point.x, point.y)
10 20
>>> point = POINT(y=5)
>>> print(point.x, point.y)
0 5
>>> POINT(1, 2, 3)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: too many initializers
>>>
但是,您可以构建更复杂的结构。结构体本身可以通过使用结构体作为字段类型来包含其他结构体。
这是一个 RECT 结构体,其中包含两个名为 upperleft 和 lowerright 的 POINT
>>> class RECT(Structure):
... _fields_ = [("upperleft", POINT),
... ("lowerright", POINT)]
...
>>> rc = RECT(point)
>>> print(rc.upperleft.x, rc.upperleft.y)
0 5
>>> print(rc.lowerright.x, rc.lowerright.y)
0 0
>>>
嵌套结构也可以在构造函数中以多种方式初始化
>>> r = RECT(POINT(1, 2), POINT(3, 4))
>>> r = RECT((1, 2), (3, 4))
字段 描述符 可以从类中检索,它们对于调试很有用,因为它们可以提供有用的信息
>>> print(POINT.x)
<Field type=c_long, ofs=0, size=4>
>>> print(POINT.y)
<Field type=c_long, ofs=4, size=4>
>>>
警告
ctypes
不支持按值将带有位字段的联合体或结构体传递给函数。虽然这可能在 32 位 x86 上有效,但该库不保证在一般情况下有效。带有位字段的联合体和结构体应始终通过指针传递给函数。
结构体/联合体对齐和字节顺序¶
默认情况下,结构体和联合体字段的对齐方式与 C 编译器的方式相同。可以通过在子类定义中指定 _pack_
类属性来覆盖此行为。必须将其设置为正整数,并指定字段的最大对齐方式。这与 MSVC 中的 #pragma pack(n)
的作用相同。还可以为子类本身如何打包设置最小对齐方式,这与 MSVC 中 #pragma align(n)
的工作方式相同。可以通过在子类定义中指定一个 :_align_
类属性来实现。
ctypes
对结构体和联合体使用本机字节顺序。要构建具有非本机字节顺序的结构体,可以使用 BigEndianStructure
、 LittleEndianStructure
、 BigEndianUnion
和 LittleEndianUnion
基类之一。这些类不能包含指针字段。
结构体和联合体中的位字段¶
可以创建包含位字段的结构体和联合体。位字段仅适用于整数字段,位宽度在 _fields_
元组中指定为第三项
>>> class Int(Structure):
... _fields_ = [("first_16", c_int, 16),
... ("second_16", c_int, 16)]
...
>>> print(Int.first_16)
<Field type=c_long, ofs=0:0, bits=16>
>>> print(Int.second_16)
<Field type=c_long, ofs=0:16, bits=16>
>>>
数组¶
数组是包含相同类型的固定数量实例的序列。
创建数组类型的推荐方法是将数据类型乘以一个正整数
TenPointsArrayType = POINT * 10
这是一个有点人为的数据类型示例,一个包含 4 个 POINT 的结构体,以及其他内容
>>> from ctypes import *
>>> class POINT(Structure):
... _fields_ = ("x", c_int), ("y", c_int)
...
>>> class MyStruct(Structure):
... _fields_ = [("a", c_int),
... ("b", c_float),
... ("point_array", POINT * 4)]
>>>
>>> print(len(MyStruct().point_array))
4
>>>
实例的创建方式与通常相同,即通过调用类
arr = TenPointsArrayType()
for pt in arr:
print(pt.x, pt.y)
上面的代码打印一系列 0 0
行,因为数组内容初始化为零。
也可以指定正确类型的初始化程序
>>> from ctypes import *
>>> TenIntegers = c_int * 10
>>> ii = TenIntegers(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
>>> print(ii)
<c_long_Array_10 object at 0x...>
>>> for i in ii: print(i, end=" ")
...
1 2 3 4 5 6 7 8 9 10
>>>
指针¶
指针实例是通过在 ctypes
类型上调用 pointer()
函数来创建的
>>> from ctypes import *
>>> i = c_int(42)
>>> pi = pointer(i)
>>>
指针实例具有一个 contents
属性,该属性返回指针指向的对象,上面的 i
对象
>>> pi.contents
c_long(42)
>>>
请注意,ctypes
没有 OOR(原始对象返回),它每次检索属性时都会构造一个新的等效对象。
>>> pi.contents is i
False
>>> pi.contents is pi.contents
False
>>>
将另一个 c_int
实例分配给指针的 contents 属性会导致指针指向存储该实例的内存位置。
>>> i = c_int(99)
>>> pi.contents = i
>>> pi.contents
c_long(99)
>>>
指针实例也可以使用整数进行索引。
>>> pi[0]
99
>>>
赋值给整数索引会更改指向的值。
>>> print(i)
c_long(99)
>>> pi[0] = 22
>>> print(i)
c_long(22)
>>>
也可以使用除 0 以外的索引,但您必须知道自己在做什么,就像在 C 中一样:您可以访问或更改任意内存位置。通常,只有在从 C 函数接收到指针,并且您知道该指针实际上指向的是数组而不是单个项目时,才使用此功能。
在幕后,pointer()
函数不仅仅是创建指针实例,它还必须首先创建指针类型。这是通过 POINTER()
函数完成的,该函数接受任何 ctypes
类型,并返回一个新类型。
>>> PI = POINTER(c_int)
>>> PI
<class 'ctypes.LP_c_long'>
>>> PI(42)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: expected c_long instead of int
>>> PI(c_int(42))
<ctypes.LP_c_long object at 0x...>
>>>
在没有参数的情况下调用指针类型会创建一个 NULL
指针。NULL
指针的布尔值为 False
。
>>> null_ptr = POINTER(c_int)()
>>> print(bool(null_ptr))
False
>>>
当取消引用指针时,ctypes
会检查 NULL
(但取消引用无效的非 NULL
指针会导致 Python 崩溃)。
>>> null_ptr[0]
Traceback (most recent call last):
....
ValueError: NULL pointer access
>>>
>>> null_ptr[0] = 1234
Traceback (most recent call last):
....
ValueError: NULL pointer access
>>>
类型转换¶
通常,ctypes 执行严格的类型检查。这意味着,如果在函数的 argtypes
列表中或结构定义中成员字段的类型为 POINTER(c_int)
,则只接受完全相同类型的实例。此规则有一些例外,ctypes 在这些情况下接受其他对象。例如,您可以传递兼容的数组实例而不是指针类型。因此,对于 POINTER(c_int)
,ctypes 接受 c_int 的数组。
>>> class Bar(Structure):
... _fields_ = [("count", c_int), ("values", POINTER(c_int))]
...
>>> bar = Bar()
>>> bar.values = (c_int * 3)(1, 2, 3)
>>> bar.count = 3
>>> for i in range(bar.count):
... print(bar.values[i])
...
1
2
3
>>>
此外,如果函数参数在 argtypes
中显式声明为指针类型(例如 POINTER(c_int)
),则可以将指向类型的对象(在本例中为 c_int
)传递给该函数。在这种情况下,ctypes 会自动应用所需的 byref()
转换。
要将 POINTER 类型字段设置为 NULL
,您可以分配 None
。
>>> bar.values = None
>>>
有时您会遇到不兼容类型的实例。在 C 中,您可以将一种类型强制转换为另一种类型。ctypes
提供了一个 cast()
函数,可以以相同的方式使用。上面定义的 Bar
结构接受 POINTER(c_int)
指针或 c_int
数组作为其 values
字段,但不接受其他类型的实例。
>>> bar.values = (c_byte * 4)()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: incompatible types, c_byte_Array_4 instance instead of LP_c_long instance
>>>
对于这些情况,cast()
函数非常方便。
cast()
函数可用于将 ctypes 实例强制转换为指向不同 ctypes 数据类型的指针。cast()
接受两个参数,一个 ctypes 对象(是某种指针或可以转换为某种指针),以及一个 ctypes 指针类型。它返回第二个参数的一个实例,该实例引用与第一个参数相同的内存块。
>>> a = (c_byte * 4)()
>>> cast(a, POINTER(c_int))
<ctypes.LP_c_long object at ...>
>>>
因此,cast()
可用于为 Bar
结构的 values
字段赋值。
>>> bar = Bar()
>>> bar.values = cast((c_byte * 4)(), POINTER(c_int))
>>> print(bar.values[0])
0
>>>
不完整类型¶
不完整类型是指其成员尚未指定的结构体、联合体或数组。在 C 中,它们通过前向声明指定,这些声明稍后定义。
struct cell; /* forward declaration */
struct cell {
char *name;
struct cell *next;
};
直接转换为 ctypes 代码是这样的,但它不起作用:
>>> class cell(Structure):
... _fields_ = [("name", c_char_p),
... ("next", POINTER(cell))]
...
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "<stdin>", line 2, in cell
NameError: name 'cell' is not defined
>>>
因为新的 class cell
在类语句本身中不可用。在 ctypes
中,我们可以定义 cell
类,并在类语句之后设置 _fields_
属性。
>>> from ctypes import *
>>> class cell(Structure):
... pass
...
>>> cell._fields_ = [("name", c_char_p),
... ("next", POINTER(cell))]
>>>
让我们尝试一下。我们创建 cell
的两个实例,让它们相互指向,最后跟随指针链几次。
>>> c1 = cell()
>>> c1.name = b"foo"
>>> c2 = cell()
>>> c2.name = b"bar"
>>> c1.next = pointer(c2)
>>> c2.next = pointer(c1)
>>> p = c1
>>> for i in range(8):
... print(p.name, end=" ")
... p = p.next[0]
...
foo bar foo bar foo bar foo bar
>>>
回调函数¶
ctypes
允许从 Python 可调用对象创建 C 可调用的函数指针。这些有时称为回调函数。
首先,您必须为回调函数创建一个类。该类知道调用约定、返回类型以及此函数将接收的参数的数量和类型。
CFUNCTYPE()
工厂函数使用 cdecl
调用约定为回调函数创建类型。在 Windows 上,WINFUNCTYPE()
工厂函数使用 stdcall
调用约定为回调函数创建类型。
这两个工厂函数都以结果类型作为第一个参数调用,回调函数预期的参数类型作为其余参数调用。
我将在此处提供一个示例,该示例使用标准 C 库的 qsort()
函数,该函数用于借助回调函数对项目进行排序。qsort()
将用于对整数数组进行排序。
>>> IntArray5 = c_int * 5
>>> ia = IntArray5(5, 1, 7, 33, 99)
>>> qsort = libc.qsort
>>> qsort.restype = None
>>>
必须使用指向要排序数据的指针、数据数组中的项目数、一个项目的大小以及指向比较函数(回调)的指针来调用 qsort()
。然后,将使用指向项目的两个指针调用回调,如果第一个项目小于第二个项目,则它必须返回一个负整数;如果它们相等,则返回零;否则,返回一个正整数。
因此,我们的回调函数接收指向整数的指针,并且必须返回一个整数。首先,我们为回调函数创建 type
。
>>> CMPFUNC = CFUNCTYPE(c_int, POINTER(c_int), POINTER(c_int))
>>>
首先,这是一个简单的回调,显示它接收到的值。
>>> def py_cmp_func(a, b):
... print("py_cmp_func", a[0], b[0])
... return 0
...
>>> cmp_func = CMPFUNC(py_cmp_func)
>>>
结果
>>> qsort(ia, len(ia), sizeof(c_int), cmp_func)
py_cmp_func 5 1
py_cmp_func 33 99
py_cmp_func 7 33
py_cmp_func 5 7
py_cmp_func 1 7
>>>
现在我们可以实际比较这两个项目并返回有用的结果。
>>> def py_cmp_func(a, b):
... print("py_cmp_func", a[0], b[0])
... return a[0] - b[0]
...
>>>
>>> qsort(ia, len(ia), sizeof(c_int), CMPFUNC(py_cmp_func))
py_cmp_func 5 1
py_cmp_func 33 99
py_cmp_func 7 33
py_cmp_func 1 7
py_cmp_func 5 7
>>>
正如我们可以轻松检查的那样,我们的数组现在已排序。
>>> for i in ia: print(i, end=" ")
...
1 5 7 33 99
>>>
函数工厂可以用作装饰器工厂,因此我们不妨编写:
>>> @CFUNCTYPE(c_int, POINTER(c_int), POINTER(c_int))
... def py_cmp_func(a, b):
... print("py_cmp_func", a[0], b[0])
... return a[0] - b[0]
...
>>> qsort(ia, len(ia), sizeof(c_int), py_cmp_func)
py_cmp_func 5 1
py_cmp_func 33 99
py_cmp_func 7 33
py_cmp_func 1 7
py_cmp_func 5 7
>>>
注意
请确保保留对 CFUNCTYPE()
对象的引用,只要它们在 C 代码中使用。 ctypes
不会这样做,如果您不这样做,它们可能会被垃圾回收,从而在进行回调时导致程序崩溃。
另请注意,如果在 Python 控制之外创建的线程中调用回调函数(例如,由调用回调的外部代码),则 ctypes 在每次调用时都会创建一个新的虚拟 Python 线程。此行为对于大多数目的都是正确的,但这意味着使用 threading.local
存储的值在不同的回调之间不会保留,即使这些调用来自同一个 C 线程也是如此。
访问从 dll 导出的值¶
一些共享库不仅导出函数,还导出变量。Python 库本身的一个示例是 Py_Version
,Python 运行时版本号编码为单个常量整数。
ctypes
可以使用类型的 in_dll()
类方法来访问这样的值。pythonapi 是一个预定义的符号,用于访问 Python C API。
>>> version = ctypes.c_int.in_dll(ctypes.pythonapi, "Py_Version")
>>> print(hex(version.value))
0x30c00a0
一个扩展的例子,也演示了指针的用法,访问了 Python 导出的 PyImport_FrozenModules
指针。
引用该值的文档:
这个指针被初始化为指向一个
_frozen
记录的数组,该数组以一个所有成员均为NULL
或零的记录结束。当导入一个冻结模块时,会在这个表中搜索它。第三方代码可以使用它来提供动态创建的冻结模块集合。
所以,操作这个指针甚至可能很有用。为了限制示例的大小,我们只展示如何使用 ctypes
读取这个表。
>>> from ctypes import *
>>>
>>> class struct_frozen(Structure):
... _fields_ = [("name", c_char_p),
... ("code", POINTER(c_ubyte)),
... ("size", c_int),
... ("get_code", POINTER(c_ubyte)), # Function pointer
... ]
...
>>>
我们已经定义了 _frozen
数据类型,所以我们可以获取指向该表的指针:
>>> FrozenTable = POINTER(struct_frozen)
>>> table = FrozenTable.in_dll(pythonapi, "_PyImport_FrozenBootstrap")
>>>
由于 table
是指向 struct_frozen
记录数组的 pointer
,我们可以遍历它,但我们必须确保我们的循环终止,因为指针没有大小。迟早它可能会因为访问冲突或其他原因而崩溃,所以当遇到 NULL
条目时,最好跳出循环。
>>> for item in table:
... if item.name is None:
... break
... print(item.name.decode("ascii"), item.size)
...
_frozen_importlib 31764
_frozen_importlib_external 41499
zipimport 12345
>>>
标准 Python 有一个冻结模块和一个冻结包(由负的 size
成员指示)这个事实并不为人所知,它仅用于测试。例如,使用 import __hello__
试试。
意外¶
在 ctypes
中存在一些边缘情况,你可能会期望发生与实际情况不同的事情。
考虑以下示例:
>>> from ctypes import *
>>> class POINT(Structure):
... _fields_ = ("x", c_int), ("y", c_int)
...
>>> class RECT(Structure):
... _fields_ = ("a", POINT), ("b", POINT)
...
>>> p1 = POINT(1, 2)
>>> p2 = POINT(3, 4)
>>> rc = RECT(p1, p2)
>>> print(rc.a.x, rc.a.y, rc.b.x, rc.b.y)
1 2 3 4
>>> # now swap the two points
>>> rc.a, rc.b = rc.b, rc.a
>>> print(rc.a.x, rc.a.y, rc.b.x, rc.b.y)
3 4 3 4
>>>
嗯。我们当然期望最后一条语句打印 3 4 1 2
。发生了什么?以下是上面 rc.a, rc.b = rc.b, rc.a
这一行的步骤:
>>> temp0, temp1 = rc.b, rc.a
>>> rc.a = temp0
>>> rc.b = temp1
>>>
请注意,temp0
和 temp1
仍然是使用上面 rc
对象的内部缓冲区的对象。因此,执行 rc.a = temp0
会将 temp0
的缓冲区内容复制到 rc
的缓冲区中。反过来,这会更改 temp1
的内容。因此,最后一个赋值 rc.b = temp1
没有达到预期的效果。
请记住,从结构体、联合体和数组中检索子对象并不会 *复制* 子对象,而是检索一个访问根对象底层缓冲区的包装器对象。
另一个可能与预期行为不同的示例是这个:
>>> s = c_char_p()
>>> s.value = b"abc def ghi"
>>> s.value
b'abc def ghi'
>>> s.value is s.value
False
>>>
注意
从 c_char_p
实例化的对象只能将其值设置为字节或整数。
为什么它打印 False
?ctypes 实例是包含内存块以及一些访问内存内容的 描述符 的对象。将 Python 对象存储在内存块中不会存储对象本身,而是存储对象的 contents
。再次访问内容会每次构造一个新的 Python 对象!
可变大小的数据类型¶
ctypes
为可变大小的数组和结构体提供了一些支持。
可以使用 resize()
函数调整现有 ctypes 对象的内存缓冲区的大小。该函数将对象作为第一个参数,并将请求的大小(以字节为单位)作为第二个参数。内存块不能小于对象类型指定的自然内存块,如果尝试这样做,则会引发 ValueError
。
>>> short_array = (c_short * 4)()
>>> print(sizeof(short_array))
8
>>> resize(short_array, 4)
Traceback (most recent call last):
...
ValueError: minimum size is 8
>>> resize(short_array, 32)
>>> sizeof(short_array)
32
>>> sizeof(type(short_array))
8
>>>
这很好,但是如何访问此数组中包含的其他元素呢?由于类型仍然只知道 4 个元素,因此访问其他元素会出错。
>>> short_array[:]
[0, 0, 0, 0]
>>> short_array[7]
Traceback (most recent call last):
...
IndexError: invalid index
>>>
使用 ctypes
使用可变大小数据类型的另一种方法是利用 Python 的动态特性,并在已知所需大小后,根据具体情况(重新)定义数据类型。
ctypes 参考¶
外部函数¶
如前一节所述,可以通过已加载的共享库的属性来访问外部函数。以这种方式创建的函数对象默认接受任意数量的参数,接受任何 ctypes 数据实例作为参数,并返回库加载器指定的默认结果类型。
它们是私有局部类 _FuncPtr
的实例(在 ctypes
中未公开),它继承自私有类 _CFuncPtr
>>> import ctypes
>>> lib = ctypes.CDLL(None)
>>> issubclass(lib._FuncPtr, ctypes._CFuncPtr)
True
>>> lib._FuncPtr is ctypes._CFuncPtr
False
- class ctypes._CFuncPtr¶
C 可调用外部函数的基类。
外部函数的实例也是 C 兼容的数据类型;它们表示 C 函数指针。
可以通过分配给外部函数对象的特殊属性来自定义此行为。
- restype¶
分配一个 ctypes 类型以指定外部函数的结果类型。对于 void,一个不返回任何内容的函数,请使用
None
。可以分配一个不是 ctypes 类型的可调用 Python 对象,在这种情况下,函数被假定为返回 C int,并且将使用此整数调用该可调用对象,从而允许进一步处理或错误检查。不建议使用此方法,为了进行更灵活的后处理或错误检查,请使用 ctypes 数据类型作为
restype
,并将一个可调用对象分配给errcheck
属性。
- argtypes¶
分配一个 ctypes 类型元组以指定函数接受的参数类型。使用
stdcall
调用约定的函数只能使用与此元组长度相同数量的参数调用;使用 C 调用约定的函数也接受其他未指定的参数。调用外部函数时,每个实际参数都会传递给
from_param()
,这是argtypes
元组中各项的类方法,此方法允许将实际参数调整为外部函数接受的对象。例如,c_char_p
在argtypes
元组中的项将使用 ctypes 转换规则将作为参数传递的字符串转换为字节对象。新增功能:现在可以在 argtypes 中放入不是 ctypes 类型的项,但每个项都必须具有
from_param()
方法,该方法返回可用作参数的值(整数、字符串、ctypes 实例)。这允许定义可以调整自定义对象作为函数参数的适配器。
- errcheck¶
将 Python 函数或其他可调用对象分配给此属性。该可调用对象将使用三个或更多参数调用:
- callable(result, func, arguments)
result 是外部函数返回的内容,由
restype
属性指定。func 是外部函数对象本身,这允许重用相同的可调用对象来检查或后处理多个函数的结果。
arguments 是一个元组,其中包含最初传递给函数调用的参数,这允许根据使用的参数专门化行为。
此函数返回的对象将从外部函数调用返回,但它也可以检查结果值,并在外部函数调用失败时引发异常。
- exception ctypes.ArgumentError¶
当外部函数调用无法转换传递的某个参数时,将引发此异常。
在 Windows 上,当外部函数调用引发系统异常(例如,由于访问冲突)时,它将被捕获并替换为合适的 Python 异常。此外,将引发一个审计事件 ctypes.set_exception
,其参数为 code
,从而允许审计钩子将其自身的异常替换为该异常。
调用外部函数调用的一些方法可能会引发一个审计事件 ctypes.call_function
,其参数为 function pointer
和 arguments
。
函数原型¶
外部函数也可以通过实例化函数原型来创建。函数原型类似于 C 语言中的函数原型;它们描述了一个函数(返回类型、参数类型、调用约定),而没有定义实现。工厂函数必须使用所需的返回类型和函数的参数类型来调用,并且可以用作装饰器工厂,因此可以通过 @wrapper
语法应用于函数。请参阅回调函数 以获取示例。
- ctypes.CFUNCTYPE(restype, *argtypes, use_errno=False, use_last_error=False)¶
返回的函数原型创建使用标准 C 调用约定的函数。该函数将在调用期间释放 GIL。如果 use_errno 设置为 true,则在调用之前和之后,系统
errno
变量的 ctypes 私有副本将与真实的errno
值进行交换;use_last_error 对 Windows 错误代码执行相同的操作。
- ctypes.WINFUNCTYPE(restype, *argtypes, use_errno=False, use_last_error=False)¶
返回的函数原型创建使用
stdcall
调用约定的函数。该函数将在调用期间释放 GIL。use_errno 和 use_last_error 的含义与上面相同。可用性:Windows
- ctypes.PYFUNCTYPE(restype, *argtypes)¶
返回的函数原型创建使用 Python 调用约定的函数。该函数在调用期间不会释放 GIL。
由这些工厂函数创建的函数原型可以以不同的方式实例化,具体取决于调用中参数的类型和数量
- prototype(address)
返回指定地址的外部函数,该地址必须是整数。
- prototype(callable)
从 Python callable 创建一个 C 可调用函数(一个回调函数)。
- prototype(func_spec[, paramflags])
返回由共享库导出的外部函数。func_spec 必须是一个 2 元组
(name_or_ordinal, library)
。第一个条目是导出的函数的名称(作为字符串)或导出的函数的序号(作为小整数)。第二个条目是共享库实例。
- prototype(vtbl_index, name[, paramflags[, iid]])
返回将调用 COM 方法的外部函数。vtbl_index 是虚拟函数表中的索引,一个小的非负整数。name 是 COM 方法的名称。iid 是指向接口标识符的可选指针,该指针用于扩展错误报告。
COM 方法使用特殊的调用约定:除了
argtypes
元组中指定的参数外,它们还需要指向 COM 接口的指针作为第一个参数。
可选的 paramflags 参数创建具有比上述功能更强大的外部函数包装器。
paramflags 的长度必须与 argtypes
相同。
此元组中的每个条目都包含有关参数的进一步信息,它必须是包含一个、两个或三个条目的元组。
第一个条目是一个整数,其中包含参数的方向标志的组合
- 1
指定函数的输入参数。
- 2
输出参数。外部函数填充一个值。
- 4
默认为整数零的输入参数。
可选的第二个条目是参数名称(作为字符串)。如果指定了此项,则可以使用命名参数调用外部函数。
可选的第三个条目是此参数的默认值。
以下示例演示如何包装 Windows MessageBoxW
函数,使其支持默认参数和命名参数。windows 头文件中的 C 声明是这样的
WINUSERAPI int WINAPI
MessageBoxW(
HWND hWnd,
LPCWSTR lpText,
LPCWSTR lpCaption,
UINT uType);
这是使用 ctypes
进行的包装
>>> from ctypes import c_int, WINFUNCTYPE, windll
>>> from ctypes.wintypes import HWND, LPCWSTR, UINT
>>> prototype = WINFUNCTYPE(c_int, HWND, LPCWSTR, LPCWSTR, UINT)
>>> paramflags = (1, "hwnd", 0), (1, "text", "Hi"), (1, "caption", "Hello from ctypes"), (1, "flags", 0)
>>> MessageBox = prototype(("MessageBoxW", windll.user32), paramflags)
现在可以按以下方式调用 MessageBox
外部函数
>>> MessageBox()
>>> MessageBox(text="Spam, spam, spam")
>>> MessageBox(flags=2, text="foo bar")
第二个示例演示输出参数。win32 GetWindowRect
函数通过将指定窗口的尺寸复制到调用方必须提供的 RECT
结构中来检索窗口的尺寸。这是 C 声明
WINUSERAPI BOOL WINAPI
GetWindowRect(
HWND hWnd,
LPRECT lpRect);
这是使用 ctypes
进行的包装
>>> from ctypes import POINTER, WINFUNCTYPE, windll, WinError
>>> from ctypes.wintypes import BOOL, HWND, RECT
>>> prototype = WINFUNCTYPE(BOOL, HWND, POINTER(RECT))
>>> paramflags = (1, "hwnd"), (2, "lprect")
>>> GetWindowRect = prototype(("GetWindowRect", windll.user32), paramflags)
>>>
具有输出参数的函数如果只有一个输出参数,将自动返回输出参数值;如果存在多个输出参数,则返回包含输出参数值的元组,因此,调用 GetWindowRect 函数时现在将返回一个 RECT 实例。
输出参数可以与 errcheck
协议结合使用,以进行进一步的输出处理和错误检查。win32 GetWindowRect
api 函数返回一个 BOOL
以表示成功或失败,因此此函数可以进行错误检查,并在 api 调用失败时引发异常
>>> def errcheck(result, func, args):
... if not result:
... raise WinError()
... return args
...
>>> GetWindowRect.errcheck = errcheck
>>>
如果 errcheck
函数返回它接收的未更改的参数元组,则 ctypes
将继续对其输出参数执行正常处理。如果要返回窗口坐标的元组而不是 RECT
实例,则可以在函数中检索字段并返回它们,正常处理将不再发生
>>> def errcheck(result, func, args):
... if not result:
... raise WinError()
... rc = args[1]
... return rc.left, rc.top, rc.bottom, rc.right
...
>>> GetWindowRect.errcheck = errcheck
>>>
实用函数¶
- ctypes.alignment(obj_or_type)¶
返回 ctypes 类型的对齐要求。obj_or_type 必须是 ctypes 类型或实例。
- ctypes.byref(obj[, offset])¶
返回指向 obj 的轻量级指针,obj 必须是 ctypes 类型的实例。offset 默认为零,并且必须是一个整数,该整数将添加到内部指针值。
byref(obj, offset)
对应于此 C 代码(((char *)&obj) + offset)
返回的对象只能用作外部函数调用参数。它的行为类似于
pointer(obj)
,但构造速度要快得多。
- ctypes.cast(obj, type)¶
此函数类似于 C 中的强制转换运算符。它返回 type 的新实例,该实例指向与 obj 相同的内存块。type 必须是指针类型,而 obj 必须是可以解释为指针的对象。
- ctypes.create_string_buffer(init_or_size, size=None)¶
此函数创建一个可变的字符缓冲区。返回的对象是
c_char
的 ctypes 数组。init_or_size 必须是一个整数,指定数组的大小,或者一个字节对象,将用于初始化数组项。
如果将一个字节对象指定为第一个参数,则缓冲区的大小会比其长度大一个,以便数组中的最后一个元素是 NUL 终止字符。可以将一个整数作为第二个参数传递,以指定数组的大小,此时不会使用字节对象的长度。
引发一个带有参数
init
,size
的 审计事件ctypes.create_string_buffer
。
- ctypes.create_unicode_buffer(init_or_size, size=None)¶
此函数创建一个可变的 Unicode 字符缓冲区。返回的对象是
c_wchar
的 ctypes 数组。init_or_size 必须是一个整数,用于指定数组的大小,或者是一个字符串,用于初始化数组项。
如果将一个字符串指定为第一个参数,则缓冲区的大小会比字符串的长度大一个,以便数组中的最后一个元素是 NUL 终止字符。可以将一个整数作为第二个参数传递,以指定数组的大小,此时不会使用字符串的长度。
引发一个带有参数
init
,size
的 审计事件ctypes.create_unicode_buffer
。
- ctypes.DllCanUnloadNow()¶
此函数是一个钩子,允许使用 ctypes 实现进程内 COM 服务器。它从 _ctypes 扩展 dll 导出的 DllCanUnloadNow 函数中调用。
可用性:Windows
- ctypes.DllGetClassObject()¶
此函数是一个钩子,允许使用 ctypes 实现进程内 COM 服务器。它从
_ctypes
扩展 dll 导出的 DllGetClassObject 函数中调用。可用性:Windows
- ctypes.util.find_library(name)¶
尝试查找库并返回路径名。name 是库的名称,不带任何前缀(如
lib
),后缀(如.so
、.dylib
)或版本号(这是用于 posix 链接器选项-l
的形式)。如果找不到库,则返回None
。具体的功能取决于系统。
- ctypes.util.find_msvcrt()¶
返回 Python 以及扩展模块所使用的 VC 运行时库的文件名。如果无法确定库的名称,则返回
None
。如果需要释放内存,例如,由扩展模块通过调用
free(void *)
分配的内存,则必须使用分配内存的同一个库中的函数。可用性:Windows
- ctypes.FormatError([code])¶
返回错误代码 code 的文本描述。如果没有指定错误代码,则通过调用 Windows api 函数 GetLastError 来使用最后一个错误代码。
可用性:Windows
- ctypes.GetLastError()¶
返回调用线程中 Windows 设置的最后一个错误代码。此函数直接调用 Windows
GetLastError()
函数,它不返回 ctypes 私有的错误代码副本。可用性:Windows
- ctypes.get_last_error()¶
返回调用线程中系统
LastError
变量的 ctypes 私有副本的当前值。可用性:Windows
引发一个不带参数的 审计事件
ctypes.get_last_error
。
- ctypes.memmove(dst, src, count)¶
与标准 C memmove 库函数相同:从 src 复制 count 个字节到 dst。dst 和 src 必须是可以转换为指针的整数或 ctypes 实例。
- ctypes.memset(dst, c, count)¶
与标准 C memset 库函数相同:使用值 c 的 count 个字节填充地址 dst 处的内存块。dst 必须是指定地址的整数,或者是一个 ctypes 实例。
- ctypes.POINTER(type, /)¶
创建并返回一个新的 ctypes 指针类型。指针类型在内部被缓存和重用,因此重复调用此函数的开销很低。type 必须是一个 ctypes 类型。
- ctypes.pointer(obj, /)¶
创建指向 obj 的新指针实例。返回对象的类型是
POINTER(type(obj))
。注意:如果只想将指向对象的指针传递给外部函数调用,则应该使用更快的
byref(obj)
。
- ctypes.resize(obj, size)¶
此函数调整 obj 的内部内存缓冲区的大小,obj 必须是 ctypes 类型的实例。无法使缓冲区小于对象的类型本机大小,如
sizeof(type(obj))
所示,但可以扩大缓冲区。
- ctypes.set_errno(value)¶
将调用线程中系统
errno
变量的 ctypes 私有副本的当前值设置为 value 并返回先前的值。引发一个带有参数
errno
的 审计事件ctypes.set_errno
。
- ctypes.set_last_error(value)¶
将调用线程中系统
LastError
变量的 ctypes 私有副本的当前值设置为 value,并返回先前的值。可用性:Windows
引发一个 审计事件
ctypes.set_last_error
,其参数为error
。
- ctypes.sizeof(obj_or_type)¶
返回 ctypes 类型或实例内存缓冲区的大小(以字节为单位)。与 C
sizeof
运算符执行相同的操作。
- ctypes.string_at(ptr, size=-1)¶
返回 void *ptr 处的字节字符串。如果指定了 size,则将其用作大小,否则假定字符串以零结尾。
引发一个 审计事件
ctypes.string_at
,其参数为ptr
,size
。
- ctypes.WinError(code=None, descr=None)¶
此函数可能是 ctypes 中命名最差的函数。它创建
OSError
的一个实例。如果未指定 code,则会调用GetLastError
来确定错误代码。如果未指定 descr,则会调用FormatError()
来获取错误的文本描述。可用性:Windows
在 3.3 版本中更改: 之前创建的是
WindowsError
的实例,现在它是OSError
的别名。
数据类型¶
- class ctypes._CData¶
这个非公共类是所有 ctypes 数据类型的公共基类。 除此之外,所有 ctypes 类型实例都包含一个保存 C 兼容数据的内存块;该内存块的地址由
addressof()
辅助函数返回。另一个实例变量作为_objects
公开;它包含其他需要保持活动状态的 Python 对象,以防内存块包含指针。ctypes 数据类型的常用方法,这些都是类方法(确切地说,它们是 元类 的方法)
- from_buffer(source[, offset])¶
此方法返回一个 ctypes 实例,该实例共享 source 对象的缓冲区。source 对象必须支持可写缓冲区接口。可选的 offset 参数指定源缓冲区中的偏移量(以字节为单位);默认值为零。如果源缓冲区不够大,则会引发
ValueError
。引发一个 审计事件
ctypes.cdata/buffer
,其参数为pointer
、size
、offset
。
- from_buffer_copy(source[, offset])¶
此方法创建一个 ctypes 实例,从必须是可读的 source 对象缓冲区复制缓冲区。可选的 offset 参数指定源缓冲区中的偏移量(以字节为单位);默认值为零。如果源缓冲区不够大,则会引发
ValueError
。引发一个 审计事件
ctypes.cdata/buffer
,其参数为pointer
、size
、offset
。
- from_address(address)¶
此方法使用 address 指定的内存返回 ctypes 类型实例,其中 address 必须是整数。
此方法以及间接调用此方法的其他方法会引发一个 审计事件
ctypes.cdata
,其参数为address
。
- from_param(obj)¶
此方法将 obj 适配为 ctypes 类型。当类型存在于外部函数的
argtypes
元组中时,会使用外部函数调用中使用的实际对象调用它;它必须返回一个可以用作函数调用参数的对象。所有 ctypes 数据类型都具有此类方法的默认实现,如果 obj 是该类型的实例,通常会返回 obj。某些类型也接受其他对象。
- in_dll(library, name)¶
此方法返回共享库导出的 ctypes 类型实例。name 是导出数据的符号的名称,library 是加载的共享库。
ctypes 数据类型的常用实例变量
- _b_needsfree_¶
当 ctypes 数据实例本身已分配内存块时,此只读变量为 true,否则为 false。
- _objects¶
此成员为
None
或包含需要保持活动状态的 Python 对象的字典,以便内存块内容保持有效。 此对象仅用于调试;切勿修改此字典的内容。
基本数据类型¶
- class ctypes._SimpleCData¶
这个非公共类是所有基本 ctypes 数据类型的基类。这里提到它是因为它包含基本 ctypes 数据类型的公共属性。
_SimpleCData
是_CData
的子类,因此它继承了它们的方法和属性。现在可以 pickle 不是和不包含指针的 ctypes 数据类型。实例具有单个属性
当基本数据类型作为外部函数调用结果返回,或者例如通过检索结构体字段成员或数组项时,它们会透明地转换为原生 Python 类型。换句话说,如果一个外部函数的 restype
是 c_char_p
,你将总是收到一个 Python 字节对象,而不是 c_char_p
的实例。
基本数据类型的子类不继承此行为。因此,如果一个外部函数的 restype
是 c_void_p
的子类,你将收到该子类的实例。当然,你可以通过访问 value
属性来获取指针的值。
以下是 ctypes 的基本数据类型:
- class ctypes.c_byte¶
表示 C signed char 数据类型,并将值解释为小整数。构造函数接受一个可选的整数初始化器;不进行溢出检查。
- class ctypes.c_char¶
表示 C char 数据类型,并将值解释为单个字符。构造函数接受一个可选的字符串初始化器,字符串的长度必须恰好为一个字符。
- class ctypes.c_char_p¶
当 C char* 数据类型指向一个以零结尾的字符串时,表示该数据类型。对于也可能指向二进制数据的一般字符指针,必须使用
POINTER(c_char)
。构造函数接受一个整数地址或一个字节对象。
- class ctypes.c_double¶
表示 C double 数据类型。构造函数接受一个可选的浮点数初始化器。
- class ctypes.c_longdouble¶
表示 C long double 数据类型。构造函数接受一个可选的浮点数初始化器。在
sizeof(long double) == sizeof(double)
的平台上,它是c_double
的别名。
- class ctypes.c_float¶
表示 C float 数据类型。构造函数接受一个可选的浮点数初始化器。
- class ctypes.c_int¶
表示 C signed int 数据类型。构造函数接受一个可选的整数初始化器;不进行溢出检查。在
sizeof(int) == sizeof(long)
的平台上,它是c_long
的别名。
- class ctypes.c_int64¶
表示 C 64 位 signed int 数据类型。通常是
c_longlong
的别名。
- class ctypes.c_long¶
表示 C signed long 数据类型。构造函数接受一个可选的整数初始化器;不进行溢出检查。
- class ctypes.c_longlong¶
表示 C signed long long 数据类型。构造函数接受一个可选的整数初始化器;不进行溢出检查。
- class ctypes.c_short¶
表示 C signed short 数据类型。构造函数接受一个可选的整数初始化器;不进行溢出检查。
- class ctypes.c_size_t¶
表示 C
size_t
数据类型。
- class ctypes.c_ssize_t¶
表示 C
ssize_t
数据类型。在 3.2 版本中添加。
- class ctypes.c_time_t¶
表示 C
time_t
数据类型。在 3.12 版本中添加。
- class ctypes.c_ubyte¶
表示 C unsigned char 数据类型,它将值解释为小整数。构造函数接受一个可选的整数初始化器;不进行溢出检查。
- class ctypes.c_uint¶
表示 C unsigned int 数据类型。构造函数接受一个可选的整数初始化器;不进行溢出检查。在
sizeof(int) == sizeof(long)
的平台上,它是c_ulong
的别名。
- class ctypes.c_uint64¶
表示 C 语言的 64 位 unsigned int 数据类型。通常是
c_ulonglong
的别名。
- class ctypes.c_ulong¶
表示 C 语言的 unsigned long 数据类型。构造函数接受一个可选的整数初始化器;不执行溢出检查。
- class ctypes.c_ulonglong¶
表示 C 语言的 unsigned long long 数据类型。构造函数接受一个可选的整数初始化器;不执行溢出检查。
- class ctypes.c_ushort¶
表示 C 语言的 unsigned short 数据类型。构造函数接受一个可选的整数初始化器;不执行溢出检查。
- class ctypes.c_void_p¶
表示 C 语言的 void* 类型。该值表示为整数。构造函数接受一个可选的整数初始化器。
- class ctypes.c_wchar¶
表示 C 语言的
wchar_t
数据类型,并将该值解释为单字符 Unicode 字符串。构造函数接受一个可选的字符串初始化器,字符串的长度必须恰好为一个字符。
- class ctypes.c_wchar_p¶
表示 C 语言的 wchar_t* 数据类型,它必须是指向以零结尾的宽字符字符串的指针。构造函数接受一个整数地址或一个字符串。
- class ctypes.c_bool¶
表示 C 语言的 bool 数据类型(更准确地说,是来自 C99 的 _Bool)。其值可以是
True
或False
,并且构造函数接受任何具有真值的对象。
ctypes.wintypes
模块提供了许多其他 Windows 特定的数据类型,例如 HWND
、WPARAM
或 DWORD
。还定义了一些有用的结构,如 MSG
或 RECT
。
结构化数据类型¶
- class ctypes.Union(*args, **kw)¶
本机字节顺序联合的抽象基类。
- class ctypes.BigEndianUnion(*args, **kw)¶
大端字节顺序联合的抽象基类。
3.11 版本新增。
- class ctypes.LittleEndianUnion(*args, **kw)¶
小端字节顺序联合的抽象基类。
3.11 版本新增。
- class ctypes.BigEndianStructure(*args, **kw)¶
大端字节顺序结构的抽象基类。
- class ctypes.LittleEndianStructure(*args, **kw)¶
小端字节顺序结构的抽象基类。
非本机字节顺序的结构和联合不能包含指针类型字段,或任何包含指针类型字段的其他数据类型。
- class ctypes.Structure(*args, **kw)¶
本机字节顺序结构的抽象基类。
具体的结构和联合类型必须通过继承这些类型之一来创建,并且至少定义一个
_fields_
类变量。ctypes
将创建 描述符,允许通过直接属性访问来读取和写入字段。这些是- _fields_¶
定义结构字段的序列。项必须是 2 元组或 3 元组。第一个项是字段的名称,第二个项指定字段的类型;它可以是任何 ctypes 数据类型。
对于像
c_int
这样的整数类型字段,可以给出第三个可选项。它必须是一个小的正整数,定义字段的位宽度。字段名称在一个结构或联合中必须是唯一的。这不会被检查,当名称重复时只能访问一个字段。
可以在定义 Structure 子类的 class 语句 *之后* 定义
_fields_
类变量,这允许创建直接或间接引用自身的数据类型class List(Structure): pass List._fields_ = [("pnext", POINTER(List)), ... ]
但是,必须在首次使用该类型之前定义
_fields_
类变量(创建实例,在其上调用sizeof()
,等等)。稍后对_fields_
类变量的赋值将引发 AttributeError。可以定义结构类型的子子类,它们继承基类的字段,以及在子子类中定义的
_fields_
(如果有)。
- _align_¶
一个可选的小整数,允许在将结构打包或从内存解包时覆盖结构的对齐方式。将此属性设置为 0 与根本不设置它相同。
3.13 版本新增。
- _anonymous_¶
一个可选的序列,列出未命名(匿名)字段的名称。当
_fields_
被赋值时,_anonymous_
必须已经定义,否则它将不起作用。此变量中列出的字段必须是结构体或联合体类型的字段。
ctypes
将在结构体类型中创建描述符,允许直接访问嵌套字段,而无需创建结构体或联合体字段。这是一个示例类型 (Windows):
class _U(Union): _fields_ = [("lptdesc", POINTER(TYPEDESC)), ("lpadesc", POINTER(ARRAYDESC)), ("hreftype", HREFTYPE)] class TYPEDESC(Structure): _anonymous_ = ("u",) _fields_ = [("u", _U), ("vt", VARTYPE)]
TYPEDESC
结构体描述了一个 COM 数据类型,vt
字段指定了联合体中哪个字段是有效的。由于u
字段被定义为匿名字段,现在可以直接从 TYPEDESC 实例访问成员。td.lptdesc
和td.u.lptdesc
是等效的,但前者速度更快,因为它不需要创建临时的联合体实例。td = TYPEDESC() td.vt = VT_PTR td.lptdesc = POINTER(some_type) td.u.lptdesc = POINTER(some_type)
可以定义结构体的子类,它们继承基类的字段。如果子类定义有单独的
_fields_
变量,则此变量中指定的字段将附加到基类的字段中。结构体和联合体的构造函数接受位置参数和关键字参数。位置参数用于按照它们在
_fields_
中出现的顺序初始化成员字段。构造函数中的关键字参数被解释为属性赋值,因此它们将使用相同的名称初始化_fields_
,或者为_fields_
中不存在的名称创建新的属性。
数组和指针¶
- class ctypes.Array(*args)¶
数组的抽象基类。
创建具体数组类型的推荐方法是将任何
ctypes
数据类型与一个非负整数相乘。或者,您可以子类化此类型并定义_length_
和_type_
类变量。可以使用标准下标和切片访问来读取和写入数组元素;对于切片读取,结果对象本身不是Array
。- _length_¶
一个正整数,指定数组中的元素数量。超出范围的下标会导致
IndexError
。将由len()
返回。
- _type_¶
指定数组中每个元素的类型。
数组子类的构造函数接受位置参数,用于按顺序初始化元素。