Python 3.0 的新特性

作者:

Guido van Rossum

本文解释了 Python 3.0 相较于 2.6 的新特性。Python 3.0,也被称为“Python 3000”或“Py3K”,是第一个有意向后不兼容的 Python 版本。Python 3.0 于 2008 年 12 月 3 日发布。与典型的版本相比,它有更多的更改,并且对所有 Python 用户来说都更重要。然而,在消化了这些更改之后,你会发现 Python 实际上并没有改变太多——总的来说,我们主要是在修复众所周知的烦恼和缺陷,并删除大量旧的无用代码。

本文不试图提供所有新功能的完整规范,而是试图给出一个方便的概述。有关完整详细信息,您应该参考 Python 3.0 的文档和/或文本中引用的许多 PEP。如果您想了解特定功能的完整实现和设计原理,PEP 通常比常规文档有更多的细节;但请注意,一旦某个功能完全实现,PEP 通常不会保持更新。

由于时间限制,本文档并不像它应该的那样完整。与新版本一样,源代码发行版中的 Misc/NEWS 文件包含有关所做的每一件小事的丰富详细信息。

常见的绊脚石

本节列出了如果您习惯了 Python 2.5 最容易让您绊倒的一些更改。

视图和迭代器代替列表

一些众所周知的 API 不再返回列表

  • dict 方法 dict.keys()dict.items()dict.values() 返回“视图”而不是列表。例如,这不再有效:k = d.keys(); k.sort()。请使用 k = sorted(d) 代替(这在 Python 2.5 中也有效,并且同样高效)。

  • 此外,不再支持 dict.iterkeys()dict.iteritems()dict.itervalues() 方法。

  • map()filter() 返回迭代器。如果您真的需要列表,并且输入序列的长度都相等,则一个快速的解决方法是将 map() 包装在 list() 中,例如 list(map(...)),但更好的解决方法通常是使用列表推导式(特别是当原始代码使用 lambda 时),或者重写代码使其根本不需要列表。特别棘手的是 map() 为了函数副作用而调用;正确的转换是使用常规的 for 循环(因为创建列表只会浪费)。

    如果输入序列的长度不相等,则 map() 将在最短序列终止时停止。为了与 Python 2.x 中的 map() 完全兼容,还要将序列包装在 itertools.zip_longest() 中,例如 map(func, *sequences) 变为 list(map(func, itertools.zip_longest(*sequences)))

  • range() 现在的行为类似于 xrange() 过去的行为,只是它可以处理任意大小的值。后者不再存在。

  • zip() 现在返回一个迭代器。

排序比较

Python 3.0 简化了排序比较的规则

  • 当操作数没有有意义的自然排序时,排序比较运算符(<<=>=>)会引发 TypeError 异常。因此,像 1 < ''0 > Nonelen <= len 这样的表达式不再有效,例如,None < None 会引发 TypeError 而不是返回 False。一个推论是,对异构列表进行排序不再有意义——所有元素都必须彼此可比较。请注意,这不适用于 ==!= 运算符:不同且不可比较类型的对象始终彼此比较不相等。

  • sorted()list.sort() 不再接受提供比较函数的 *cmp* 参数。请改用 *key* 参数。注意,*key* 和 *reverse* 参数现在是“仅关键字”的参数。

  • cmp() 函数应被视为已删除,并且不再支持 __cmp__() 特殊方法。请将 __lt__() 用于排序,将 __eq__()__hash__() 结合使用,并根据需要使用其他丰富的比较。(如果您真的需要 cmp() 功能,则可以使用表达式 (a > b) - (a < b) 作为 cmp(a, b) 的等效项。)

整数

  • PEP 237:本质上,long 被重命名为 int。也就是说,只有一个内置的整数类型,名为 int;但它的行为方式大多与旧的 long 类型相同。

  • PEP 238:像 1/2 这样的表达式返回一个浮点数。使用 1//2 来获得截断行为。(后一种语法已经存在多年,至少从 Python 2.2 开始就有了。)

  • sys.maxint 常量被移除,因为整数的值不再有限制。然而,sys.maxsize 可以用作大于任何实际列表或字符串索引的整数。它符合实现的“自然”整数大小,并且通常与同一平台上先前版本中的 sys.maxint 相同(假设使用相同的构建选项)。

  • 长整数的 repr() 不再包含尾部的 L,因此无条件剥离该字符的代码将改为截断最后一位数字。(请改用 str()。)

  • 八进制字面量不再采用 0720 的形式;请改用 0o720

文本与数据,而非 Unicode 与 8 位

你所认为的关于二进制数据和 Unicode 的一切都已改变。

  • Python 3.0 使用 _文本_ 和(二进制)_数据_ 的概念,而不是 Unicode 字符串和 8 位字符串。所有文本都是 Unicode;然而,_编码_ 的 Unicode 表示为二进制数据。用于保存文本的类型是 str,用于保存数据的类型是 bytes。与 2.x 情况的最大区别在于,任何在 Python 3.0 中混合文本和数据的尝试都会引发 TypeError,而在 Python 2.x 中混合 Unicode 和 8 位字符串,如果 8 位字符串恰好只包含 7 位 (ASCII) 字节,则会起作用,但如果它包含非 ASCII 值,则会得到 UnicodeDecodeError。多年来,这种特定于值的行为导致了许多不愉快的局面。

  • 由于这种理念的改变,几乎所有使用 Unicode、编码或二进制数据的代码都可能需要更改。这种改变是积极的,因为在 2.x 版本中,存在许多与混合编码和未编码文本有关的错误。为了在 Python 2.x 中做好准备,请开始对所有未编码文本使用 unicode,并仅对二进制或编码数据使用 str。然后 2to3 工具将为你完成大部分工作。

  • 你不能再使用 u"..." 字面量表示 Unicode 文本。但是,你必须使用 b"..." 字面量表示二进制数据。

  • 由于 strbytes 类型不能混合使用,你必须始终在它们之间进行显式转换。使用 str.encode()str 转到 bytes,使用 bytes.decode()bytes 转到 str。你还可以分别使用 bytes(s, encoding=...)str(b, encoding=...)

  • str 一样,bytes 类型是不可变的。有一个单独的 _可变_ 类型用于保存缓冲的二进制数据,bytearray。几乎所有接受 bytes 的 API 也接受 bytearray。可变 API 基于 collections.MutableSequence

  • 原始字符串字面量中的所有反斜杠都按字面意思解释。这意味着原始字符串中的 '\U''\u' 转义不会被特殊处理。例如,r'\u20ac' 在 Python 3.0 中是一个包含 6 个字符的字符串,而在 2.6 中,ur'\u20ac' 是单个“欧元”字符。(当然,此更改仅影响原始字符串字面量;欧元字符在 Python 3.0 中是 '\u20ac'。)

  • 内置的 basestring 抽象类型已被移除。请改用 strstrbytes 类型没有足够多的共同功能来保证使用共享的基类。2to3 工具(见下文)将每个 basestring 的出现替换为 str

  • 作为文本文件打开的文件(仍然是 open() 的默认模式)始终使用编码在字符串(在内存中)和字节(在磁盘上)之间进行映射。二进制文件(在模式参数中使用 b 打开)始终在内存中使用字节。这意味着,如果使用不正确的模式或编码打开文件,I/O 很可能会大声失败,而不是默默地产生不正确的数据。这也意味着,即使是 Unix 用户也必须在打开文件时指定正确的模式(文本或二进制)。存在一个平台相关的默认编码,在 Unix 平台上可以使用 LANG 环境变量进行设置(有时也可以使用其他一些平台特定的区域设置相关的环境变量)。在许多情况下,但并非所有情况下,系统默认值都是 UTF-8;你不应依赖此默认值。任何读取或写入纯 ASCII 文本之外的内容的应用程序都应该有一种覆盖编码的方法。不再需要在 codecs 模块中使用编码感知流。

  • sys.stdinsys.stdoutsys.stderr 的初始值现在都是仅限 Unicode 的文本文件(即,它们是 io.TextIOBase 的实例)。要使用这些流读取和写入字节数据,你需要使用它们的 io.TextIOBase.buffer 属性。

  • 文件名以(Unicode)字符串的形式传递给 API 并从 API 返回。这可能会带来平台特定的问题,因为在某些平台上,文件名是任意的字节字符串。(另一方面,在 Windows 上,文件名以 Unicode 的形式原生存储。)作为一种变通方法,大多数接受文件名的 API(例如 open()os 模块中的许多函数)也接受 bytes 对象以及字符串,并且一些 API 有方法请求返回 bytes 值。因此,如果参数是 bytes 实例,则 os.listdir() 返回一个 bytes 实例列表,而 os.getcwdb() 返回当前工作目录作为 bytes 实例。请注意,当 os.listdir() 返回字符串列表时,无法正确解码的文件名会被省略,而不是引发 UnicodeError

  • 当系统提供的字节无法使用默认编码解释时,某些系统 API(如 os.environsys.argv)也可能会出现问题。设置 LANG 变量并重新运行程序可能是最好的方法。

  • PEP 3138: 字符串的 repr() 不再转义非 ASCII 字符。但是,它仍然会转义控制字符和 Unicode 标准中具有不可打印状态的代码点。

  • PEP 3120: 默认的源代码编码现在是 UTF-8。

  • PEP 3131: 现在标识符中允许使用非 ASCII 字母。(但是,标准库仍然仅限 ASCII,注释中的贡献者姓名除外。)

  • StringIOcStringIO 模块已删除。请改为导入 io 模块,并分别使用 io.StringIOio.BytesIO 来处理文本和数据。

  • 另请参阅为 Python 3.0 更新的 Unicode HOWTO

语法更改概述

本节简要概述 Python 3.0 中的每个语法更改。

新语法

  • PEP 3107: 函数参数和返回值注解。这提供了一种标准化方法来注解函数的参数和返回值。这些注解没有附加的语义,只是可以使用 __annotations__ 属性在运行时进行内省。目的是鼓励通过元类、装饰器或框架进行实验。

  • PEP 3102: 仅限关键字的参数。参数列表中出现在 *args 之后的命名参数必须在调用时使用关键字语法指定。你也可以在参数列表中使用裸 * 来表示你不接受可变长度的参数列表,但你有仅限关键字的参数。

  • 在类定义中,基本类列表之后允许使用关键字参数。这被用于指定元类的新约定(请参阅下一节),但只要元类支持,它也可以用于其他目的。

  • PEP 3104: nonlocal 语句。使用 nonlocal x,你现在可以直接赋值给外部(但非全局)作用域中的变量。nonlocal 是一个新的保留字。

  • PEP 3132: 扩展的可迭代解包。你现在可以编写诸如 a, b, *rest = some_sequence 之类的代码。甚至 *rest, a = stuffrest 对象始终是一个(可能为空)列表;右侧可以是任何可迭代对象。示例

    (a, *rest, b) = range(5)
    

    这将 a 设置为 0b 设置为 4rest 设置为 [1, 2, 3]

  • 字典推导式:{k: v for k, v in stuff}dict(stuff) 的含义相同,但更灵活。(这是 PEP 274 证明是正确的。 :-))

  • 集合字面量,例如 {1, 2}。请注意,{} 是一个空字典;对于空集合,请使用 set()。也支持集合推导式;例如,{x for x in stuff}set(stuff) 的含义相同,但更灵活。

  • 新的八进制字面量,例如 0o720(在 2.6 中已经存在)。旧的八进制字面量 (0720) 已删除。

  • 新的二进制字面量,例如 0b1010(在 2.6 中已经存在),并且有一个新的对应的内置函数 bin()

  • 字节字面量以引导 bB 引入,并且有一个新的对应的内置函数 bytes()

更改的语法

  • PEP 3109PEP 3134: 新的 raise 语句语法:raise [expr [from expr]]。请参阅下文。

  • aswith 现在是保留字。(实际上是从 2.6 开始。)

  • TrueFalseNone 是保留字。(2.6 已经部分强制执行了对 None 的限制。)

  • except exc, var 更改为 except exc as var。请参阅 PEP 3110

  • PEP 3115: 新的元类语法。而不是

    class C:
        __metaclass__ = M
        ...
    

    你现在必须使用

    class C(metaclass=M):
        ...
    

    不再支持模块全局 __metaclass__ 变量。(它是一个拐杖,用于使在不从 object 派生每个类的情况下,更容易默认使用新式类。)

  • 列表推导式不再支持 [... for var in item1, item2, ...] 这种语法形式。请改用 [... for var in (item1, item2, ...)]。 另外请注意,列表推导式具有不同的语义:它们更接近于 list() 构造函数内部生成器表达式的语法糖,特别是循环控制变量不再泄露到周围的作用域中。

  • 省略号 (...) 可以用作任何位置的原子表达式。(以前只允许在切片中使用。)此外,它现在必须拼写为 ...。(以前也可以拼写为 . . .,这只是语法上的一个偶然情况。)

已移除的语法

  • PEP 3113:元组参数解包已移除。您不能再编写 def foo(a, (b, c)): ...。请改用 def foo(a, b_c): b, c = b_c

  • 移除了反引号(请改用 repr())。

  • 移除了 <> (请改用 !=)。

  • 移除了关键字:exec() 不再是关键字;它仍然是一个函数。(幸运的是,在 2.x 中也接受函数语法。)另请注意,exec() 不再接受流参数;您可以使用 exec(f.read()) 来代替 exec(f)

  • 整数文字不再支持尾随的 lL

  • 字符串文字不再支持前导的 uU

  • from 模块 import * 语法只允许在模块级别使用,不再允许在函数内部使用。

  • 相对导入唯一可接受的语法是 from .[模块] import 名称。所有不以 . 开头的 import 形式都被解释为绝对导入。(PEP 328

  • 经典类已移除。

Python 2.6 中已存在的更改

由于许多用户可能直接从 Python 2.5 跳转到 Python 3.0,因此本节提醒读者注意最初为 Python 3.0 设计但已向后移植到 Python 2.6 的新功能。有关更详细的描述,请查阅 Python 2.6 中的新增功能 中的相应章节。

库的更改

由于时间限制,本文档并未详尽涵盖标准库的非常广泛的更改。PEP 3108 是库的主要更改的参考。以下是简要回顾

  • 许多旧模块已被删除。 一些模块,例如 gopherlib (不再使用)和 md5 (已由 hashlib 替换),已被 PEP 4 弃用。 其他模块由于取消了对各种平台(例如 Irix,BeOS 和 Mac OS 9)的支持而被删除(请参阅 PEP 11)。 一些模块也由于缺乏使用或存在更好的替代方案而在 Python 3.0 中被选中删除。 有关详尽列表,请参阅 PEP 3108

  • bsddb3 包已被删除,因为它在核心标准库中的存在已被证明是核心开发人员的特殊负担,原因是测试不稳定以及 Berkeley DB 的发布计划。 但是,该软件包在 https://www.jcea.es/programacion/pybsddb.htm 上得到了活跃且良好的维护。

  • 一些模块由于其旧名称违反了 PEP 8,或者出于各种其他原因而被重命名。 这是列表

    旧名称

    新名称

    _winreg

    winreg

    ConfigParser

    configparser

    copy_reg

    copyreg

    Queue

    queue

    SocketServer

    socketserver

    markupbase

    _markupbase

    repr

    reprlib

    test.test_support

    test.support

  • Python 2.x 中的一种常见模式是使用纯 Python 实现模块的一个版本,并使用 C 扩展来实现可选的加速版本; 例如,picklecPickle。 这将导入加速版本并回退到这些模块的每个用户的纯 Python 版本的负担。 在 Python 3.0 中,加速版本被认为是纯 Python 版本的实现细节。 用户应始终导入标准版本,该版本尝试导入加速版本并回退到纯 Python 版本。pickle / cPickle 对已受到这种处理。profile 模块在 3.1 的列表中。 StringIO 模块已转换为 io 模块中的一个类。

  • 一些相关的模块已分组到包中,并且通常简化了子模块名称。 产生的新包是

    • dbm (anydbm, dbhash, dbm, dumbdbm, gdbm, whichdb)。

    • html (HTMLParser, htmlentitydefs)。

    • http (httplib, BaseHTTPServer, CGIHTTPServer, SimpleHTTPServer, Cookie, cookielib)。

    • tkinter (所有与 Tkinter 相关的模块,除了 turtle)。 turtle 的目标受众实际上并不关心 tkinter。 另请注意,自 Python 2.6 起,turtle 的功能已大大增强。

    • urllib (urllib, urllib2, urlparse, robotparse)。

    • xmlrpc (xmlrpclib, DocXMLRPCServer, SimpleXMLRPCServer)。

对标准库模块的其他一些更改,未在 PEP 3108 中涵盖

  • 已删除 sets。 请使用内置的 set() 类。

  • 清理 sys 模块:删除了 sys.exitfunc(), sys.exc_clear(), sys.exc_type, sys.exc_value, sys.exc_traceback。 (请注意,sys.last_type 等仍然存在。)

  • 清理 array.array 类型:read()write() 方法已移除;请改用 fromfile()tofile()。此外,array 的 'c' 类型代码也已移除 – 请使用 'b' 表示字节,或使用 'u' 表示 Unicode 字符。

  • 清理 operator 模块:移除了 sequenceIncludes()isCallable()

  • 清理 thread 模块:acquire_lock()release_lock() 已移除;请改用 acquire()release()

  • 清理 random 模块:移除了 jumpahead() API。

  • new 模块已移除。

  • 函数 os.tmpnam()os.tempnam()os.tmpfile() 已移除,请改用 tempfile 模块。

  • tokenize 模块已更改为使用字节工作。现在的主要入口点是 tokenize.tokenize(),而不是 generate_tokens。

  • string.letters 及其朋友(string.lowercasestring.uppercase)已移除。请改用 string.ascii_letters 等。(移除的原因是 string.letters 及其朋友具有特定于语言环境的行为,对于这种具有吸引力的全局“常量”来说,这不是一个好主意。)

  • 将模块 __builtin__ 重命名为 builtins(删除了下划线,添加了 ‘s’)。在大多数全局命名空间中找到的 __builtins__ 变量保持不变。要修改内置对象,您应该使用 builtins,而不是 __builtins__

PEP 3101:一种新的字符串格式化方法

  • 一个新的内置字符串格式化操作系统取代了 % 字符串格式化运算符。(但是,仍然支持 % 运算符;它将在 Python 3.1 中被弃用,并在以后的某个时间从语言中删除。)请阅读 PEP 3101 以获取完整信息。

异常的更改

引发和捕获异常的 API 已被清理,并添加了新的强大功能

  • PEP 352:所有异常都必须(直接或间接)派生自 BaseException。这是异常层次结构的根。这并非新的建议,但继承自 BaseException要求是新的。(Python 2.6 仍然允许引发经典类,并且对您可以捕获的内容没有任何限制。)因此,字符串异常最终真正彻底地消亡了。

  • 几乎所有异常实际上都应该派生自 ExceptionBaseException 应该仅用作应该仅在顶层处理的异常的基类,例如 SystemExitKeyboardInterrupt。处理除后一类之外的所有异常的推荐用法是使用 except Exception

  • StandardError 已移除。

  • 异常不再表现为序列。请改用 args 属性。

  • PEP 3109:引发异常。现在您必须使用 raise Exception(args),而不是 raise Exception, args。此外,您不能再显式指定回溯;相反,如果您必须这样做,您可以直接分配给 __traceback__ 属性(见下文)。

  • PEP 3110:捕获异常。现在您必须使用 except SomeException as variable,而不是 except SomeException, variable。此外,当 except 块离开时,variable 会被显式删除。

  • PEP 3134:异常链接。有两种情况:隐式链接和显式链接。当在 exceptfinally 处理程序块中引发异常时,会发生隐式链接。这通常是由于处理程序块中的错误导致的;我们称之为次级异常。在这种情况下,原始异常(正在处理的异常)将作为次级异常的 __context__ 属性保存。使用以下语法调用显式链接

    raise SecondaryException() from primary_exception
    

    (其中 *primary_exception* 是产生异常对象的任何表达式,可能是之前捕获的异常)。在这种情况下,主异常存储在次级异常的 __cause__ 属性上。当发生未处理的异常时打印的回溯会遍历 __cause____context__ 属性的链,并为链的每个组件打印单独的回溯,主异常位于顶部。(Java 用户可能会认识到此行为。)

  • PEP 3134:异常对象现在将其回溯存储为 __traceback__ 属性。这意味着异常对象现在包含与异常相关的所有信息,并且使用 sys.exc_info() 的理由更少了(尽管后者并未被移除)。

  • 当 Windows 无法加载扩展模块时,改进了一些异常消息。例如,错误代码 193 现在是 %1 不是有效的 Win32 应用程序。字符串现在处理非英语语言环境。

其他杂项更改

运算符和特殊方法

  • != 现在返回 == 的相反结果,除非 == 返回 NotImplemented

  • “未绑定方法”的概念已从语言中删除。当将方法作为类属性引用时,现在会得到一个普通的函数对象。

  • __getslice__()__setslice__()__delslice__() 已被移除。语法 a[i:j] 现在转换为 a.__getitem__(slice(i, j)) (或者,当用作赋值或删除目标时,分别转换为 __setitem__()__delitem__())。

  • PEP 3114:标准的 next() 方法已重命名为 __next__()

  • 移除了 __oct__()__hex__() 特殊方法 —— oct()hex() 现在使用 __index__() 将参数转换为整数。

  • 移除了对 __members____methods__ 的支持。

  • 名为 func_X 的函数属性已重命名为使用 __X__ 形式,从而在函数属性命名空间中为用户定义的属性释放这些名称。也就是说,func_closurefunc_codefunc_defaultsfunc_dictfunc_docfunc_globalsfunc_name 分别重命名为 __closure____code____defaults____dict____doc____globals____name__

  • __nonzero__() 现在是 __bool__()

内置函数

  • PEP 3135:新的 super()。现在可以不带参数调用 super(),并且(假设这是在 class 语句中定义的常规实例方法)会自动选择正确的类和实例。带参数时,super() 的行为不变。

  • PEP 3111raw_input() 已重命名为 input()。也就是说,新的 input() 函数从 sys.stdin 读取一行,并删除末尾的换行符后返回。如果输入过早终止,则会引发 EOFError。要获得旧的 input() 行为,请使用 eval(input())

  • 添加了一个新的内置函数 next(),用于调用对象上的 __next__() 方法。

  • round() 函数的舍入策略和返回类型已更改。精确的中间情况现在舍入到最接近的偶数结果,而不是远离零。(例如,round(2.5) 现在返回 2 而不是 3。)round(x[, n]) 现在委托给 x.__round__([n]) 而不是总是返回浮点数。当使用单个参数调用时,它通常返回一个整数;当使用两个参数调用时,它返回与 x 相同类型的值。

  • intern() 移到 sys.intern()

  • 已移除:apply()。使用 f(*args) 代替 apply(f, args)

  • 移除了 callable()。可以使用 isinstance(f, collections.Callable) 代替 callable(f)operator.isCallable() 函数也已消失。

  • 移除了 coerce()。既然经典类已经消失,此函数不再有作用。

  • 移除了 execfile()。使用 exec(open(fn).read()) 代替 execfile(fn)

  • 移除了 file 类型。请使用 open()。现在,io 模块中,open 可以返回几种不同类型的流。

  • 移除了 reduce()。如果确实需要,请使用 functools.reduce();但是,99% 的时间里,显式的 for 循环更具可读性。

  • 移除了 reload()。请使用 imp.reload()

  • 已移除。dict.has_key() – 请改用 in 运算符。

构建和 C API 更改

由于时间限制,这里仅列出 C API 更改的非常不完整的列表。

  • 删除了对多个平台的支持,包括但不限于 Mac OS 9、BeOS、RISCOS、Irix 和 Tru64。

  • PEP 3118:新的缓冲区 API。

  • PEP 3121:扩展模块初始化和最终化。

  • PEP 3123:使 PyObject_HEAD 符合标准 C 规范。

  • 不再支持 C API 的受限执行。

  • PyNumber_Coerce()PyNumber_CoerceEx()PyMember_Get()PyMember_Set() C API 已被移除。

  • 新的 C API PyImport_ImportModuleNoBlock(),其功能类似于 PyImport_ImportModule(),但不会阻塞导入锁(而是返回错误)。

  • 重命名了布尔转换的 C 级槽和方法:nb_nonzero 现在是 nb_bool

  • 从 C API 中移除了 METH_OLDARGSWITH_CYCLE_GC

性能

3.0 版本通用化的最终结果是,Python 3.0 运行 pystone 基准测试比 Python 2.5 慢约 10%。最大的原因很可能是移除了对小整数的特殊处理。仍然有改进的空间,但这将在 3.0 发布后进行!

移植到 Python 3.0

对于将现有的 Python 2.5 或 2.6 源代码移植到 Python 3.0,最佳策略如下:

  1. (前提条件:)从出色的测试覆盖率开始。

  2. 移植到 Python 2.6。这应该不会比从 Python 2.x 到 Python 2.(x+1) 的平均移植工作量更多。确保所有测试都通过。

  3. (仍然使用 2.6:)打开 -3 命令行开关。这将启用有关 3.0 中将删除(或更改)的功能的警告。再次运行您的测试套件,并修复您收到警告的代码,直到没有剩余警告,并且所有测试仍然通过。

  4. 在您的源代码树上运行 2to3 源代码到源代码转换器。在 Python 3.0 下运行转换后的结果。手动修复任何剩余的问题,直到所有测试再次通过。

不建议尝试编写在 Python 2.6 和 3.0 下都能不变地运行的源代码;您必须使用非常扭曲的编码风格,例如避免使用 print 语句、元类等等。如果您正在维护一个需要同时支持 Python 2.6 和 Python 3.0 的库,最好的方法是通过编辑 2.6 版本的源代码并再次运行 2to3 转换器来修改上面的步骤 3,而不是编辑 3.0 版本的源代码。

有关将 C 扩展移植到 Python 3.0 的信息,请参阅 将扩展模块移植到 Python 3