Python 3.0 的新特性¶
- 作者:
Guido van Rossum
本文解释了 Python 3.0 相较于 2.6 的新特性。Python 3.0,也被称为“Python 3000”或“Py3K”,是第一个有意向后不兼容的 Python 版本。Python 3.0 于 2008 年 12 月 3 日发布。与典型的版本相比,它有更多的更改,并且对所有 Python 用户来说都更重要。然而,在消化了这些更改之后,你会发现 Python 实际上并没有改变太多——总的来说,我们主要是在修复众所周知的烦恼和缺陷,并删除大量旧的无用代码。
本文不试图提供所有新功能的完整规范,而是试图给出一个方便的概述。有关完整详细信息,您应该参考 Python 3.0 的文档和/或文本中引用的许多 PEP。如果您想了解特定功能的完整实现和设计原理,PEP 通常比常规文档有更多的细节;但请注意,一旦某个功能完全实现,PEP 通常不会保持更新。
由于时间限制,本文档并不像它应该的那样完整。与新版本一样,源代码发行版中的 Misc/NEWS
文件包含有关所做的每一件小事的丰富详细信息。
常见的绊脚石¶
本节列出了如果您习惯了 Python 2.5 最容易让您绊倒的一些更改。
Print 是一个函数¶
print
语句已被 print()
函数取代,该函数带有关键字参数,以取代旧 print
语句的大部分特殊语法 (PEP 3105)。例子
Old: print "The answer is", 2*2
New: print("The answer is", 2*2)
Old: print x, # Trailing comma suppresses newline
New: print(x, end=" ") # Appends a space instead of a newline
Old: print # Prints a newline
New: print() # You must call the function!
Old: print >>sys.stderr, "fatal error"
New: print("fatal error", file=sys.stderr)
Old: print (x, y) # prints repr((x, y))
New: print((x, y)) # Not the same as print(x, y)!
您还可以自定义项目之间的分隔符,例如
print("There are <", 2**32, "> possibilities!", sep="")
这会产生
There are <4294967296> possibilities!
注意
视图和迭代器代替列表¶
一些众所周知的 API 不再返回列表
dict
方法dict.keys()
、dict.items()
和dict.values()
返回“视图”而不是列表。例如,这不再有效:k = d.keys(); k.sort()
。请使用k = sorted(d)
代替(这在 Python 2.5 中也有效,并且同样高效)。此外,不再支持
dict.iterkeys()
、dict.iteritems()
和dict.itervalues()
方法。map()
和filter()
返回迭代器。如果您真的需要列表,并且输入序列的长度都相等,则一个快速的解决方法是将map()
包装在list()
中,例如list(map(...))
,但更好的解决方法通常是使用列表推导式(特别是当原始代码使用lambda
时),或者重写代码使其根本不需要列表。特别棘手的是map()
为了函数副作用而调用;正确的转换是使用常规的for
循环(因为创建列表只会浪费)。如果输入序列的长度不相等,则
map()
将在最短序列终止时停止。为了与 Python 2.x 中的map()
完全兼容,还要将序列包装在itertools.zip_longest()
中,例如map(func, *sequences)
变为list(map(func, itertools.zip_longest(*sequences)))
。range()
现在的行为类似于xrange()
过去的行为,只是它可以处理任意大小的值。后者不再存在。zip()
现在返回一个迭代器。
排序比较¶
Python 3.0 简化了排序比较的规则
当操作数没有有意义的自然排序时,排序比较运算符(
<
、<=
、>=
、>
)会引发 TypeError 异常。因此,像1 < ''
、0 > None
或len <= len
这样的表达式不再有效,例如,None < None
会引发TypeError
而不是返回False
。一个推论是,对异构列表进行排序不再有意义——所有元素都必须彼此可比较。请注意,这不适用于==
和!=
运算符:不同且不可比较类型的对象始终彼此比较不相等。sorted()
和list.sort()
不再接受提供比较函数的 *cmp* 参数。请改用 *key* 参数。注意,*key* 和 *reverse* 参数现在是“仅关键字”的参数。cmp()
函数应被视为已删除,并且不再支持__cmp__()
特殊方法。请将__lt__()
用于排序,将__eq__()
与__hash__()
结合使用,并根据需要使用其他丰富的比较。(如果您真的需要cmp()
功能,则可以使用表达式(a > b) - (a < b)
作为cmp(a, b)
的等效项。)
整数¶
PEP 237:本质上,
long
被重命名为int
。也就是说,只有一个内置的整数类型,名为int
;但它的行为方式大多与旧的long
类型相同。PEP 238:像
1/2
这样的表达式返回一个浮点数。使用1//2
来获得截断行为。(后一种语法已经存在多年,至少从 Python 2.2 开始就有了。)sys.maxint
常量被移除,因为整数的值不再有限制。然而,sys.maxsize
可以用作大于任何实际列表或字符串索引的整数。它符合实现的“自然”整数大小,并且通常与同一平台上先前版本中的sys.maxint
相同(假设使用相同的构建选项)。八进制字面量不再采用
0720
的形式;请改用0o720
。
文本与数据,而非 Unicode 与 8 位¶
你所认为的关于二进制数据和 Unicode 的一切都已改变。
Python 3.0 使用 _文本_ 和(二进制)_数据_ 的概念,而不是 Unicode 字符串和 8 位字符串。所有文本都是 Unicode;然而,_编码_ 的 Unicode 表示为二进制数据。用于保存文本的类型是
str
,用于保存数据的类型是bytes
。与 2.x 情况的最大区别在于,任何在 Python 3.0 中混合文本和数据的尝试都会引发TypeError
,而在 Python 2.x 中混合 Unicode 和 8 位字符串,如果 8 位字符串恰好只包含 7 位 (ASCII) 字节,则会起作用,但如果它包含非 ASCII 值,则会得到UnicodeDecodeError
。多年来,这种特定于值的行为导致了许多不愉快的局面。由于这种理念的改变,几乎所有使用 Unicode、编码或二进制数据的代码都可能需要更改。这种改变是积极的,因为在 2.x 版本中,存在许多与混合编码和未编码文本有关的错误。为了在 Python 2.x 中做好准备,请开始对所有未编码文本使用
unicode
,并仅对二进制或编码数据使用str
。然后2to3
工具将为你完成大部分工作。你不能再使用
u"..."
字面量表示 Unicode 文本。但是,你必须使用b"..."
字面量表示二进制数据。由于
str
和bytes
类型不能混合使用,你必须始终在它们之间进行显式转换。使用str.encode()
从str
转到bytes
,使用bytes.decode()
从bytes
转到str
。你还可以分别使用bytes(s, encoding=...)
和str(b, encoding=...)
。与
str
一样,bytes
类型是不可变的。有一个单独的 _可变_ 类型用于保存缓冲的二进制数据,bytearray
。几乎所有接受bytes
的 API 也接受bytearray
。可变 API 基于collections.MutableSequence
。原始字符串字面量中的所有反斜杠都按字面意思解释。这意味着原始字符串中的
'\U'
和'\u'
转义不会被特殊处理。例如,r'\u20ac'
在 Python 3.0 中是一个包含 6 个字符的字符串,而在 2.6 中,ur'\u20ac'
是单个“欧元”字符。(当然,此更改仅影响原始字符串字面量;欧元字符在 Python 3.0 中是'\u20ac'
。)内置的
basestring
抽象类型已被移除。请改用str
。str
和bytes
类型没有足够多的共同功能来保证使用共享的基类。2to3
工具(见下文)将每个basestring
的出现替换为str
。作为文本文件打开的文件(仍然是
open()
的默认模式)始终使用编码在字符串(在内存中)和字节(在磁盘上)之间进行映射。二进制文件(在模式参数中使用b
打开)始终在内存中使用字节。这意味着,如果使用不正确的模式或编码打开文件,I/O 很可能会大声失败,而不是默默地产生不正确的数据。这也意味着,即使是 Unix 用户也必须在打开文件时指定正确的模式(文本或二进制)。存在一个平台相关的默认编码,在 Unix 平台上可以使用LANG
环境变量进行设置(有时也可以使用其他一些平台特定的区域设置相关的环境变量)。在许多情况下,但并非所有情况下,系统默认值都是 UTF-8;你不应依赖此默认值。任何读取或写入纯 ASCII 文本之外的内容的应用程序都应该有一种覆盖编码的方法。不再需要在codecs
模块中使用编码感知流。sys.stdin
、sys.stdout
和sys.stderr
的初始值现在都是仅限 Unicode 的文本文件(即,它们是io.TextIOBase
的实例)。要使用这些流读取和写入字节数据,你需要使用它们的io.TextIOBase.buffer
属性。文件名以(Unicode)字符串的形式传递给 API 并从 API 返回。这可能会带来平台特定的问题,因为在某些平台上,文件名是任意的字节字符串。(另一方面,在 Windows 上,文件名以 Unicode 的形式原生存储。)作为一种变通方法,大多数接受文件名的 API(例如
open()
和os
模块中的许多函数)也接受bytes
对象以及字符串,并且一些 API 有方法请求返回bytes
值。因此,如果参数是bytes
实例,则os.listdir()
返回一个bytes
实例列表,而os.getcwdb()
返回当前工作目录作为bytes
实例。请注意,当os.listdir()
返回字符串列表时,无法正确解码的文件名会被省略,而不是引发UnicodeError
。当系统提供的字节无法使用默认编码解释时,某些系统 API(如
os.environ
和sys.argv
)也可能会出现问题。设置LANG
变量并重新运行程序可能是最好的方法。PEP 3138: 字符串的
repr()
不再转义非 ASCII 字符。但是,它仍然会转义控制字符和 Unicode 标准中具有不可打印状态的代码点。PEP 3120: 默认的源代码编码现在是 UTF-8。
PEP 3131: 现在标识符中允许使用非 ASCII 字母。(但是,标准库仍然仅限 ASCII,注释中的贡献者姓名除外。)
StringIO
和cStringIO
模块已删除。请改为导入io
模块,并分别使用io.StringIO
或io.BytesIO
来处理文本和数据。另请参阅为 Python 3.0 更新的 Unicode HOWTO。
语法更改概述¶
本节简要概述 Python 3.0 中的每个语法更改。
新语法¶
PEP 3107: 函数参数和返回值注解。这提供了一种标准化方法来注解函数的参数和返回值。这些注解没有附加的语义,只是可以使用
__annotations__
属性在运行时进行内省。目的是鼓励通过元类、装饰器或框架进行实验。PEP 3102: 仅限关键字的参数。参数列表中出现在
*args
之后的命名参数必须在调用时使用关键字语法指定。你也可以在参数列表中使用裸*
来表示你不接受可变长度的参数列表,但你有仅限关键字的参数。在类定义中,基本类列表之后允许使用关键字参数。这被用于指定元类的新约定(请参阅下一节),但只要元类支持,它也可以用于其他目的。
PEP 3104:
nonlocal
语句。使用nonlocal x
,你现在可以直接赋值给外部(但非全局)作用域中的变量。nonlocal
是一个新的保留字。PEP 3132: 扩展的可迭代解包。你现在可以编写诸如
a, b, *rest = some_sequence
之类的代码。甚至*rest, a = stuff
。rest
对象始终是一个(可能为空)列表;右侧可以是任何可迭代对象。示例(a, *rest, b) = range(5)
这将 a 设置为
0
,b 设置为4
,rest 设置为[1, 2, 3]
。字典推导式:
{k: v for k, v in stuff}
与dict(stuff)
的含义相同,但更灵活。(这是 PEP 274 证明是正确的。 :-))集合字面量,例如
{1, 2}
。请注意,{}
是一个空字典;对于空集合,请使用set()
。也支持集合推导式;例如,{x for x in stuff}
与set(stuff)
的含义相同,但更灵活。新的八进制字面量,例如
0o720
(在 2.6 中已经存在)。旧的八进制字面量 (0720
) 已删除。新的二进制字面量,例如
0b1010
(在 2.6 中已经存在),并且有一个新的对应的内置函数bin()
。字节字面量以引导
b
或B
引入,并且有一个新的对应的内置函数bytes()
。
更改的语法¶
PEP 3109 和 PEP 3134: 新的
raise
语句语法:raise [expr [from expr]]
。请参阅下文。as
和with
现在是保留字。(实际上是从 2.6 开始。)True
、False
和None
是保留字。(2.6 已经部分强制执行了对None
的限制。)PEP 3115: 新的元类语法。而不是
class C: __metaclass__ = M ...
你现在必须使用
class C(metaclass=M): ...
不再支持模块全局
__metaclass__
变量。(它是一个拐杖,用于使在不从object
派生每个类的情况下,更容易默认使用新式类。)列表推导式不再支持
[... for var in item1, item2, ...]
这种语法形式。请改用[... for var in (item1, item2, ...)]
。 另外请注意,列表推导式具有不同的语义:它们更接近于list()
构造函数内部生成器表达式的语法糖,特别是循环控制变量不再泄露到周围的作用域中。省略号 (
...
) 可以用作任何位置的原子表达式。(以前只允许在切片中使用。)此外,它现在必须拼写为...
。(以前也可以拼写为. . .
,这只是语法上的一个偶然情况。)
已移除的语法¶
PEP 3113:元组参数解包已移除。您不能再编写
def foo(a, (b, c)): ...
。请改用def foo(a, b_c): b, c = b_c
。移除了反引号(请改用
repr()
)。移除了
<>
(请改用!=
)。移除了关键字:
exec()
不再是关键字;它仍然是一个函数。(幸运的是,在 2.x 中也接受函数语法。)另请注意,exec()
不再接受流参数;您可以使用exec(f.read())
来代替exec(f)
。整数文字不再支持尾随的
l
或L
。字符串文字不再支持前导的
u
或U
。相对导入唯一可接受的语法是
from .[模块] import 名称
。所有不以.
开头的import
形式都被解释为绝对导入。(PEP 328)经典类已移除。
Python 2.6 中已存在的更改¶
由于许多用户可能直接从 Python 2.5 跳转到 Python 3.0,因此本节提醒读者注意最初为 Python 3.0 设计但已向后移植到 Python 2.6 的新功能。有关更详细的描述,请查阅 Python 2.6 中的新增功能 中的相应章节。
PEP 343: ‘with’ 语句。
with
语句现在是标准功能,不再需要从__future__
导入。另请查看 编写上下文管理器 和 contextlib 模块。PEP 366: 从主模块显式相对导入。这增强了当引用的模块位于包中时
-m
选项的实用性。PEP 3101: 高级字符串格式化。注意:2.6 的描述中提到了 8 位字符串和 Unicode 字符串的
format()
方法。在 3.0 中,只有str
类型(支持 Unicode 的文本字符串)支持此方法;bytes
类型不支持。计划最终使其成为字符串格式化的唯一 API,并在 Python 3.1 中开始弃用%
运算符。PEP 3105: 将 print 作为函数。这现在是一个标准功能,不再需要从
__future__
导入。上面已提供了更多详细信息。PEP 3110: 异常处理变更。
except
excas
var 语法现在是标准的,不再支持except
exc, var。(当然,as
var 部分仍然是可选的。)PEP 3112: 字节文字。
b"..."
字符串文字表示法(及其变体,如b'...'
、b"""..."""
和br"..."
)现在生成bytes
类型的文字。PEP 3116: 新 I/O 库。
io
模块现在是进行文件 I/O 的标准方式。内置的open()
函数现在是io.open()
的别名,并具有附加的关键字参数 encoding、errors、newline 和 closefd。另请注意,无效的 mode 参数现在会引发ValueError
,而不是IOError
。可以通过f.buffer
访问文本文件对象下方的二进制文件对象(但请注意,文本对象会维护自身的缓冲区,以便加快编码和解码操作)。PEP 3118: 修订的缓冲协议。旧的内置
buffer()
现在真的消失了;新的内置memoryview()
提供了(大部分)类似的功能。PEP 3119:抽象基类。
abc
模块和collections
模块中定义的 ABC 在该语言中扮演着更为重要的角色,并且诸如dict
和list
等内置集合类型分别符合collections.MutableMapping
和collections.MutableSequence
ABC。PEP 3127:整数文本支持和语法。 如上所述,新的八进制文本表示法是唯一受支持的表示法,并且已添加了二进制文本。
PEP 3141:数字的类型层次结构。
numbers
模块是 ABC 的另一个新用法,它定义了 Python 的“数字塔”。 另请注意实现numbers.Rational
的新fractions
模块。
库的更改¶
由于时间限制,本文档并未详尽涵盖标准库的非常广泛的更改。PEP 3108 是库的主要更改的参考。以下是简要回顾
许多旧模块已被删除。 一些模块,例如
gopherlib
(不再使用)和md5
(已由hashlib
替换),已被 PEP 4 弃用。 其他模块由于取消了对各种平台(例如 Irix,BeOS 和 Mac OS 9)的支持而被删除(请参阅 PEP 11)。 一些模块也由于缺乏使用或存在更好的替代方案而在 Python 3.0 中被选中删除。 有关详尽列表,请参阅 PEP 3108。bsddb3
包已被删除,因为它在核心标准库中的存在已被证明是核心开发人员的特殊负担,原因是测试不稳定以及 Berkeley DB 的发布计划。 但是,该软件包在 https://www.jcea.es/programacion/pybsddb.htm 上得到了活跃且良好的维护。一些模块由于其旧名称违反了 PEP 8,或者出于各种其他原因而被重命名。 这是列表
旧名称
新名称
_winreg
winreg
ConfigParser
configparser
copy_reg
copyreg
Queue
queue
SocketServer
socketserver
markupbase
_markupbase
repr
reprlib
test.test_support
test.support
Python 2.x 中的一种常见模式是使用纯 Python 实现模块的一个版本,并使用 C 扩展来实现可选的加速版本; 例如,
pickle
和cPickle
。 这将导入加速版本并回退到这些模块的每个用户的纯 Python 版本的负担。 在 Python 3.0 中,加速版本被认为是纯 Python 版本的实现细节。 用户应始终导入标准版本,该版本尝试导入加速版本并回退到纯 Python 版本。pickle
/cPickle
对已受到这种处理。profile
模块在 3.1 的列表中。StringIO
模块已转换为io
模块中的一个类。一些相关的模块已分组到包中,并且通常简化了子模块名称。 产生的新包是
dbm
(anydbm
,dbhash
,dbm
,dumbdbm
,gdbm
,whichdb
)。html
(HTMLParser
,htmlentitydefs
)。http
(httplib
,BaseHTTPServer
,CGIHTTPServer
,SimpleHTTPServer
,Cookie
,cookielib
)。tkinter
(所有与Tkinter
相关的模块,除了turtle
)。turtle
的目标受众实际上并不关心tkinter
。 另请注意,自 Python 2.6 起,turtle
的功能已大大增强。urllib
(urllib
,urllib2
,urlparse
,robotparse
)。xmlrpc
(xmlrpclib
,DocXMLRPCServer
,SimpleXMLRPCServer
)。
对标准库模块的其他一些更改,未在 PEP 3108 中涵盖
已删除
sets
。 请使用内置的set()
类。清理
sys
模块:删除了sys.exitfunc()
,sys.exc_clear()
,sys.exc_type
,sys.exc_value
,sys.exc_traceback
。 (请注意,sys.last_type
等仍然存在。)清理
array.array
类型:read()
和write()
方法已移除;请改用fromfile()
和tofile()
。此外,array 的'c'
类型代码也已移除 – 请使用'b'
表示字节,或使用'u'
表示 Unicode 字符。清理
operator
模块:移除了sequenceIncludes()
和isCallable()
。清理
thread
模块:acquire_lock()
和release_lock()
已移除;请改用acquire()
和release()
。清理
random
模块:移除了jumpahead()
API。new
模块已移除。函数
os.tmpnam()
、os.tempnam()
和os.tmpfile()
已移除,请改用tempfile
模块。tokenize
模块已更改为使用字节工作。现在的主要入口点是tokenize.tokenize()
,而不是 generate_tokens。string.letters
及其朋友(string.lowercase
和string.uppercase
)已移除。请改用string.ascii_letters
等。(移除的原因是string.letters
及其朋友具有特定于语言环境的行为,对于这种具有吸引力的全局“常量”来说,这不是一个好主意。)将模块
__builtin__
重命名为builtins
(删除了下划线,添加了 ‘s’)。在大多数全局命名空间中找到的__builtins__
变量保持不变。要修改内置对象,您应该使用builtins
,而不是__builtins__
!
PEP 3101:一种新的字符串格式化方法¶
一个新的内置字符串格式化操作系统取代了
%
字符串格式化运算符。(但是,仍然支持%
运算符;它将在 Python 3.1 中被弃用,并在以后的某个时间从语言中删除。)请阅读 PEP 3101 以获取完整信息。
异常的更改¶
引发和捕获异常的 API 已被清理,并添加了新的强大功能
PEP 352:所有异常都必须(直接或间接)派生自
BaseException
。这是异常层次结构的根。这并非新的建议,但继承自BaseException
的要求是新的。(Python 2.6 仍然允许引发经典类,并且对您可以捕获的内容没有任何限制。)因此,字符串异常最终真正彻底地消亡了。几乎所有异常实际上都应该派生自
Exception
;BaseException
应该仅用作应该仅在顶层处理的异常的基类,例如SystemExit
或KeyboardInterrupt
。处理除后一类之外的所有异常的推荐用法是使用except
Exception
。StandardError
已移除。异常不再表现为序列。请改用
args
属性。PEP 3109:引发异常。现在您必须使用
raise Exception(args)
,而不是raise Exception, args
。此外,您不能再显式指定回溯;相反,如果您必须这样做,您可以直接分配给__traceback__
属性(见下文)。PEP 3110:捕获异常。现在您必须使用
except SomeException as variable
,而不是except SomeException, variable
。此外,当except
块离开时,variable 会被显式删除。PEP 3134:异常链接。有两种情况:隐式链接和显式链接。当在
except
或finally
处理程序块中引发异常时,会发生隐式链接。这通常是由于处理程序块中的错误导致的;我们称之为次级异常。在这种情况下,原始异常(正在处理的异常)将作为次级异常的__context__
属性保存。使用以下语法调用显式链接raise SecondaryException() from primary_exception
(其中 *primary_exception* 是产生异常对象的任何表达式,可能是之前捕获的异常)。在这种情况下,主异常存储在次级异常的
__cause__
属性上。当发生未处理的异常时打印的回溯会遍历__cause__
和__context__
属性的链,并为链的每个组件打印单独的回溯,主异常位于顶部。(Java 用户可能会认识到此行为。)PEP 3134:异常对象现在将其回溯存储为
__traceback__
属性。这意味着异常对象现在包含与异常相关的所有信息,并且使用sys.exc_info()
的理由更少了(尽管后者并未被移除)。当 Windows 无法加载扩展模块时,改进了一些异常消息。例如,
错误代码 193
现在是%1 不是有效的 Win32 应用程序
。字符串现在处理非英语语言环境。
其他杂项更改¶
运算符和特殊方法¶
!=
现在返回==
的相反结果,除非==
返回NotImplemented
。“未绑定方法”的概念已从语言中删除。当将方法作为类属性引用时,现在会得到一个普通的函数对象。
__getslice__()
、__setslice__()
和__delslice__()
已被移除。语法a[i:j]
现在转换为a.__getitem__(slice(i, j))
(或者,当用作赋值或删除目标时,分别转换为__setitem__()
或__delitem__()
)。PEP 3114:标准的
next()
方法已重命名为__next__()
。移除了
__oct__()
和__hex__()
特殊方法 ——oct()
和hex()
现在使用__index__()
将参数转换为整数。移除了对
__members__
和__methods__
的支持。名为
func_X
的函数属性已重命名为使用__X__
形式,从而在函数属性命名空间中为用户定义的属性释放这些名称。也就是说,func_closure
、func_code
、func_defaults
、func_dict
、func_doc
、func_globals
、func_name
分别重命名为__closure__
、__code__
、__defaults__
、__dict__
、__doc__
、__globals__
、__name__
。__nonzero__()
现在是__bool__()
。
内置函数¶
PEP 3135:新的
super()
。现在可以不带参数调用super()
,并且(假设这是在class
语句中定义的常规实例方法)会自动选择正确的类和实例。带参数时,super()
的行为不变。PEP 3111:
raw_input()
已重命名为input()
。也就是说,新的input()
函数从sys.stdin
读取一行,并删除末尾的换行符后返回。如果输入过早终止,则会引发EOFError
。要获得旧的input()
行为,请使用eval(input())
。添加了一个新的内置函数
next()
,用于调用对象上的__next__()
方法。round()
函数的舍入策略和返回类型已更改。精确的中间情况现在舍入到最接近的偶数结果,而不是远离零。(例如,round(2.5)
现在返回2
而不是3
。)round(x[, n])
现在委托给x.__round__([n])
而不是总是返回浮点数。当使用单个参数调用时,它通常返回一个整数;当使用两个参数调用时,它返回与x
相同类型的值。将
intern()
移到sys.intern()
。已移除:
apply()
。使用f(*args)
代替apply(f, args)
。移除了
callable()
。可以使用isinstance(f, collections.Callable)
代替callable(f)
。operator.isCallable()
函数也已消失。移除了
coerce()
。既然经典类已经消失,此函数不再有作用。移除了
execfile()
。使用exec(open(fn).read())
代替execfile(fn)
。移除了
reduce()
。如果确实需要,请使用functools.reduce()
;但是,99% 的时间里,显式的for
循环更具可读性。移除了
reload()
。请使用imp.reload()
。已移除。
dict.has_key()
– 请改用in
运算符。
构建和 C API 更改¶
由于时间限制,这里仅列出 C API 更改的非常不完整的列表。
删除了对多个平台的支持,包括但不限于 Mac OS 9、BeOS、RISCOS、Irix 和 Tru64。
PEP 3118:新的缓冲区 API。
PEP 3121:扩展模块初始化和最终化。
PEP 3123:使
PyObject_HEAD
符合标准 C 规范。不再支持 C API 的受限执行。
PyNumber_Coerce()
、PyNumber_CoerceEx()
、PyMember_Get()
和PyMember_Set()
C API 已被移除。新的 C API
PyImport_ImportModuleNoBlock()
,其功能类似于PyImport_ImportModule()
,但不会阻塞导入锁(而是返回错误)。重命名了布尔转换的 C 级槽和方法:
nb_nonzero
现在是nb_bool
。从 C API 中移除了
METH_OLDARGS
和WITH_CYCLE_GC
。
性能¶
3.0 版本通用化的最终结果是,Python 3.0 运行 pystone 基准测试比 Python 2.5 慢约 10%。最大的原因很可能是移除了对小整数的特殊处理。仍然有改进的空间,但这将在 3.0 发布后进行!
移植到 Python 3.0¶
对于将现有的 Python 2.5 或 2.6 源代码移植到 Python 3.0,最佳策略如下:
(前提条件:)从出色的测试覆盖率开始。
移植到 Python 2.6。这应该不会比从 Python 2.x 到 Python 2.(x+1) 的平均移植工作量更多。确保所有测试都通过。
(仍然使用 2.6:)打开
-3
命令行开关。这将启用有关 3.0 中将删除(或更改)的功能的警告。再次运行您的测试套件,并修复您收到警告的代码,直到没有剩余警告,并且所有测试仍然通过。在您的源代码树上运行
2to3
源代码到源代码转换器。在 Python 3.0 下运行转换后的结果。手动修复任何剩余的问题,直到所有测试再次通过。
不建议尝试编写在 Python 2.6 和 3.0 下都能不变地运行的源代码;您必须使用非常扭曲的编码风格,例如避免使用 print
语句、元类等等。如果您正在维护一个需要同时支持 Python 2.6 和 Python 3.0 的库,最好的方法是通过编辑 2.6 版本的源代码并再次运行 2to3
转换器来修改上面的步骤 3,而不是编辑 3.0 版本的源代码。
有关将 C 扩展移植到 Python 3.0 的信息,请参阅 将扩展模块移植到 Python 3。