3. Python 简介

在下面的示例中,输入和输出通过提示符的存在或不存在来区分(>>>):要重复该示例,您必须在提示符出现时键入提示符之后的所有内容;不以提示符开头的行是解释器的输出。请注意,示例中单独一行的辅助提示符表示您必须键入一个空行;这用于结束多行命令。

您可以通过单击示例框右上角的 >>> 来切换提示符和输出的显示。如果您隐藏示例的提示符和输出,则可以轻松地将输入行复制并粘贴到您的解释器中。

本手册中的许多示例,即使是在交互式提示符下输入的示例,也包含注释。Python 中的注释以井号字符 # 开头,并延伸到物理行的末尾。注释可以出现在一行的开头或空格或代码之后,但不能出现在字符串文字中。字符串文字中的井号字符只是一个井号字符。由于注释是为了澄清代码,并且不会被 Python 解释,因此在键入示例时可以省略它们。

一些例子

# this is the first comment
spam = 1  # and this is the second comment
          # ... and now a third!
text = "# This is not a comment because it's inside quotes."

3.1. 将 Python 用作计算器

让我们尝试一些简单的 Python 命令。启动解释器并等待主提示符 >>>。(应该不会花很长时间。)

3.1.1. 数字

解释器充当一个简单的计算器:您可以在其中键入一个表达式,它将写入该值。表达式语法很简单:运算符 +-*/ 可用于执行算术运算;括号 (()) 可用于分组。例如

>>> 2 + 2
4
>>> 50 - 5*6
20
>>> (50 - 5*6) / 4
5.0
>>> 8 / 5  # division always returns a floating-point number
1.6

整数(例如 2420)的类型为 int,带有小数部分的(例如 5.01.6)的类型为 float。我们将在本教程的后面部分看到更多关于数字类型的信息。

除法 (/) 总是返回一个浮点数。要进行 向下取整除法 并获得整数结果,您可以使用 // 运算符;要计算余数,您可以使用 %

>>> 17 / 3  # classic division returns a float
5.666666666666667
>>>
>>> 17 // 3  # floor division discards the fractional part
5
>>> 17 % 3  # the % operator returns the remainder of the division
2
>>> 5 * 3 + 2  # floored quotient * divisor + remainder
17

在 Python 中,可以使用 ** 运算符来计算幂 [1]

>>> 5 ** 2  # 5 squared
25
>>> 2 ** 7  # 2 to the power of 7
128

等号 (=) 用于为变量赋值。之后,在下一个交互式提示符之前不会显示任何结果

>>> width = 20
>>> height = 5 * 9
>>> width * height
900

如果变量未“定义”(赋值),则尝试使用它会报错

>>> n  # try to access an undefined variable
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'n' is not defined

完全支持浮点数;具有混合类型操作数的运算符会将整数操作数转换为浮点数

>>> 4 * 3.75 - 1
14.0

在交互模式下,最后打印的表达式被赋值给变量 _。这意味着当您将 Python 用作桌面计算器时,继续计算会更容易一些,例如

>>> tax = 12.5 / 100
>>> price = 100.50
>>> price * tax
12.5625
>>> price + _
113.0625
>>> round(_, 2)
113.06

用户应将此变量视为只读。不要显式地为其赋值 — 您将创建一个具有相同名称的独立局部变量,从而屏蔽具有其神奇行为的内置变量。

除了 intfloat 之外,Python 还支持其他类型的数字,例如 DecimalFraction。Python 还内置支持 复数,并使用 jJ 后缀来表示虚部(例如 3+5j)。

3.1.2. 文本

Python 可以操作文本(由类型 str 表示,即所谓的“字符串”)以及数字。这包括字符“!”、单词“rabbit”、名称“Paris”、句子“Got your back.”等。“Yay! :)”。它们可以用单引号 ('...') 或双引号 ("...") 括起来,结果相同 [2]

>>> 'spam eggs'  # single quotes
'spam eggs'
>>> "Paris rabbit got your back :)! Yay!"  # double quotes
'Paris rabbit got your back :)! Yay!'
>>> '1975'  # digits and numerals enclosed in quotes are also strings
'1975'

要引用引号,我们需要用 \ 对其进行“转义”。或者,我们可以使用另一种类型的引号

>>> 'doesn\'t'  # use \' to escape the single quote...
"doesn't"
>>> "doesn't"  # ...or use double quotes instead
"doesn't"
>>> '"Yes," they said.'
'"Yes," they said.'
>>> "\"Yes,\" they said."
'"Yes," they said.'
>>> '"Isn\'t," they said.'
'"Isn\'t," they said.'

在 Python shell 中,字符串定义和输出字符串可能看起来不同。print() 函数通过省略封闭引号并打印转义字符和特殊字符来生成更易读的输出

>>> s = 'First line.\nSecond line.'  # \n means newline
>>> s  # without print(), special characters are included in the string
'First line.\nSecond line.'
>>> print(s)  # with print(), special characters are interpreted, so \n produces new line
First line.
Second line.

如果您不希望 \ 开头的字符被解释为特殊字符,您可以通过在第一个引号之前添加 r 来使用 *原始字符串*

>>> print('C:\some\name')  # here \n means newline!
C:\some
ame
>>> print(r'C:\some\name')  # note the r before the quote
C:\some\name

原始字符串有一个微妙之处:原始字符串不能以奇数个 \ 字符结尾;有关详细信息和解决方法,请参阅 FAQ 条目

字符串文字可以跨越多行。一种方法是使用三引号:"""..."""'''...'''。行尾会自动包含在字符串中,但是可以通过在行尾添加 \ 来防止这种情况。在下面的示例中,不包括初始换行符

>>> print("""\
... Usage: thingy [OPTIONS]
...      -h                        Display this usage message
...      -H hostname               Hostname to connect to
... """)
Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to

>>>

字符串可以使用 + 运算符连接(粘合在一起),并使用 * 重复

>>> # 3 times 'un', followed by 'ium'
>>> 3 * 'un' + 'ium'
'unununium'

两个或多个彼此相邻的 *字符串文字*(即用引号括起来的字符串文字)会自动连接。

>>> 'Py' 'thon'
'Python'

当您想要断开长字符串时,此功能特别有用

>>> text = ('Put several strings within parentheses '
...         'to have them joined together.')
>>> text
'Put several strings within parentheses to have them joined together.'

但这只适用于两个文字,不适用于变量或表达式

>>> prefix = 'Py'
>>> prefix 'thon'  # can't concatenate a variable and a string literal
  File "<stdin>", line 1
    prefix 'thon'
           ^^^^^^
SyntaxError: invalid syntax
>>> ('un' * 3) 'ium'
  File "<stdin>", line 1
    ('un' * 3) 'ium'
               ^^^^^
SyntaxError: invalid syntax

如果要连接变量或变量和文字,请使用 +

>>> prefix + 'thon'
'Python'

字符串可以被 *索引*(下标),第一个字符的索引为 0。没有单独的字符类型;字符只是大小为 1 的字符串

>>> word = 'Python'
>>> word[0]  # character in position 0
'P'
>>> word[5]  # character in position 5
'n'

索引也可以是负数,从右侧开始计数

>>> word[-1]  # last character
'n'
>>> word[-2]  # second-last character
'o'
>>> word[-6]
'P'

请注意,由于 -0 与 0 相同,因此负索引从 -1 开始。

除了索引之外,还支持 *切片*。索引用于获取单个字符,而 *切片* 允许您获取子字符串

>>> word[0:2]  # characters from position 0 (included) to 2 (excluded)
'Py'
>>> word[2:5]  # characters from position 2 (included) to 5 (excluded)
'tho'

切片索引具有有用的默认值;省略的第一个索引默认为零,省略的第二个索引默认为被切片的字符串的大小。

>>> word[:2]   # character from the beginning to position 2 (excluded)
'Py'
>>> word[4:]   # characters from position 4 (included) to the end
'on'
>>> word[-2:]  # characters from the second-last (included) to the end
'on'

请注意,起始索引始终包含在切片内,而结束索引始终排除在外。这确保了 s[:i] + s[i:] 始终等于 s

>>> word[:2] + word[2:]
'Python'
>>> word[:4] + word[4:]
'Python'

记住切片工作方式的一种方法是将索引视为指向字符之间的位置,第一个字符的左边缘编号为 0。那么,长度为n个字符的字符串的最后一个字符的右边缘的索引为n,例如

 +---+---+---+---+---+---+
 | P | y | t | h | o | n |
 +---+---+---+---+---+---+
 0   1   2   3   4   5   6
-6  -5  -4  -3  -2  -1

第一行数字给出了字符串中索引 0...6 的位置;第二行给出了对应的负索引。从ij的切片由标记为ij的边缘之间的所有字符组成。

对于非负索引,如果两个索引都在范围内,则切片的长度是索引之差。例如,word[1:3] 的长度为 2。

尝试使用过大的索引将导致错误

>>> word[42]  # the word only has 6 characters
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: string index out of range

但是,当用于切片时,超出范围的切片索引会被优雅地处理

>>> word[4:42]
'on'
>>> word[42:]
''

Python 字符串不能被更改 — 它们是 不可变的。因此,为字符串中的索引位置赋值会导致错误

>>> word[0] = 'J'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'str' object does not support item assignment
>>> word[2:] = 'py'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'str' object does not support item assignment

如果你需要不同的字符串,你应该创建一个新的字符串

>>> 'J' + word[1:]
'Jython'
>>> word[:2] + 'py'
'Pypy'

内置函数 len() 返回字符串的长度

>>> s = 'supercalifragilisticexpialidocious'
>>> len(s)
34

另请参阅

文本序列类型 — str

字符串是序列类型的示例,并支持此类类型支持的常见操作。

字符串方法

字符串支持大量用于基本转换和搜索的方法。

f-字符串

具有嵌入表达式的字符串字面量。

格式化字符串语法

有关使用 str.format() 进行字符串格式化的信息。

printf 样式的字符串格式化

当字符串是 % 运算符的左操作数时调用的旧式格式化操作在此处进行了更详细的描述。

3.1.3. 列表

Python 知道许多复合数据类型,用于将其他值分组在一起。 最通用的类型是列表,它可以写成方括号之间用逗号分隔的值(项)列表。 列表可能包含不同类型的项,但通常这些项都具有相同的类型。

>>> squares = [1, 4, 9, 16, 25]
>>> squares
[1, 4, 9, 16, 25]

像字符串(和所有其他内置的序列类型)一样,列表可以进行索引和切片

>>> squares[0]  # indexing returns the item
1
>>> squares[-1]
25
>>> squares[-3:]  # slicing returns a new list
[9, 16, 25]

列表还支持诸如连接之类的操作

>>> squares + [36, 49, 64, 81, 100]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

不可变的字符串不同,列表是可变的类型,也就是说,可以更改其内容

>>> cubes = [1, 8, 27, 65, 125]  # something's wrong here
>>> 4 ** 3  # the cube of 4 is 64, not 65!
64
>>> cubes[3] = 64  # replace the wrong value
>>> cubes
[1, 8, 27, 64, 125]

你还可以通过使用 list.append()方法(我们稍后会看到更多关于方法的知识)在列表末尾添加新项

>>> cubes.append(216)  # add the cube of 6
>>> cubes.append(7 ** 3)  # and the cube of 7
>>> cubes
[1, 8, 27, 64, 125, 216, 343]

Python 中的简单赋值永远不会复制数据。当你将列表分配给变量时,该变量会引用现有列表。 你通过一个变量对列表所做的任何更改,都将通过引用该列表的所有其他变量可见。

>>> rgb = ["Red", "Green", "Blue"]
>>> rgba = rgb
>>> id(rgb) == id(rgba)  # they reference the same object
True
>>> rgba.append("Alph")
>>> rgb
["Red", "Green", "Blue", "Alph"]

所有切片操作都返回一个包含所请求元素的新列表。这意味着以下切片返回列表的浅拷贝

>>> correct_rgba = rgba[:]
>>> correct_rgba[-1] = "Alpha"
>>> correct_rgba
["Red", "Green", "Blue", "Alpha"]
>>> rgba
["Red", "Green", "Blue", "Alph"]

也可以对切片进行赋值,这甚至可以更改列表的大小或完全清除列表

>>> letters = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> letters
['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> # replace some values
>>> letters[2:5] = ['C', 'D', 'E']
>>> letters
['a', 'b', 'C', 'D', 'E', 'f', 'g']
>>> # now remove them
>>> letters[2:5] = []
>>> letters
['a', 'b', 'f', 'g']
>>> # clear the list by replacing all the elements with an empty list
>>> letters[:] = []
>>> letters
[]

内置函数 len() 也适用于列表

>>> letters = ['a', 'b', 'c', 'd']
>>> len(letters)
4

可以嵌套列表(创建包含其他列表的列表),例如

>>> a = ['a', 'b', 'c']
>>> n = [1, 2, 3]
>>> x = [a, n]
>>> x
[['a', 'b', 'c'], [1, 2, 3]]
>>> x[0]
['a', 'b', 'c']
>>> x[0][1]
'b'

3.2. 迈向编程的第一步

当然,我们可以使用 Python 执行比将二和二相加更复杂的任务。例如,我们可以编写 斐波那契数列的初始子序列,如下所示

>>> # Fibonacci series:
>>> # the sum of two elements defines the next
>>> a, b = 0, 1
>>> while a < 10:
...     print(a)
...     a, b = b, a+b
...
0
1
1
2
3
5
8

此示例引入了几个新功能。

  • 第一行包含多重赋值:变量 ab 同时获得新值 0 和 1。在最后一行,再次使用了多重赋值,这表明在执行任何赋值之前,会首先对右侧的表达式求值。 右侧的表达式从左到右进行求值。

  • while 循环只要条件(此处为:a < 10)保持为真就执行。在 Python 中,就像在 C 中一样,任何非零整数值都为真;零为假。该条件也可以是字符串或列表值,实际上可以是任何序列;任何具有非零长度的值都为真,空序列为假。示例中使用的测试是一个简单的比较。标准比较运算符的写法与 C 中相同:<(小于)、>(大于)、==(等于)、<=(小于或等于)、>=(大于或等于)和 !=(不等于)。

  • 循环的主体缩进的:缩进是 Python 对语句进行分组的方式。在交互式提示符下,你必须为每个缩进行键入制表符或空格。实际上,你将使用文本编辑器为 Python 准备更复杂的输入;所有像样的文本编辑器都有自动缩进功能。当交互式输入复合语句时,其后必须跟一个空行,以表示完成(因为解析器无法猜测你何时输入最后一行)。请注意,基本块中的每一行都必须缩进相同的数量。

  • print() 函数写入它所给出的参数的值。它与仅写入要写入的表达式(就像我们在计算器示例中所做的那样)的不同之处在于它处理多个参数、浮点数和字符串的方式。字符串在打印时不带引号,并在项目之间插入空格,因此你可以很好地格式化内容,例如这样

    >>> i = 256*256
    >>> print('The value of i is', i)
    The value of i is 65536
    

    可以使用关键字参数 end 来避免在输出后换行,或者使用不同的字符串结束输出

    >>> a, b = 0, 1
    >>> while a < 1000:
    ...     print(a, end=',')
    ...     a, b = b, a+b
    ...
    0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,
    

脚注