跳转到内容

非程序员的 Python 3 教程/更多关于列表

来自维基教科书,开放的世界开放书籍

我们已经看到了列表以及如何使用它们。现在您已经了解了一些背景知识,我将详细介绍列表。首先,我们将研究更多访问列表中元素的方法,然后我们将讨论如何复制它们。

以下是一些使用索引访问列表单个元素的示例

>>> some_numbers = ['zero', 'one', 'two', 'three', 'four', 'five']
>>> some_numbers[0]
'zero'
>>> some_numbers[4]
'four'
>>> some_numbers[5]
'five'

所有这些示例都应该很熟悉。如果您想要列表中的第一个项目,只需查看索引 0。第二个项目是索引 1,依此类推。但是,如果您想要列表中的最后一个项目呢?一种方法是使用 len() 函数,例如 some_numbers[len(some_numbers) - 1]。这种方法有效,因为 len() 函数始终返回最后一个索引加一。倒数第二个将是 some_numbers[len(some_numbers) - 2]。有一种更简单的方法。在 Python 中,最后一个项目始终是索引 -1。倒数第二个是索引 -2,依此类推。以下是一些更多示例

>>> some_numbers[len(some_numbers) - 1]
'five'
>>> some_numbers[len(some_numbers) - 2]
'four'
>>> some_numbers[-1]
'five'
>>> some_numbers[-2]
'four'
>>> some_numbers[-6]
'zero'

因此,列表中的任何项目都可以用两种方式索引:从前面和从后面。

另一种访问列表部分的有用方法是使用切片。以下是一个示例,让您了解它们的用途

>>> things = [0, 'Fred', 2, 'S.P.A.M.', 'Stocking', 42, "Jack", "Jill"]
>>> things[0]
0
>>> things[7]
'Jill'
>>> things[0:8]
[0, 'Fred', 2, 'S.P.A.M.', 'Stocking', 42, 'Jack', 'Jill']
>>> things[2:4]
[2, 'S.P.A.M.']
>>> things[4:7]
['Stocking', 42, 'Jack']
>>> things[1:5]
['Fred', 2, 'S.P.A.M.', 'Stocking']

切片用于返回列表的一部分。切片运算符的形式为 things[first_index:last_index]。切片在 first_index 之前和 last_index 之前切割列表,并返回两者之间的部分。您可以使用两种类型的索引

>>> things[-4:-2]
['Stocking', 42]
>>> things[-4]
'Stocking'
>>> things[-4:6]
['Stocking', 42]

切片中的另一个技巧是未指定的索引。如果未指定第一个索引,则假定为列表的开头。如果未指定最后一个索引,则假定为列表的剩余部分。以下是一些示例

>>> things[:2]
[0, 'Fred']
>>> things[-2:]
['Jack', 'Jill']
>>> things[:3]
[0, 'Fred', 2]
>>> things[:-5]
[0, 'Fred', 2]

这是一个(受 HTML 启发的)程序示例(如果您需要,请复制并粘贴到诗歌定义中)

poem = ["<B>", "Jack", "and", "Jill", "</B>", "went", "up", "the",
        "hill", "to", "<B>", "fetch", "a", "pail", "of", "</B>",
        "water.", "Jack", "fell", "<B>", "down", "and", "broke",
        "</B>", "his", "crown", "and", "<B>", "Jill", "came",
        "</B>", "tumbling", "after"]

def get_bold(text):
    true = 1
    false = 0
    ## is_bold tells whether or not we are currently looking at 
    ## a bold section of text.
    is_bold = false
    ## start_block is the index of the start of either an unbolded 
    ## segment of text or a bolded segment.
    start_block = 0
    for index in range(len(text)):
        ## Handle a starting of bold text
        if text[index] == "<B>":
            if is_bold:
                print("Error: Extra Bold")
            ## print "Not Bold:", text[start_block:index]
            is_bold = true
            start_block = index + 1
        ## Handle end of bold text
        ## Remember that the last number in a slice is the index 
        ## after the last index used.
        if text[index] == "</B>":
            if not is_bold:
                print("Error: Extra Close Bold")
            print("Bold [", start_block, ":", index, "]", text[start_block:index])
            is_bold = false
            start_block = index + 1

get_bold(poem)

输出为

Bold [ 1 : 4 ] ['Jack', 'and', 'Jill']
Bold [ 11 : 15 ] ['fetch', 'a', 'pail', 'of']
Bold [ 20 : 23 ] ['down', 'and', 'broke']
Bold [ 28 : 30 ] ['Jill', 'came']

get_bold() 函数接受一个列表,该列表被分解为单词和标记。它查找的标记是 <B>(开始粗体文本)和 </B>(结束粗体文本)。get_bold() 函数会遍历并搜索开始和结束标记。

列表的下一个功能是复制它们。如果您尝试像这样简单的事情

>>> a = [1, 2, 3]
>>> b = a
>>> print(b)
[1, 2, 3]
>>> b[1] = 10
>>> print(b)
[1, 10, 3]
>>> print(a)
[1, 10, 3]

这看起来可能令人惊讶,因为对 b 的修改也导致了 a 的更改。发生的事情是,语句 b = a 使 b 成为 a引用。这意味着可以将 b 视为 a 的另一个名称。因此,对 b 的任何修改也会更改 a。但是,有些赋值不会为一个列表创建两个名称

>>> a = [1, 2, 3]
>>> b = a * 2
>>> print(a)
[1, 2, 3]
>>> print(b)
[1, 2, 3, 1, 2, 3]
>>> a[1] = 10
>>> print(a)
[1, 10, 3]
>>> print(b)
[1, 2, 3, 1, 2, 3]

在这种情况下,b 不是 a 的引用,因为表达式 a * 2 创建了一个新列表。然后,语句 b = a * 2 使 b 成为 a * 2 的引用,而不是 a 的引用。所有赋值操作都会创建引用。当您将列表作为参数传递给函数时,您也会创建引用。大多数时候,您不必担心创建引用而不是副本。但是,当您需要修改一个列表而不更改另一个列表名称时,您必须确保您实际上创建了一个副本。

有几种方法可以制作列表的副本。最简单的方法是使用切片运算符,因为它始终创建一个新列表,即使它是一个完整列表的切片

>>> a = [1, 2, 3]
>>> b = a[:]
>>> b[1] = 10
>>> print(a)
[1, 2, 3]
>>> print(b)
[1, 10, 3]

获取切片 [:] 会创建一个列表的新副本。但是,它只复制外部列表。内部的任何子列表仍然是对原始列表中子列表的引用。因此,当列表包含列表时,内部列表也必须被复制。您可以手动执行此操作,但 Python 已经包含一个模块来执行此操作。您可以使用 copy 模块的 deepcopy 函数

>>> import copy
>>> a = [[1, 2, 3], [4, 5, 6]]
>>> b = a[:]
>>> c = copy.deepcopy(a)
>>> b[0][1] = 10
>>> c[1][1] = 12
>>> print(a)
[[1, 10, 3], [4, 5, 6]]
>>> print(b)
[[1, 10, 3], [4, 5, 6]]
>>> print(c)
[[1, 2, 3], [4, 12, 6]]

首先请注意,a 是一个列表的列表。然后请注意,当执行 b[0][1] = 10 时,ab 都被更改,但 c 没有被更改。发生这种情况是因为当使用切片运算符时,内部数组仍然是引用。但是,使用 deepcopyc 被完全复制。

那么,我是否应该在每次使用函数或 = 时都担心引用?好消息是,您只需要在使用字典和列表时才担心引用。数字和字符串在赋值时创建引用,但对数字和字符串的每个修改操作都会创建一个新副本,因此您永远不会意外地修改它们。在修改列表或字典时,您确实需要考虑引用。

到目前为止,您可能想知道为什么在所有情况下都要使用引用?基本原因是速度。创建对包含一千个元素的列表的引用比复制所有元素要快得多。另一个原因是它允许您有一个函数来修改输入的列表或字典。只要记住关于引用,如果您遇到数据在不应该更改时被更改的奇怪问题。


非程序员的 Python 3 教程
 ← 使用模块 更多关于列表 字符串的复仇 → 
华夏公益教科书