Python3 数据结构

本章节我们主要结合前面所学的知识点来介绍 Python 数据结构。


列表

Python 中列表是可变的,这是它区别于字符串和元组的最重要的特点,一句话概括即:列表可以修改,而字符串和元组不能修改。

以下是 Python 中列表的方法:

方法 描述
list.append(x) 把一个元素添加到列表的结尾,相当于 a[len(a):] = [x]。
list.extend(L) 通过添加指定列表的所有元素来扩充列表,相当于 a[len(a):] = L。
list.insert(i, x) 在指定位置插入一个元素。第一个参数是准备插入到其前面的那个元素的索引,例如 a.insert(0, x) 会插入到整个列表之前,而 a.insert(len(a), x) 相当于 a.append(x) 。
list.remove(x) 删除列表中值为 x 的第一个元素。如果没有这样的元素,就会返回一个错误。
list.pop([i]) 从列表的指定位置删除元素,并将其返回。如果没有指定索引,a.pop()返回最后一个元素。元素随即从列表中被删除。(方法中 i 两边的方括号表示这个参数是可选的,而不是要求你输入一对方括号,你会经常在 Python 库参考手册中遇到这样的标记。)
list.clear() 移除列表中的所有项,等于del a[:]。
list.index(x) 返回列表中第一个值为 x 的元素的索引。如果没有匹配的元素就会返回一个错误。
list.count(x) 返回 x 在列表中出现的次数。
list.sort() 对列表中的元素进行排序。
list.reverse() 倒排列表中的元素。
list.copy() 返回列表的浅复制,等于a[:]。

下面示例演示了列表的大部分方法:

  1. >>> a = [66.25, 333, 333, 1, 1234.5]
  2. >>> print(a.count(333), a.count(66.25), a.count('x'))
  3. 2 1 0
  4. >>> a.insert(2, -1)
  5. >>> a.append(333)
  6. >>> a
  7. [66.25, 333, -1, 333, 1, 1234.5, 333]
  8. >>> a.index(333)
  9. 1
  10. >>> a.remove(333)
  11. >>> a
  12. [66.25, -1, 333, 1, 1234.5, 333]
  13. >>> a.reverse()
  14. >>> a
  15. [333, 1234.5, 1, 333, -1, 66.25]
  16. >>> a.sort()
  17. >>> a
  18. [-1, 1, 66.25, 333, 333, 1234.5]

注意:类似 insert, remove 或 sort 等修改列表的方法没有返回值。


将列表当做堆栈使用

列表的方法使得列表可以很方便的作为一个堆栈来使用,堆栈作为特定的数据结构,最先进入的元素会最后一个被释放(后进先出)。用 append() 方法可以把一个元素添加到堆栈顶。用不指定索引的 pop() 方法可以把一个元素从堆栈顶释放出来。例如:

  1. >>> stack = [3, 4, 5]
  2. >>> stack.append(6)
  3. >>> stack.append(7)
  4. >>> stack
  5. [3, 4, 5, 6, 7]
  6. >>> stack.pop()
  7. 7
  8. >>> stack
  9. [3, 4, 5, 6]
  10. >>> stack.pop()
  11. 6
  12. >>> stack.pop()
  13. 5
  14. >>> stack
  15. [3, 4]

将列表当作队列使用

也可以把列表当做队列用,在队列里第一个位置加入的元素,第一个取出来;但是拿列表用作队列效率不高。在列表的最后添加或者弹出元素速度快,然而在列表里插入或者从头部弹出速度却不快(因为所有其他的元素都得一个一个地移动)。

  1. >>> from collections import deque
  2. >>> queue = deque(["Eric", "John", "Michael"])
  3. >>> queue.append("Terry") # Terry arrives
  4. >>> queue.append("Graham") # Graham arrives
  5. >>> queue.popleft() # The first to arrive now leaves
  6. 'Eric'
  7. >>> queue.popleft() # The second to arrive now leaves
  8. 'John'
  9. >>> queue # Remaining queue in order of arrival
  10. deque(['Michael', 'Terry', 'Graham'])

列表推导式

列表推导式提供了从序列创建列表的简单途径。通常应用程序将一些操作应用于某个序列的每个元素,用其获得的结果作为生成新列表的元素,或者根据确定的判定条件创建子序列。

每个列表推导式都在 for 之后跟一个表达式,然后有零到多个 for 或 if 子句。返回结果是一个根据表达从其后的 for 和 if 上下文环境中生成出来的列表。如果希望表达式推导出一个元组,就必须使用括号。

这里我们将列表中每个数值乘三,获得一个新的列表:

  1. >>> vec = [2, 4, 6]
  2. >>> [3*x for x in vec]
  3. [6, 12, 18]

现在我们玩一点小花样:

  1. >>> [[x, x**2] for x in vec]
  2. [[2, 4], [4, 16], [6, 36]]

这里我们对序列里每一个元素逐个调用某方法:

  1. >>> freshfruit = [' banana', ' loganberry ', 'passion fruit ']
  2. >>> [weapon.strip() for weapon in freshfruit]
  3. ['banana', 'loganberry', 'passion fruit']

我们可以用 if 子句作为过滤器:

  1. >>> [3*x for x in vec if x > 3]
  2. [12, 18]
  3. >>> [3*x for x in vec if x < 2] []

以下是一些关于循环和其它技巧的演示:

  1. >>> vec1 = [2, 4, 6]
  2. >>> vec2 = [4, 3, -9]
  3. >>> [x*y for x in vec1 for y in vec2]
  4. [8, 6, -18, 16, 12, -36, 24, 18, -54]
  5. >>> [x+y for x in vec1 for y in vec2]
  6. [6, 5, -7, 8, 7, -5, 10, 9, -3]
  7. >>> [vec1[i]*vec2[i] for i in range(len(vec1))]
  8. [8, 12, -54]

列表推导式可以使用复杂表达式或嵌套函数:

  1. >>> [str(round(355/113, i)) for i in range(1, 6)]
  2. ['3.1', '3.14', '3.142', '3.1416', '3.14159']

嵌套列表解析

Python 的列表还可以嵌套。

以下实例展示了 3 * 4 的矩阵列表:

  1. >>> matrix = [
  2. ... [1, 2, 3, 4],
  3. ... [5, 6, 7, 8],
  4. ... [9, 10, 11, 12],
  5. ... ]

以下实例将 3 4 的矩阵列表转换为 4 3 列表:

  1. >>> [[row[i] for row in matrix] for i in range(4)]
  2. [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

以下实例也可以使用以下方法来实现:

  1. >>> transposed = []
  2. >>> for i in range(4):
  3. ... transposed.append([row[i] for row in matrix])
  4. ...
  5. >>> transposed
  6. [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

另外一种实现方法:

  1. >>> transposed = []
  2. >>> for i in range(4):
  3. ... # the following 3 lines implement the nested listcomp
  4. ... transposed_row = []
  5. ... for row in matrix:
  6. ... transposed_row.append(row[i])
  7. ... transposed.append(transposed_row)
  8. ...
  9. >>> transposed
  10. [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

del 语句

使用 del 语句可以从一个列表中依索引而不是值来删除一个元素。这与使用 pop() 返回一个值不同。可以用 del 语句从列表中删除一个切割,或清空整个列表(我们以前介绍的方法是给该切割赋一个空列表)。例如:

  1. >>> a = [-1, 1, 66.25, 333, 333, 1234.5]
  2. >>> del a[0]
  3. >>> a
  4. [1, 66.25, 333, 333, 1234.5]
  5. >>> del a[2:4]
  6. >>> a
  7. [1, 66.25, 1234.5]
  8. >>> del a[:]
  9. >>> a
  10. []

也可以用 del 删除实体变量:

  1. >>> del a

元组和序列

元组由若干逗号分隔的值组成,例如:

  1. >>> t = 12345, 54321, 'hello!'
  2. >>> t[0]
  3. 12345
  4. >>> t
  5. (12345, 54321, 'hello!')
  6. >>> # Tuples may be nested:
  7. ... u = t, (1, 2, 3, 4, 5)
  8. >>> u
  9. ((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))

如你所见,元组在输出时总是有括号的,以便于正确表达嵌套结构。在输入时可能有或没有括号, 不过括号通常是必须的(如果元组是更大的表达式的一部分)。


集合

集合是一个无序不重复元素的集。基本功能包括关系测试和消除重复元素。

可以用大括号 ({}) 创建集合。注意:如果要创建一个空集合,你必须用 set() 而不是 {} ;后者创建一个空的字典,下一节我们会介绍这个数据结构。

以下是一个简单的演示:

  1. >>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
  2. >>> print(basket) # show that duplicates have been removed
  3. {'orange', 'banana', 'pear', 'apple'}
  4. >>> 'orange' in basket # fast membership testing
  5. True
  6. >>> 'crabgrass' in basket
  7. False
  8. >>> # Demonstrate set operations on unique letters from two words
  9. ...
  10. >>> a = set('abracadabra')
  11. >>> b = set('alacazam')
  12. >>> a # unique letters in a
  13. {'a', 'r', 'b', 'c', 'd'}
  14. >>> a - b # letters in a but not in b
  15. {'r', 'd', 'b'}
  16. >>> a | b # letters in either a or b
  17. {'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
  18. >>> a & b # letters in both a and b
  19. {'a', 'c'}
  20. >>> a ^ b # letters in a or b but not both
  21. {'r', 'd', 'b', 'm', 'z', 'l'}>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
  22. >>> print(basket) # show that duplicates have been removed
  23. {'orange', 'banana', 'pear', 'apple'}
  24. >>> 'orange' in basket # fast membership testing
  25. True
  26. >>> 'crabgrass' in basket
  27. False

集合也支持推导式:

  1. >>> a = {x for x in 'abracadabra' if x not in 'abc'}
  2. >>> a
  3. {'r', 'd'}

字典

另一个非常有用的 Python 内建数据类型是字典。

序列是以连续的整数为索引,与此不同的是,字典以关键字为索引,关键字可以是任意不可变类型,通常用字符串或数值。

理解字典的最佳方式是把它看做无序的键 => 值对集合。在同一个字典之内,关键字必须是互不相同。

一对大括号创建一个空的字典:{}。

这是一个字典运用的简单例子:

  1. >>> tel = {'jack': 4098, 'sape': 4139}
  2. >>> tel['guido'] = 4127
  3. >>> tel
  4. {'sape': 4139, 'guido': 4127, 'jack': 4098}
  5. >>> tel['jack']
  6. 4098
  7. >>> del tel['sape']
  8. >>> tel['irv'] = 4127
  9. >>> tel
  10. {'guido': 4127, 'irv': 4127, 'jack': 4098}
  11. >>> list(tel.keys())
  12. ['irv', 'guido', 'jack']
  13. >>> sorted(tel.keys())
  14. ['guido', 'irv', 'jack']
  15. >>> 'guido' in tel
  16. True
  17. >>> 'jack' not in tel
  18. False

构造函数 dict() 直接从键值对元组列表中构建字典。如果有固定的模式,列表推导式指定特定的键值对:

  1. >>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
  2. {'sape': 4139, 'jack': 4098, 'guido': 4127}

此外,字典推导可以用来创建任意键和值的表达式词典:

  1. >>> {x: x**2 for x in (2, 4, 6)}
  2. {2: 4, 4: 16, 6: 36}

如果关键字只是简单的字符串,使用关键字参数指定键值对有时候更方便:

  1. >>> dict(sape=4139, guido=4127, jack=4098)
  2. {'sape': 4139, 'jack': 4098, 'guido': 4127}

遍历技巧

在字典中遍历时,关键字和对应的值可以使用 items() 方法同时解读出来:

  1. >>> knights = {'gallahad': 'the pure', 'robin': 'the brave'}
  2. >>> for k, v in knights.items():
  3. ... print(k, v)
  4. ...
  5. gallahad the pure
  6. robin the brave

在序列中遍历时,索引位置和对应值可以使用 enumerate() 函数同时得到:

  1. >>> for i, v in enumerate(['tic', 'tac', 'toe']):
  2. ... print(i, v)
  3. ...
  4. 0 tic
  5. 1 tac
  6. 2 toe

同时遍历两个或更多的序列,可以使用 zip() 组合:

  1. >>> questions = ['name', 'quest', 'favorite color']
  2. >>> answers = ['lancelot', 'the holy grail', 'blue']
  3. >>> for q, a in zip(questions, answers):
  4. ... print('What is your {0}? It is {1}.'.format(q, a))
  5. ...
  6. What is your name? It is lancelot.
  7. What is your quest? It is the holy grail.
  8. What is your favorite color? It is blue.

要反向遍历一个序列,首先指定这个序列,然后调用 reversesd() 函数:

  1. >>> for i in reversed(range(1, 10, 2)):
  2. ... print(i)
  3. ...
  4. 9
  5. 7
  6. 5
  7. 3
  8. 1

要按顺序遍历一个序列,使用 sorted() 函数返回一个已排序的序列,并不修改原值:

  1. >>> basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
  2. >>> for f in sorted(set(basket)):
  3. ... print(f)
  4. ...
  5. apple
  6. banana
  7. orange
  8. pear

其他参阅文档(Python2.x)