Python学习:列表和元组用哪一个?

news/2024/7/24 5:50:09 标签: python, 列表, 元组

对于每一门编程语言来说,数据结构都是其根基。Python 中最常见的两种数据结构:列表(list)和元组(tuple)。学习的知识来自景霄老师。

一、列表元组基础

实际上,列表元组,都是一个可以放置任意数据类型的有序集合
在绝大多数编程语言中,集合的数据类型必须一致。不过,对于 Python 的列表元组来说,并无此要求:(我认为这是Python相对厉害的地方)

python">l = [1, 2, 'hello', 'world'] # 列表中同时含有 int 和 string 类型的元素
python">[1, 2, 'hello', 'world']
python">tup = ('jason', 22) # 元组中同时含有 int 和 string 类型的元素
python">('jason', 22)

区别:

  1. 列表是动态的,长度大小不固定,可以随意地增加、删减或者改变元素(mutable)。
  2. 元组是静态的,长度大小固定,无法增加删减或者改变(immutable)。

下面的例子中,分别创建了一个列表元组。可以看到,对于列表,可以很轻松地让其最后一个元素,由 4 变为 40;但是,如果对元组采取相同的操作,Python 就会报错,原因就是元组是不可变的。

python">l = [1, 2, 3, 4]
l[3] = 40 # 和很多语言类似,python 中索引同样从 0 开始,l[3] 表示访问列表的第四个元素
python">[1, 2, 3, 40]
python">tup = (1, 2, 3, 4)
tup[3] = 40
python">Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment

如果想对已有元组进行改变,只能重新开辟一块内存,创建新的元组了。
比如下面的例子,想增加一个元素 5 给元组,实际上就是创建了一个新的元组,然后把原来两个元组的值依次填充进去。

python">tup = (1, 2, 3, 4)
new_tup = tup + (5, ) # 创建新的元组 new_tup,并依次填充原元组的值
python">(1, 2, 3, 4, 5)

而对于列表来说,由于其是动态的,只需简单地在列表末尾,加入对应元素就可以了。如下操作后,会修改原来列表中的元素,而不会创建新的列表

python">l = [1, 2, 3, 4]
l.append(5) # 添加元素 5 到原列表的末尾
python">[1, 2, 3, 4, 5]

接下来看一些列表元组的基本操作和注意事项。
首先,和其他语言不同,Python 中的列表元组都支持负数索引,-1 表示最后一个元素,-2 表示倒数第二个元素,以此类推。

python">l = [1, 2, 3, 4]
l[-1]
4
python">tup = (1, 2, 3, 4)
tup[-1]
4

除了基本的初始化,索引外,列表元组都支持切片操作

python">l = [1, 2, 3, 4]
l[1:3] # 返回列表中索引从 1 到 2 的子列表
[2, 3] 

tup = (1, 2, 3, 4)
tup[1:3] # 返回元组中索引从 1 到 2 的子元组
(2, 3) 

列表元组都可以随意嵌套

python">l = [[1, 2, 3], [4, 5]] # 列表的每一个元素也是一个列表

tup = ((1, 2, 3), (4, 5, 6)) # 元组的每一个元素也是一元组

两者也可以通过 list() 和 tuple() 函数相互转换:

python">list((1, 2, 3))
[1, 2, 3]

tuple([1, 2, 3])
(1, 2, 3)

一些列表元组常用的内置函数:

python">l = [3, 2, 3, 7, 8, 1]
l.count(3) 
2
l.index(7)
3
l.reverse()
l
[1, 8, 7, 3, 2, 3]
l.sort()
l
[1, 2, 3, 3, 7, 8] 

tup = (3, 2, 3, 7, 8, 1)
tup.count(3)
2
tup.index(7)
3
list(reversed(tup))
[1, 8, 7, 3, 2, 3]
sorted(tup)
[1, 2, 3, 3, 7, 8]

注:在创建空list的时候有两种方法:效率上有什么区别

python"># 创建空列表
# option A
empty_list = list()

# option B
empty_list = []

区别主要在于list()是一个function call,Python的function call会创建stack,并且进行一系列参数检查的操作,比较expensive,反观[]是一个内置的C函数,可以直接被调用,因此效率高

二、列表元组存储的差异

列表元组最重要的区别就是,列表是动态的、可变的,而元组是静态的、不可变的。这样的差异,势必会影响两者存储方式。

python">l = [1, 2, 3]
l.__sizeof__()
64

tup = (1, 2, 3)
tup.__sizeof__()
48

相同元素,但元组的存储空间比列表少16字节。
事实上,由于列表是动态的,所以它需要存储指针,来指向对应的元素(上述例子中,对于 int 型,8 字节)。另外,由于列表可变,所以需要额外存储已经分配的长度大小(8 字节),这样才可以实时追踪列表空间的使用情况,当空间不足时,及时分配额外空间。

python">l = []
l.__sizeof__() //列表的存储空间为 40 字节
40
l.append(1)
l.__sizeof__() 
72 // 加入了元素 1 之后,列表为其分配了可以存储 4 个元素的空间 (72 - 40)/8 = 4
l.append(2) 
l.__sizeof__()
72 // 由于之前分配了空间,所以加入元素 2列表空间不变
l.append(3)
l.__sizeof__() 
72 // 同上
l.append(4)
l.__sizeof__() 
72 // 同上
l.append(5)
l.__sizeof__() 
104 // 加入元素 5 之后,列表的空间不足,所以又额外分配了可以存储 4 个元素的空间

上面的例子,大概描述了列表空间分配的过程。我们可以看到,为了减小每次增加 / 删减操作时空间分配的开销,Python 每次分配空间时都会额外多分配一些,这样的机制(over-allocating)保证了其操作的高效性:增加 / 删除的时间复杂度均为 O(1)。

但是对于元组,情况就不同了。元组长度大小固定,元素不可变,所以存储空间固定。

list和tuple的内部实现都是array的形式,list因为可变,所以是一个over-allocate的array,tuple因为不可变,所以长度大小固定。

三、列表元组的性能

通过学习列表元组存储方式的差异,我们可以得出结论:元组要比列表更加轻量级一些,所以总体上来说,元组的性能速度要略优于列表

另外,Python 会在后台,对静态数据做一些资源缓存(resource caching)。通常来说,因为垃圾回收机制的存在,如果一些变量不被使用了,Python 就会回收它们所占用的内存,返还给操作系统,以便其他变量或其他应用使用。

但是对于一些静态变量,比如元组,如果它不被使用并且占用空间不大时,Python 会暂时缓存这部分内存。这样,下次我们再创建同样大小的元组时,Python 就可以不用再向操作系统发出请求,去寻找内存,而是可以直接分配之前缓存的内存空间,这样就能大大加快程序的运行速度。

下面的例子,是计算初始化一个相同元素的列表元组分别所需的时间。我们可以看到,元组的初始化速度,要比列表快 5 倍。

python">python3 -m timeit 'x=(1,2,3,4,5,6)'
20000000 loops, best of 5: 9.97 nsec per loop
python3 -m timeit 'x=[1,2,3,4,5,6]'
5000000 loops, best of 5: 50.1 nsec per loop

但如果是索引操作的话,两者的速度差别非常小,几乎可以忽略不计。

python">python3 -m timeit -s 'x=[1,2,3,4,5,6]' 'y=x[3]'
10000000 loops, best of 5: 22.2 nsec per loop
python3 -m timeit -s 'x=(1,2,3,4,5,6)' 'y=x[3]'
10000000 loops, best of 5: 21.9 nsec per loop

如果想要增加、删减或者改变元素,那么列表显然更优。原因就是对于元组,必须得通过新建一个元组来完成。

四、列表元组的使用场景

列表元组到底用哪一个呢?根据上面所说的特性,具体情况具体分析。

  1. 如果存储的数据和数量不变,比如你有一个函数,需要返回的是一个地点的经纬度,然后直接传给前端渲染,那么肯定选用元组更合适。
python">def get_location():
    ..... 
    return (longitude, latitude)
  1. 如果存储的数据或数量是可变的,比如社交平台上的一个日志功能,是统计一个用户在一周之内看了哪些用户的帖子,那么则用列表更合适。
python">viewer_owner_id_list = [] # 里面的每个元素记录了这个 viewer 一周内看过的所有 owner 的 id
records = queryDB(viewer_id) # 索引数据库,拿到某个 viewer 一周内的日志
for record in records:
    viewer_owner_id_list.append(record.id)

拓展

列表元组的内部实现 :关于这个问题,我们可以分别从源码来看。

先来看 Python 3.7 的 list 源码。你可以先自己阅读下面两个链接里的内容。

listobject.h:https://github.com/python/cpython/blob/949fe976d5c62ae63ed505ecf729f815d0baccfc/Include/listobject.h#L23

listobject.c:https://github.com/python/cpython/blob/3d75bd15ac82575967db367c517d7e6e703a6de3/Objects/listobject.c#L33

list 的具体结构放在了下面:
在这里插入图片描述
可以看到,list 本质上是一个 over-allocate 的 array。其中,ob_item 是一个指针列表,里面的每一个指针都指向列表的元素。而 allocated 则存储了这个列表已经被分配的空间大小。

需要注意的是,allocated 与列表实际空间大小的区别。列表实际空间大小,是指 len(list) 返回的结果,即上述代码注释中的 ob_size,表示这个列表总共存储了多少个元素。实际情况下,为了优化存储结构,避免每次增加元素都要重新分配内存,列表预分配的空间 allocated 往往会大于 ob_size(详见正文中的例子)。

所以,它们的关系为:allocated >= len(list) = ob_size

如果当前列表分配的空间已满(即 allocated == len(list)),则会向系统请求更大的内存空间,并把原来的元素全部拷贝过去。列表每次分配空间的大小,遵循下面的模式:

python">0, 4, 8, 16, 25, 35, 46, 58, 72, 88, ...

再来分析元组。下面是 Python 3.7 的 tuple 源码,同样的,你可以先自己阅读一下。
tupleobject.h:https://github.com/python/cpython/blob/3d75bd15ac82575967db367c517d7e6e703a6de3/Include/tupleobject.h#L25

tupleobject.c:https://github.com/python/cpython/blob/3d75bd15ac82575967db367c517d7e6e703a6de3/Objects/tupleobject.c#L16

同样的,下面为 tuple 的具体结构:
在这里插入图片描述可以看到,它和 list 相似,本质也是一个 array,但是空间大小固定。不同于一般 array,Python 的 tuple 做了许多优化,来提升在程序中的效率。

举个例子,当 tuple 的大小不超过 20 时,Python 就会把它缓存在内部的一个 free list 中。这样,如果你以后需要再去创建同样的 tuple,Python 就可以直接从缓存中载入,提高了程序运行效率。

总结:

总的来说,列表元组都是有序的,可以存储任意数据类型的集合,区别主要在于下面这两点。

  1. 列表是动态的,长度可变,可以随意的增加、删减或改变元素。列表的存储空间略大于元组,性能略逊于元组
  2. 元组是静态的,长度大小固定,不可以对元素进行增加、删减或者改变操作。元组相对于列表更加轻量级,性能稍优

参考:
《Python核心技术与实践》


http://www.niftyadmin.cn/n/1728094.html

相关文章

echarts柱状图案列及效果

下面echarts 柱状图 首先效果图 下面开始堆代码 1、先看一下vue中html <template><view class"content"><!-- 标题描述 - 标题总数显示 --><view class"describe"><view class"describeL"><view class&quo…

Python学习:字典和集合,真的了解吗?

Python除了列表和元组还有两个很常见并且很有用的数据结构&#xff1a;字典&#xff08;dict&#xff09;和集合&#xff08;set&#xff09;。字典和集合在 Python 被广泛使用&#xff0c;并且性能进行了高度优化&#xff0c;故是非常重要的。 注&#xff1a;笔记来源于景霄老…

echarts父组件向子组件传值报错

对于echarts 一直都是云里雾里 开发时候碰到一个问题一直在那儿倒腾&#xff0c;最后九牛二虎再加外圈刮&#xff0c;摸索出来了 先上图看报错 好家伙 本以为一切都好了 没想到控制台报错了。对于这个错一直蒙状态 审视代码于是发现是数据问题&#xff0c;查阅了官网及各种…

Python学习:字符串的深入浅出

字符串是python很常见的一种数据类型&#xff0c;比如日志的打印&#xff0c;程序中函数的注释&#xff0c;数据库的访问&#xff0c;变量的操作都需要用到字符串。 一、字符串基础 字符串是由独立字符组成的一个序列&#xff0c;通常包含在单引号&#xff08;’’&#xff0…

echarts对Y轴坐标控制

echarts自定义y轴刻度信息 <!DOCTYPE html> <html> <head><meta charset"utf-8"><title>ECharts</title><!-- 引入 echarts.js --><script src"echarts.common.min.js"></script> </head> &…

Python学习:输入输出--”黑箱“

本博客记录的是对Python输入输出的一个简单学习。 一、输入输出基础 最简单直接的输入来自键盘操作&#xff0c;如下&#xff1a; name input(your name:) gender input(you are a boy?(y/n))###### 输入 ###### your name:zhu you are a boy?ywelcome_str Welcome to …

uni-app原生导航栏自定义图标及去掉图标

uni-app自定义原生导航栏 下面是部分代码并不是完整的,这里只用作引子 { //人员对比详情"path": "personnel-panorama-contrast/index","style": {"navigationBarTitleText": "人员对比详情","app-plus": {&qu…

MySQL学习:事务的隔离

简单来说&#xff0c;事务就是要保证一组数据库操作&#xff0c;要么全部成功&#xff0c;要么全部失败。在 MySQL 中&#xff0c;事务支持是在引擎层实现的。MySQL 是一个支持多引擎的系统&#xff0c;但并不是所有的引擎都支持事务。比如 MySQL 原生的 MyISAM 引擎就不支持事…