您现在的位置是：首页 > 后端

当前栏目

程序员老司机们都要错的Python陷阱与缺陷列表

Python 列表程序员缺陷陷阱司机

2023-09-27 14:28:00 时间

程序员老司机都要错的Python陷阱与缺陷列表

我个人对陷阱的定义是这样的：代码看起来可以工作，但不是以你“想当然“”的方式。如果一段代码直接出错，抛出了异常，我不认为这是陷阱。比如，Python程序员应该都遇到过的“UnboundLocalError”, 示例：

a=1 def func(): ... a+=1 ... print a func() Traceback (most recent call last): File " stdin ", line 1, in module File " stdin ", line 2, in func UnboundLocalError: local variable a referenced before assignment

对于“UnboundLocalError”,还有更高级的版本：

import random def func(ok): if ok: a = random.random() else: import random a = random.randint(1, 10) return a func(True)# UnboundLocalError: local variable random referenced before assignment

可能对于很多python新手来说，这个Error让人摸不着头脑。但我认为这不算陷阱，因为这段代码一定会报错，而不是默默的以错误的方式运行。不怕真小人，就怕伪君子。我认为缺陷就好比伪君子。

那么Python中哪些真正算得上陷阱呢?

第一：以mutable对象作为默认参数

这个估计是最广为人知的了，Python和其他很多语言一样，提供了默认参数，默认参数确实是个好东西，可以让函数调用者忽略一些细节(比如GUI编程，Tkinter，QT)，对于lambda表达式也非常有用。但是如果使用了可变对象作为默认参数，那么事情就不那么愉快了。

def f(lst = []): ... lst.append(1) ... return lst f() f() [1, 1]

惊喜不惊喜?!究其原因，python中一切都是对象，函数也不列外，默认参数只是函数的一个属性。而默认参数在函数定义的时候已经求值了。

Default parameter values are evaluated when the function definition is executed.

stackoverflow上有一个更适当的例子来说明默认参数是在定义的时候求值，而不是调用的时候。

import time def report(when=time.time()): ... return when report() 1500113234.487932 report() 1500113234.487932

python docoment 给出了标准的解决办法：

A way around this is to use None as the default, and explicitly test for it in the body of the function

def report(when=None): ... if when is None: ... when = time.time() ... return when report() 1500113446.746997 report() 1500113448.552873

第二: x += y vs x = x + y

一般来说，二者是等价的，至少看起来是等价的(这也是陷阱的定义 — 看起来都OK，但不一定正确)。

x=1;x += 1;print x x=1;x = x+1;print x x=[1];x+=[2];print x [1, 2] x=[1];x=x+[2];print x [1, 2]

呃，被光速打脸了?

x=[1];print id(x);x=x+[2];print id(x) 4357132800 4357132728 x=[1];print id(x);x+=[2];print id(x) 4357132800 4357132800

前者x指向一个新的对象，后者x在原来的对象是修改，当然，那种效果是正确的取决于应用场景。至少，得知道，二者有时候并不一样

第三，神奇的小括号–()

小括号(parenthese)在各种编程语言中都有广泛的应用，python中，小括号还能表示元组(tuple)这一数据类型, 元组是immutable的序列。

a = (1, 2) type(a) type tuple type(()) type tuple

但如果只有一个元素呢

a=(1) type(a) type int

神奇不神奇，如果要表示只有一个元素的元组，正确的姿势是:

a=(1,) type(a) type tuple

第四：生成一个元素是列表的列表

这个有点像二维数组，当然生成一个元素是字典的列表也是可以的，更通俗的说，生成一个元素是可变对象的序列

很简单嘛：

a= [[]] * 10 [[], [], [], [], [], [], [], [], [], []] a[0].append(10) a[0] [10]

看起来很不错，简单明了，but

a[1] [10] [[10], [10], [10], [10], [10], [10], [10], [10], [10], [10]]

我猜，这应该不是你预期的结果吧，究其原因，还是因为python中list是可变对象，上述的写法大家都指向的同一个可变对象，正确的姿势

a = [[] for _ in xrange(10)] a[0].append(10) [[10], [], [], [], [], [], [], [], [], []]

第五，在访问列表的时候，修改列表

列表(list)在python中使用非常广泛，当然经常会在访问列表的时候增加或者删除一些元素。比如，下面这个函数，试图删掉列表中为3的倍数的元素：

def modify_lst(lst): ... for idx, elem in enumerate(lst): ... if elem % 3 == 0: ... del lst[idx]

测试一下，

lst = [1,2,3,4,5,6] modify_lst(lst) lst [1, 2, 4, 5]

好像没什么错，不过这只是运气好

lst = [1,2,3,6,5,4] modify_lst(lst) lst [1, 2, 6, 5, 4]

上面的例子中，6这个元素就没有被删除。如果在modify_lst函数中print idx， item就可以发现端倪：lst在变短，但idx是递增的，所以在上面出错的例子中，当3被删除之后，6变成了lst的第2个元素(从0开始)。在C++中，如果遍历容器的时候用迭代器删除元素，也会有同样的问题。

如果逻辑比较简单，使用list comprehension是不错的注意

第六，闭包与lambda

这个也是老生长谈的例子，在其他语言也有类似的情况。先看一个例子:

def create_multipliers(): ... return [lambda x:i*x for i in range(5)] for multiplier in create_multipliers(): ... print multiplier(2)

create_multipliers函数的返回值时一个列表，列表的每一个元素都是一个函数 -- 将输入参数x乘以一个倍数i的函数。预期的结果时0，2，4，6，8. 但结果是5个8，意外不意外。

由于出现这个陷阱的时候经常使用了lambda，所以可能会认为是lambda的问题，但lambda表示不愿意背这个锅。问题的本质在与python中的属性查找规则，LEGB(local，enclousing，global，bulitin)，在上面的例子中，i就是在闭包作用域(enclousing)，而Python的闭包是迟绑定，这意味着闭包中用到的变量的值，是在内部函数被调用时查询得到的。

解决办法也很简单，那就是变闭包作用域为局部作用域。

def create_multipliers(): ... return [lambda x, i = i:i*x for i in range(5)]

第七，定义__del__

大多数计算机专业的同学可能都是先学的C、C++，构造、析构函数的概念应该都非常熟。于是，当切换到python的时候，自然也想知道有没有相应的函数。比如，在C++中非常有名的RAII，即通过构造、析构来管理资源(如内存、文件描述符)的声明周期。那在python中要达到同样的效果怎么做呢，即需要找到一个对象在销毁的时候一定会调用的函数，于是发现了__init__, __del__函数，可能简单写了两个例子发现确实也能工作。但事实上可能掉进了一个陷阱，在python documnet是有描述的：

Circular references which are garbage are detected when the option cycle detector is enabled (it’s on by default), but can only be cleaned up if there are no Python-level __del__() methods involved.

简单来说，如果在循环引用中的对象定义了__del__,那么python gc不能进行回收，因此，存在内存泄漏的风险

第八，不同的姿势import同一个module

示例在stackoverflow的例子上稍作修改，假设现在有一个package叫mypackage，里面包含三个python文件：mymodule.py, main.py, __init__.py。mymodule.py代码如下：

l = [] class A(object): pass

main.py代码如下：

def add(x): from mypackage import mymodule mymodule.l.append(x) print "updated list",mymodule.l, id(mymodule) def get(): import mymodule print module in get, id(mymodule) return mymodule.l if __name__ == __main__: import sys sys.path.append(../) add(1) ret = get() print "lets check", ret

运行python main.py，结果如下：

updated list [1] 4406700752 module in get 4406700920 lets check []

从运行结果可以看到，在add 和 get函数中import的mymodule不是同一个module，ID不同。当然，在python2.7.10中，需要main.py的第13行才能出现这样的效果。你可能会问，谁会写出第13行这样的代码呢?事实上，在很多项目中，为了import的时候方便，会往sys.path加入一堆路径。那么在项目中，大家同意一种import方式就非常有必要了

第九，python升级

python3.x并不向后兼容，所以如果从2.x升级到3.x的时候得小心了，下面列举两点：

在python2.7中，range的返回值是一个列表;而在python3.x中，返回的是一个range对象。

map()、filter()、 dict.items()在python2.7返回列表，而在3.x中返回迭代器。当然迭代器大多数都是比较好的选择，更加pythonic，但是也有缺点，就是只能遍历一次。在instagram的分享中，也提到因为这个导致的一个坑爹的bug。

第十，gil

以GIL结尾，因为gil是Python中大家公认的缺陷!

从其他语言过来的同学可能看到python用threading模块，拿过来就用，结果发现效果不对啊，然后就会喷，什么鬼。

总结：

毫无疑问的说，python是非常容易上手，也非常强大的一门语言。python非常灵活，可定制化很强。同时，也存在一些陷阱，搞清楚这些陷阱能够更好的掌握、使用这么语言。本文列举了一些python中的一些缺陷，这是一份不完全列表，欢迎大家补充。

本文作者：xybaby

来源：51CTO

python编译&反编译，你不知道的心机与陷阱谈到python的文件后缀，说眼花缭乱也不为过.来看看你遇到过哪些类型！如果这个不知道，呵呵...那请出门左拐，你还是充钱那个少年，没有一丝丝改变。接着打游戏去吧... 这个后缀应该算是除了python的py代码外，遇到最多的一种文件类型了。虽然python被普遍认为是一种解释性语言，但谁说它就不能被编译后执行呢？python通过compile生成的pyc文件，然后由python的虚拟机执行。相对于py文件来说，编译成pyc本质上和py没有太大区别，只是对于这个模块的加载速度提高了，并没有提高代码的执行速度，通常情况下不用主动去编译pyc文件。那pyc文件存在的意义在哪里？
当心Python函数可变默认参数（list,set,dict…)的陷阱绝大多数情况下，Python是一个干净具有一致性的语言。然而，有些少数情况会让初学者感到困惑。其中有些情况是有意识的但会成为潜在的莫名其妙，而有些可以说是语言赘肉。下面我们看看使用可变默认参数（Mutable default arguments）时会出现什么莫名其妙的状况。
python的socket.recv函数陷阱一个粘包实验解决和总结惯例练习历史实验，在编写tcp数据流粘包实验的时候，发现一个奇怪的现象。当远程执行的命令返回结果很短的时候可以正常执行，但返回结果很长时，就会发生json解码错误，故将排错和解决方法记录下来。
基于python从redmine-api中获取项目缺陷数据并可视化（2）上一篇文章讲到缺陷数据的获取实现方式，这篇文章主要讲讲如何通过web框架flask将获取到的数据进行web数据可视化 1.调研python web框架一开始想通过html＋js＋highcharts去实现数据可视化，但是实现起来不方便而且本人js及前端开发了解甚少，所以还是借助web框架。
基于python从redmine-api中获取项目缺陷数据（1） 1.引言本文主要内容是将如何利用 Python 对 Redmine缺陷进行缺陷数据获取操作。目前统计缺陷数据时基本是根据项目手动去redmine获取缺陷数据，至少要花费一个工作日去完成,目前的目标是通过python脚本通过 Redmine-API快速去获取各个维度的缺陷数据

猜你喜欢

促进形成各方联动的大数据发展格局
《Oracle高性能自动化运维》一一第3章 Oracle重做日志（Redo）
Twitter OA prepare: Rational Sum
Docker启动与帮助相关命令
人们对WiFi的需求与日俱增却忽视了安全
（JAVA）:字符串的拼接插入-----StringBuffer类的常见API
MyBatis Mapper 接口如何通过JDK动态代理来包装SqlSession 源码分析
WMI
go time包详解
深入理解Spark：核心思想与源码分析. 3.10　创建和启动ExecutorAllocationManager
ReactHooks之父子组件传值优化
[leetcode]Path Sum II
Android Studio ndk-Jni开发详细

相关主题

Python常用库
Python异常
python中的列表
Python-Python入门
Python 列表(List)
python模块导入
python转pyd
正则表达式python
python-列表
Python种的闭包
python二级

zl程序教程

当前栏目

程序员老司机们都要错的Python陷阱与缺陷列表

相关文章