关于Python整数比较的一些坑:
Python中一切都是对象,对象比较可以用 == 或者 is。
== 比较的是两个对象的内容是否相等,默认会调用对象的 __eq__() 方法。
is 比较的是两个对象的 id 是否相等,也就是是否是同一个对象,是否指向同一个内存地址。
>>> a =4
>>> b =4
>>> a == b
True
>>> a is b
True
>>> a =256
>>> b =256
>>> a == b
True
>>> a is b
True
>>> a =257
>>> b =257
>>> a == b
True
>>> a is b
False
我们看到,前几组比较我们都可以理解显示的结果,但是最后当 a/b 都指向 257 这个整数对象的时候,用 is 比较以后的结果是 False。
这是因为 Python 处于对性能的考虑,内部作了优化,对于整数对象,把一些频繁使用的整数对象缓存起来,保存到一个叫 small_ints 的链表中。
在 Python 整个生命周期中,任何需要引用这些整数对象的地方,都不再重新创建新的整数对象,范围是 [-5,256]。
再看下面这个例子 :
>>> a =259
>>>def foo ():
... b =259
... c =259
... print(a is b)
... print(b is c)
...
>>> foo()
False
True
这是因为 Python 程序都是由代码块构成,代码块作为程序的一个最小基本单位来执行。一个模块文件/一个函数体/一个类/交互式命令中的单行代码都叫做一个代码块。
上面的程序中有两部分代码块,一个是名称 a 所在的代码块,一个是名称 b/c 所在的代码块。Python 的另一个优化的地方就是,如果在同一个代码块中创建的两个整数对象中,它们的值相等的话,那么这两个对象引用同一个整数对象。所以Python出于对性能的考虑,但凡是不可变的对象,在同一代码块中,只有值相等的对象就不会重复创建,而是直接引用已经存在的对象。不仅整数对象,字符串对象也遵循同样的原则。