在面向对象的理论中,有两个核心的概念:类和实例。类可以看成是一个模板,实例就是根据这个模板创建出来的对象。但在 Python 里面,类和实例都是对象,也就是所谓的类对象(或者类型对象)和实例对象。
为了避免后续出现歧义,我们这里把对象分为三种:
- 内置类对象:比如 int、str、list、type、object 等等;
- 自定义类对象:通过 class 关键字定义的类,当然我们也会把它和上面的内置类对象统称为类对象(或者类型对象);
- 实例对象:由类对象(内置类对象或自定义类对象)创建的实例;
而对象之间存在以下两种关系:
- is-kind-of:对应面向对象理论中子类和父类之间的关系;
- is-instance-of:对应面向对象理论中实例对象和类对象之间的关系;
我们举例说明:
class Girl(object): def say(self): return "古明地觉" girl = Girl() print(girl.say()) # 古明地觉
这段代码便包含了上面的三种对象:object(内置类对象),Girl(自定义类对象),girl(实例对象)。
显然 Girl 和 object 之间是 is-kind-of 关系,即 Girl 是 object 的子类。值得一提的是,Python3 里面所有的类(除 object)都是默认继承自 object,即便我们这里不显式继承 object,也会默认继承的,但为了说明,我们就写上了。
除了 Girl 是 object 的子类,我们还能看出 girl 和 Girl 之间存在 is-instance-of 关系,即 girl 是 Girl 的实例。当然如果再进一步的话,girl 和 object 之间也存在 is-instance-of 关系,girl 也是 object 的实例。
class Girl(object): pass girl = Girl() print(issubclass(Girl, object)) # True print(type(girl)) # <class '__main__.Girl'> print(isinstance(girl, Girl)) # True print(isinstance(girl, object)) # True
girl 是 Girl 这个类实例化得到的,所以 type(girl) 得到的是类对象 Girl。但 girl 也是 object 的实例对象,因为 Girl 继承了 object。至于这其中的原理,我们会慢慢介绍。
Python 也提供了一些手段可以探测这些关系,除了上面的 type 之外,还可以使用对象的 __class__ 属性探测一个对象和其它的哪些对象之间存在 is-instance-of 关系。
而通过对象的 __bases__ 属性则可以探测一个对象和其它的哪些对象之间存在着 is-kind-of 关系。此外 Python 还提供了两个函数 issubclass 和 isinstance 来验证两个对象之间是否存在着我们期望的关系。
class Girl(object): pass girl = Girl() print(girl.__class__) # <class '__main__.Girl'> print(Girl.__class__) # <class 'type'> # __class__是查看自己的类型是什么,也就是生成自己的类 # 而在介绍 Python 对象的时候,我们就看到了 # 任何一个对象都至少具备两个东西: 一个是引用计数、一个是类型 # 所以 __class__ 是所有对象都具备的 # __base__只显示直接继承的第一个类 print(Girl.__base__) # <class 'object'> # __bases__ 会显示直接继承的所有类,以元组的形式 print(Girl.__bases__) # (<class 'object'>,)
我们画一张图总结一下:
另外需要注意里面的 type 和 object:
- type 和 object 存在 is-kind-of 关系,因为 type 是 object 的子类;
- object 和 type 存在 is-instance-of 关系,因为 object 是 type 的实例对象;
可能有人会好奇为什么会是这样,而关于这一点,我在 type 与 object 的恩怨纠葛这篇文章讲得很详细了,感兴趣可以点击阅读一下。
简单来说就是,type 在底层对应的结构体为 PyType_Type、object 在底层对应的结构体为 PyBaseObject_Type。而在创建 object 的时候,将内部的 ob_type 设置成了&PyType_Type;在创建type的时候,将内部的 tp_base 设置成了&PyBaseObject_Type。
因此这两者的定义是彼此依赖的,两者是同时出现的,我们后面还会看到。
另外 type 的类型就是 type 本身,所以:
- 实例对象的类型是类型对象,类型对象的类型是元类;
- 所有类型对象的基类都收敛于 object;
- 所有对象的类型都收敛于 type;
因此 Python 算是将一切皆对象的理念贯彻到了极致,也正因为如此,Python 才具有如此优秀的动态特性。
但还没有结束,我们看一下类对象 Girl 的行为,首先它支持属性设置:
class Girl(object): pass print(hasattr(Girl, "name")) # False Girl.name = "古明地觉" print(hasattr(Girl, "name")) # True print(Girl.name) # 古明地觉
一个类都已经定义完了,我们后续还可以进行属性添加,这在其它的静态语言中是不可能做到的。那么Python是如何做到的呢?我们说能够对属性进行动态添加,你会想到什么?是不是字典呢?
正如 global 名字空间一样,我们猜测类应该也有自己的属性字典,往类里面设置属性的时候,等价于向字典中添加键值对,同理其它操作也与之类似。
class Girl(object): pass print(Girl.__dict__.get("name", "不存在")) # 不存在 Girl.name = "古明地觉" print(Girl.__dict__.get("name")) # 古明地觉
和操作全局变量是类似的,但是有一点需要注意:我们不能直接通过类的属性字典来设置属性。
try: Girl.__dict__["name"] = "古明地觉" except Exception as e: print(e) # 'mappingproxy' object does not support item assignment
虽然叫属性字典,但其实是 mappingproxy 对象,该对象本质上就是对字典进行了一层封装,在字典的基础上移除了增删改操作,也就是只保留了查询功能。如果我们想给类增加属性,可以采用直接赋值的方式,或者调用 setattr 函数也是可以的。
但在介绍如何篡改虚拟机的时候,我们提到过一个骚操作,可以通过 gc 模块拿到 mappingproxy 对象里的字典。
import gc class Girl(object): pass gc.get_referents(Girl.__dict__)[0]["name"] = "古明地觉" print(Girl.name) # 古明地觉
并且这种做法除了适用于自定义类对象,还适用于内置类对象。但是工作中不要这么做,知道有这么个操作就行。
除了设置属性之外,我们还可以设置函数。
class Girl(object): pass Girl.info = lambda name: f"我是{name}" print(Girl.info("古明地觉")) # 我是古明地觉 # 如果实例调用的话,会和我们想象的不太一样 # 因为实例调用的话会将函数包装成方法 try: Girl().info("古明地觉") except TypeError as e: print(e) """ <lambda>() takes 1 positional argument but 2 were given """ # 实例在调用的时候会将自身也作为参数传进去 # 所以第一个参数 name 实际上接收的是 Girl 的实例对象 # 只不过第一个参数按照规范来讲应该叫做self # 但即便你起别的名字也是无所谓的 print(Girl().info()) """ 我是<__main__.Girl object at 0x000001920BB88760> """
所以我们可以有两种做法:
# 将其包装成一个静态方法 # 这样类和实例都可以调用 Girl.info = staticmethod(lambda name: f"我是{name}") print(Girl.info("古明地觉")) # 我是古明地觉 print(Girl().info("古明地觉")) # 我是古明地觉 # 如果是给实例用的,那么带上一个 self 参数即可 Girl.info = lambda self, name: f"我是{name}" print(Girl().info("古明地觉")) # 我是古明地觉
此外我们还可以通过 type 来动态地往类里面进行属性的增加、修改和删除。
class Girl(object): def say(self): pass print(hasattr(Girl, "say")) # True # delattr(Girl, "say") 与之等价 type.__delattr__(Girl, "say") print(hasattr(Girl, "say")) # False # 我们设置一个属性吧 # 等价于 Girl.name = "古明地觉" setattr(Girl, "name", "古明地觉") print(Girl.name) # 古明地觉
事实上调用 getattr、setattr、delattr 等价于调用其类型对象的__getattr__、__setattr__、__delattr__。
所以,一个对象支持哪些行为,取决于其类型对象定义了哪些操作。并且通过对象的类型对象,可以动态地给该对象进行属性的设置。Python 所有类型对象的类型对象都是 type,通过 type 我们便可以控制类的生成过程,即便类已经创建完毕了,也依旧可以进行属性设置。
但是注意:type 可以操作的类只能是通过 class 定义的动态类,而像 int、list、dict 等静态类,它们是在源码中静态定义好的,只不过类型设置成了 type。一言以蔽之,type 虽然是所有类对象的类对象,但 type 只能对动态类进行属性上的修改,不能修改静态类。
try: int.name = "古明地觉" except Exception as e: print(e) """ can't set attributes of built-in/extension type 'int' """ try: setattr(int, "ping", "pong") except Exception as e: print(e) """ can't set attributes of built-in/extension type 'int' """
通过报错信息可以看到,不可以设置内置类和扩展类的属性,因为内置类在解释器启动之后,就已经初始化好了。至于扩展类就是我们使用 Python/C API 编写的扩展模块中的类,它和内置类是等价的。
因此内置类和使用 class 定义的类本质上是一样的,都是 PyTypeObject 对象,它们的类型在 Python 里面都是 type。但区别在于内置类在底层是静态初始化的,我们不能进行属性的动态设置(通过 gc 模块实现除外)。
但是为什么不可以对内置类和扩展类进行属性设置呢?首先我们要知道 Python 的动态特性是虚拟机赐予的,而虚拟机的工作就是将 PyCodeObject 对象翻译成 C 的代码进行执行,所以 Python 的动态特性就是在这一步发生的。
而内置类在解释器启动之后就已经静态初始化好了,直接指向 C 一级的数据结构,同理扩展类也是如此。它们相当于绕过了解释执行这一步,所以它们的属性不可以动态添加。
不光内置的类本身,还有它的实例对象也是如此。
a = 123 print(hasattr(a, "__dict__")) # False
我们看到它连自己的属性字典都没有,因为内置类对象的实例对象,内部有哪些属性,解释器记得清清楚楚。它们在底层都已经写死了,并且不允许修改,因此虚拟机完全没有必要为其实现属性字典(节省了内存占用)。