转载

深入super，看Python如何解决钻石继承难题

1. Python的继承以及调用父类成员

python子类调用父类成员有2种方法，分别是普通方法和super方法

假设Base是基类

class Base(object):       def __init__(self):            print “Base init”

则普通方法如下

class Leaf(Base):        def __init__(self):               Base.__init__(self)               print “Leaf init”

super方法如下

class Leaf(Base):        def __init__(self):               super(Leaf, self).__init__()               print “Leaf init”

在上面的简单场景下，两种方法的效果一致：

>>> leaf = Leaf()

Base init

Leaf init

2. 钻石继承遇到的难题

当我们来到钻石继承场景时，我们就遇到了一个难题：

深入super，看Python如何解决钻石继承难题

如果我们还是使用普通方法调用父类成员，代码如下：

class Base(object):  def __init__(self):   print “Base init” class Medium1(Base):  def __init__(self):   Base.__init__(self)   print “Medium1 init” class Medium2(Base):  def __init__(self):   Base.__init__(self)   print “Medium2 init” class Leaf(Medium1, Medium2):  def __init__(self):   Medium1.__init__(self)   Medium2.__init__(self)   print “Leaf init”

当我们生成Leaf对象时，结果如下：

>>> leaf = Leaf()

Base init

Medium1 init

Base init

Medium2 init

Leaf init

可以看到Base被初始化了两次！这是由于Medium1和Medium2各自调用了Base的初始化函数导致的。

3. 各语言的解决方法

钻石继承中，父类被多次初始化是个非常难缠的问题，我们来看看其他各个语言是如何解决这个问题的：

3.1. C++

C++使用虚拟继承来解决钻石继承问题。

Medium1和Medium2虚拟继承Base。当生成Leaf对象时，Medium1和Medium2并不会自动调用虚拟基类Base的构造函数，而需要由Leaf的构造函数显式调用Base的构造函数。

3.2. Java

Java禁止使用多继承。

Java使用单继承+接口实现的方式来替代多继承，避免了钻石继承产生的各种问题。

3.3. Ruby

Ruby禁止使用多继承。

Ruby和Java一样只支持单继承，但它对多继承的替代方式和Java不同。Ruby使用Mixin的方式来替代，在当前类中mixin入其他模块，来做到代码的组装效果。

3.4. Python

Python和C++一样，支持多继承的语法。但Python的解决思路和C++完全不一样，Python是的用就是super

我们把第2章的钻石继承用super重写一下，看一下输出结果

class Base(object):  def __init__(self):   print “Base init” class Medium1(Base):  def __init__(self):   super(Medium1, self).__init__()   print “Medium1 init” class Medium2(Base):  def __init__(self):   super(Medium2, self).__init__()   print “Medium2 init” class Leaf(Medium1, Medium2):  def __init__(self):   super(Leaf, self).__init__()   print “Leaf init”

我们生成Leaf对象：

>>> leaf = Leaf()

Base init

Medium2 init

Medium1 init

Leaf init

可以看到整个初始化过程符合我们的预期，Base只被初始化了1次。而且重要的是，相比原来的普通写法，super方法并没有写额外的代码，也没有引入额外的概念

4. super的内核：mro

要理解super的原理，就要先了解mro。mro是method resolution order的缩写，表示了类继承体系中的成员解析顺序。

在python中，每个类都有一个mro的类方法。我们来看一下钻石继承中，Leaf类的mro是什么样子的：

>>> Leaf.mro()

[<class '__main__.Leaf'>, <class '__main__.Medium1'>, <class '__main__.Medium2'>, <class '__main__.Base'>, <type 'object'>]

可以看到mro方法返回的是一个祖先类的列表。Leaf的每个祖先都在其中出现一次，这也是super在父类中查找成员的顺序。

通过mro，python巧妙地将多继承的图结构，转变为list的顺序结构。super在继承体系中向上的查找过程，变成了在mro中向右的线性查找过程，任何类都只会被处理一次。

通过这个方法，python解决了多继承中的2大难题：

1. 查找顺序问题。从Leaf的mro顺序可以看出，如果Leaf类通过super来访问父类成员，那么Medium1的成员会在Medium2之前被首先访问到。如果Medium1和Medium2都没有找到，最后再到Base中查找。

2. 钻石继承的多次初始化问题。在mro的list中，Base类只出现了一次。事实上任何类都只会在mro list中出现一次。这就确保了super向上调用的过程中，任何祖先类的方法都只会被执行一次。

至于mro的生成算法，可以参考这篇wiki：https://en.wikipedia.org/wiki/C3_linearization

5. super的具体用法

我们首先来看一下python中的super文档

>>> help(super)

Help on class super in module __builtin__:

class super(object)

| super(type, obj) -> bound super object; requires isinstance(obj, type)

| super(type) -> unbound super object

| super(type, type2) -> bound super object; requires issubclass(type2, type)

光从字面来看，这可以算是python中最语焉不详的帮助文档之一了。甚至里面还有一些术语误用。那super究竟应该怎么用呢，我们重点来看super中的第1和第3种用法

5.1. super(type, obj)

当我们在Leaf的__init__中写这样的super时：

class Leaf(Medium1, Medium2):        def __init__(self):               super(Leaf, self).__init__()               print “Leaf init”

super(Leaf, self).__init__()的意思是说：

获取self所属类的mro, 也就是[Leaf, Medium1, Medium2, Base]
从mro中Leaf右边的一个类开始，依次寻找__init__函数。这里是从Medium1开始寻找
一旦找到，就把找到的__init__函数绑定到self对象，并返回

从这个执行流程可以看到，如果我们不想调用Medium1的__init__，而想要调用Medium2的__init__，那么super应该写成：super(Medium1, self)__init__()

5.2. super(type, type2)

当我们在Leaf中写类方法的super时：

class Leaf(Medium1, Medium2):        def __new__(cls):               obj = super(Leaf, cls).__new__(cls)               print “Leaf new”               return obj

super(Leaf, cls).__new__(cls)的意思是说：