转载

用runtime看OC中类与对象,消息的底层实现原理

1.OC的类和对象

先看一下类和对象的数据结构:

typedef struct objc_class *Class;//类对象
struct objc_class {//类对象的结构体
Class isa  OBJC_ISA_AVAILABILITY;//meta-class里存储类方法,meta-class的isa指向根类,super_class指向父类的meta-class。
#if !__OBJC2__
Class super_class                                        OBJC2_UNAVAILABLE;
const char *name                                        OBJC2_UNAVAILABLE;
long version                                            OBJC2_UNAVAILABLE;
long info                                                OBJC2_UNAVAILABLE;
long instance_size                                      OBJC2_UNAVAILABLE;
struct objc_ivar_list *ivars                            OBJC2_UNAVAILABLE;
struct objc_method_list **methodLists                    OBJC2_UNAVAILABLE;
struct objc_cache *cache                                OBJC2_UNAVAILABLE;
struct objc_protocol_list *protocols                    OBJC2_UNAVAILABLE;
#endif
} OBJC2_UNAVAILABLE;
struct objc_object {//实例对象结构体
Class isa  OBJC_ISA_AVAILABILITY;
};
typedef struct objc_object *id;//实例对象

每个对象都会有一个它所属的类。这是面向对象的基本概念,但是在OC中,这对所有数据结构有效。任何数据结构,只要在恰当的位置具有一个指针指向一个class,那么,它都可以被认为是一个对象。objc_class和objc_object的struct指针都能称为对象,我们为了区分可以把它们分别叫做类对象和实例对象,其中实例对象的isa指针指向类对象。

在OC中,一个对象所属于哪个类,是由它的isa指针指向的。这个isa指针指向这个对象所属的class。

我们看一下类对象的结构体objc_class:Class isa指向的就是metaclass,当我们向一个类发送消息的时候,就是调用metaclass里面的方法,如[NSString defaultStringEncoding],Class super_class指向父类。同样metaclass的结构体也是objc_class,它的Class isa指向直接指向根类的metaclass,根类的metaclass则是指向自身;它的Class super_class指向父类的metaclass;super_class的结构体也是objc_class,它的Class isa指向也是直接指向根类的metaclass,如果父类也有一个父类,它的Class super_class就是想父类。

类对象的结构体objc_class里面用Class super_class指向父类是为了实现继承;Class isa指向的就是metaclass则是为了实现向类发消息(也就是类方法),同时让类和对象有了区分。

用runtime看OC中类与对象,消息的底层实现原理

完美闭环

为了验证以上所述,我新建一个类Yordles继承NSObject,然后再新建一个类Timor继承Yordles,用clang rewrite成c的实现

Timor类截取主要代码如下:

static void OBJC_CLASS_SETUP_$_Timor(void ) {
OBJC_METACLASS_$_Timor.isa = &OBJC_METACLASS_$_NSObject;
OBJC_METACLASS_$_Timor.superclass = &OBJC_METACLASS_$_Yordles;
OBJC_METACLASS_$_Timor.cache = &_objc_empty_cache;
OBJC_CLASS_$_Timor.isa = &OBJC_METACLASS_$_Timor;
OBJC_CLASS_$_Timor.superclass = &OBJC_CLASS_$_Yordles;
OBJC_CLASS_$_Timor.cache = &_objc_empty_cache;
}

Yordles类截取相关代码如下:

static void OBJC_CLASS_SETUP_$_Yordles(void ) {
OBJC_METACLASS_$_Yordles.isa = &OBJC_METACLASS_$_NSObject;
OBJC_METACLASS_$_Yordles.superclass = &OBJC_METACLASS_$_NSObject;
OBJC_METACLASS_$_Yordles.cache = &_objc_empty_cache;
OBJC_CLASS_$_Yordles.isa = &OBJC_METACLASS_$_Yordles;
OBJC_CLASS_$_Yordles.superclass = &OBJC_CLASS_$_NSObject;
OBJC_CLASS_$_Yordles.cache = &_objc_empty_cache;
}

2.objc_msgSend

在我们传消息的时候(比如[NSString defaultStringEncoding],[timor wait]),在c层面一般都会转化成objc_msgSend方法。在讨论objc_msgSend的工作原理前,我们先看几个结构体

Method

Method表示类中的某个方法,在runtime.h文件中找到它的定义:

/// An opaque type that represents a method in a class definition.
typedef struct objc_method *Method;
struct objc_method {
SEL method_name                                          OBJC2_UNAVAILABLE;
char *method_types                                      OBJC2_UNAVAILABLE;
IMP method_imp                                          OBJC2_UNAVAILABLE;
}

其实Method就是一个指向objc_method结构体指针,它存储了方法名(method_name)、方法类型(method_types)和方法实现(method_imp)等信息。而method_imp的数据类型是IMP,它是一个函数指针,后面会重点提及。

Ivar

Ivar表示类中的实例变量,在runtime.h文件中找到它的定义:

/// An opaque type that represents an instance variable.
typedef struct objc_ivar *Ivar;
struct objc_ivar {
char *ivar_name                                          OBJC2_UNAVAILABLE;
char *ivar_type                                          OBJC2_UNAVAILABLE;
int ivar_offset                                          OBJC2_UNAVAILABLE;
#ifdef __LP64__
int space                                                OBJC2_UNAVAILABLE
#endif
}

Ivar其实就是一个指向objc_ivar结构体指针,它包含了变量名(ivar_name)、变量类型(ivar_type)等信息。

IMP

在上面讲Method时就说过,IMP本质上就是一个函数指针,指向方法的实现,在objc.h找到它的定义:

/// A pointer to the function of a method implementation.
#if !OBJC_OLD_DISPATCH_PROTOTYPES
typedef void (*IMP)(void /* id, SEL, ... */ );
#else
typedef id (*IMP)(id, SEL, ...);
#endif

当你向某个对象发送一条信息,可以由这个函数指针来指定方法的实现,它最终就会执行那段代码,这样可以绕开消息传递阶段而去执行另一个方法实现。

Cache

顾名思义,Cache主要用来缓存,那它缓存什么呢?我们先在runtime.h文件看看它的定义:

typedef struct objc_cache *Cache                            OBJC2_UNAVAILABLE;
struct objc_cache {
unsigned int mask /* total = mask + 1 */                OBJC2_UNAVAILABLE;
unsigned int occupied                                    OBJC2_UNAVAILABLE;
Method buckets[1]                                        OBJC2_UNAVAILABLE;
};

Cache其实就是一个存储Method的链表,主要是为了优化方法调用的性能。当对象receiver调用方法message时,首先根据对象receiver的isa指针查找到它对应的类,然后在类的methodLists中搜索方法,如果没有找到,就使用super_class指针到父类中的methodLists查找,一旦找到就调用方法。如果没有找到,有可能消息转发,也可能忽略它。但这样查找方式效率太低,因为往往一个类大概只有20%的方法经常被调用,占总调用次数的80%。所以使用Cache来缓存经常调用的方法,当调用方法时,优先在Cache查找,如果没有找到,再到methodLists查找

看了那么多元素概念,我们请出objc_msgSend在message.h中的定义:

/**
* Sends a message with a simple return value to an instance of a class.
*
* @param self A pointer to the instance of the class that is to receive the message.
* @param op The selector of the method that handles the message.
* @param ...
*  A variable argument list containing the arguments to the method.
*
* @return The return value of the method.
*
* @note When it encounters a method call, the compiler generates a call to one of the
*  functions /c objc_msgSend, /c objc_msgSend_stret, /c objc_msgSendSuper, or /c objc_msgSendSuper_stret.
*  Messages sent to an object’s superclass (using the /c super keyword) are sent using /c objc_msgSendSuper;
*  other messages are sent using /c objc_msgSend. Methods that have data structures as return values
*  are sent using /c objc_msgSendSuper_stret and /c objc_msgSend_stret.
*/
OBJC_EXPORT id objc_msgSend(id self, SEL op, ...)
OBJC_AVAILABLE(10.0, 2.0, 9.0, 1.0);

上面的注释翻译过来就是:

当编译器遇到一个方法调用时,它会将方法的调用翻译成以下函数中的一个 `objc_msgSend`、`objc_msgSend_stret`、`objc_msgSendSuper` 和 `objc_msgSendSuper_stret`。
发送给对象的父类的消息会使用 `objc_msgSendSuper`
有数据结构作为返回值的方法会使用 `objc_msgSendSuper_stret` 或 `objc_msgSend_stret`
其它的消息都是使用 `objc_msgSend` 发送的

现在让我们看一下objc_msgSend它具体是如何发送消息:

首先根据receiver对象的isa指针获取它对应的class;
优先在class的cache查找message方法,如果找不到,再到methodLists查找;
如果没有在class找到,再到super_class查找;
一旦找到message这个方法,就执行它实现的IMP。

用runtime看OC中类与对象,消息的底层实现原理

message

你以为objc_msgSend到这里就结束了,显然不是,这只是针对有方法实现的plan a,当objc_msgSend找不到实现的IMP时,程序并不会直接崩溃,而是给开发者一个plan b:方法决议与消息转发。这是有一组NSObject里的方法实现的,开发者只需要重写响应的方法即可。具体流程如图:

用runtime看OC中类与对象,消息的底层实现原理

方法决议与消息转发

注意:第一步当方法为实例方法时用:resolveInstanceMethod ,方法为类方法时用resolveClassMethod

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

正文到此结束
Loading...