转载

[iOS] 自动释放池的前世今生

关注仓库，及时获得更新： iOS-Source-Code-Analyze

Follow: Draveness · Github

由于 Objective-C 中的内存管理是一个比较大的话题，所以会分为两篇文章来对内存管理中的一些机制进行剖析，一部分分析自动释放池以及 autorelease 方法，另一部分分析 retain 、 release 方法的实现以及自动引用计数。

写在前面

这篇文章会在源代码层面介绍 Objective-C 中自动释放池，以及方法的 autorelease 的具体实现。

从 main 函数开始

main 函数可以说是在整个 iOS 开发中非常不起眼的一个函数，它很好地隐藏在 Supporting Files 文件夹中，却是整个 iOS 应用的入口。 [iOS] 自动释放池的前世今生

main.m 文件中的内容是这样的：

int main(int argc, char * argv[]) {       @autoreleasepool {         return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));     } }

在这个 @autoreleasepool block 中只包含了一行代码，这行代码将所有的事件、消息全部交给了 UIApplication 来处理，但是这不是本文关注的重点。

需要注意的是： 整个 iOS 的应用都是包含在一个自动释放池 block 中的 。

@autoreleasepool

@autoreleasepool 到底是什么？我们在命令行中使用 clang -rewrite-objc main.m 让编译器重新改写这个文件：

$ clang -rewrite-objc main.m

在生成了一大堆警告之后，当前目录下多了一个 main.cpp 文件

[iOS] 自动释放池的前世今生

这里删除了 main 函数中其他无用的代码。

在这个文件中，有一个非常奇怪的 __AtAutoreleasePool 的结构体，前面的注释写到 /* @autoreleasepopl */ 。也就是说 @autoreleasepool {} 被转换为：

{     __AtAutoreleasePool __autoreleasepool; }

在 main.cpp 中查找名为 __AtAutoreleasePool 的结构体：

[iOS] 自动释放池的前世今生

struct __AtAutoreleasePool {     __AtAutoreleasePool() {atautoreleasepoolobj = objc_autoreleasePoolPush();}   ~__AtAutoreleasePool() {objc_autoreleasePoolPop(atautoreleasepoolobj);}   void * atautoreleasepoolobj; };

这个结构体会在初始化时调用 objc_autoreleasePoolPush() 方法，会在析构时调用 objc_autoreleasePoolPop 方法。

这表明，我们的 main 函数其实是这样的：

int main(int argc, const char * argv[]) {       {         void * atautoreleasepoolobj = objc_autoreleasePoolPush();          // do whatever you want          objc_autoreleasePoolPop(atautoreleasepoolobj);     }     return 0; }

@autoreleasepool 只是帮助我们少写了这两行代码而已，让代码看起来更美观，然后要根据上述两个方法来分析自动释放池的实现。

AutoreleasePool 是什么

这一节开始分析方法 objc_autoreleasePoolPush 和 objc_autoreleasePoolPop 的实现：

void *objc_autoreleasePoolPush(void) {       return AutoreleasePoolPage::push(); }  void objc_autoreleasePoolPop(void *ctxt) {       AutoreleasePoolPage::pop(ctxt); }

上面的方法看上去是对 AutoreleasePoolPage 对应 静态方法 push 和 pop 的封装。

这一小节会按照下面的顺序逐步解析代码中的内容：

AutoreleasePoolPage 的结构
objc_autoreleasePoolPush 方法
objc_autoreleasePoolPop 方法

AutoreleasePoolPage 的结构

AutoreleasePoolPage 是一个 C++ 中的类：

[iOS] 自动释放池的前世今生

它在 NSObject.mm 中的定义是这样的：

class AutoreleasePoolPage {       magic_t const magic;     id *next;     pthread_t const thread;     AutoreleasePoolPage * const parent;     AutoreleasePoolPage *child;     uint32_t const depth;     uint32_t hiwat; };

magic 用于对当前 AutoreleasePoolPage 完整性 的校验
thread 保存了当前页所在的线程

每一个自动释放池都是由一系列的 AutoreleasePoolPage 组成的，并且每一个 AutoreleasePoolPage 的大小都是 4096 字节（16 进制 0x1000）

#define I386_PGBYTES 4096 #define PAGE_SIZE I386_PGBYTES

双向链表

自动释放池中的 AutoreleasePoolPage 是以 双向链表 的形式连接起来的：

[iOS] 自动释放池的前世今生

parent 和 child 就是用来构造双向链表的指针。

自动释放池中的栈

如果我们的一个 AutoreleasePoolPage 被初始化在内存的 0x100816000 ~ 0x100817000 中，它在内存中的结构如下：

[iOS] 自动释放池的前世今生

其中有 56 bit 用于存储 AutoreleasePoolPage 的成员变量，剩下的 0x100816038 ~ 0x100817000 都是用来存储 加入到自动释放池中的对象 。

begin() 和 end() 这两个类的实例方法帮助我们快速获取 0x100816038 ~ 0x100817000 这一范围的边界地址。

next 指向了下一个为空的内存地址，如果 next 指向的地址加入一个 object ，它就会如下图所示 移动到下一个为空的内存地址中 ：

[iOS] 自动释放池的前世今生

关于 hiwat 和 depth 在文章中并不会进行介绍，因为它们并不影响整个自动释放池的实现，也不在关键方法的调用栈中。

POOL_SENTINEL（哨兵对象）

到了这里，你可能想要知道 POOL_SENTINEL 到底是什么，还有它为什么在栈中。

首先回答第一个问题： POOL_SENTINEL 只是 nil 的别名。

#define POOL_SENTINEL nil

在每个自动释放池初始化调用 objc_autoreleasePoolPush 的时候，都会把一个 POOL_SENTINEL push 到自动释放池的栈顶，并且返回这个 POOL_SENTINEL 哨兵对象。

int main(int argc, const char * argv[]) {       {         void * atautoreleasepoolobj = objc_autoreleasePoolPush();          // do whatever you want          objc_autoreleasePoolPop(atautoreleasepoolobj);     }     return 0; }

上面的 atautoreleasepoolobj 就是一个 POOL_SENTINEL 。

而当方法 objc_autoreleasePoolPop 调用时，就会向自动释放池中的对象发送 release 消息，直到第一个 POOL_SENTINEL ：

[iOS] 自动释放池的前世今生

objc_autoreleasePoolPush 方法

了解了 POOL_SENTINEL ，我们来重新回顾一下 objc_autoreleasePoolPush 方法：

void *objc_autoreleasePoolPush(void) {       return AutoreleasePoolPage::push(); }

它调用 AutoreleasePoolPage 的类方法 push ，也非常简单：

static inline void *push() {      return autoreleaseFast(POOL_SENTINEL); }

在这里会进入一个比较关键的方法 autoreleaseFast ，并传入哨兵对象 POOL_SENTINEL ：

static inline id *autoreleaseFast(id obj)   {    AutoreleasePoolPage *page = hotPage();    if (page && !page->full()) {        return page->add(obj);    } else if (page) {        return autoreleaseFullPage(obj, page);    } else {        return autoreleaseNoPage(obj);    } }

上述方法分三种情况选择不同的代码执行：

有 hotPage 并且当前 page 不满
- 调用 page->add(obj) 方法将对象添加至 AutoreleasePoolPage 的栈中
有 hotPage 并且当前 page 已满
- 调用 autoreleaseFullPage 初始化一个新的页
- 调用 page->add(obj) 方法将对象添加至 AutoreleasePoolPage 的栈中
无 hotPage
- 调用 autoreleaseNoPage 创建一个 hotPage
- 调用 page->add(obj) 方法将对象添加至 AutoreleasePoolPage 的栈中

最后的都会调用 page->add(obj) 将对象添加到自动释放池中。

hotPage 可以理解为当前正在使用的 AutoreleasePoolPage 。

page->add 添加对象

id *add(id obj) 将对象添加到自动释放池页中：

id *add(id obj) {       id *ret = next;     *next = obj;     next++;     return ret; }

笔者对这个方法进行了处理，更方便理解。

这个方法其实就是一个压栈的操作，将对象加入 AutoreleasePoolPage 然后移动栈顶的指针。

autoreleaseFullPage（当前 hotPage 已满）

autoreleaseFullPage 会在当前的 hotPage 已满的时候调用：

static id *autoreleaseFullPage(id obj, AutoreleasePoolPage *page) {       do {         if (page->child) page = page->child;         else page = new AutoreleasePoolPage(page);     } while (page->full());      setHotPage(page);     return page->add(obj); }

它会从传入的 page 开始遍历整个双向链表，直到：

查找到一个未满的 AutoreleasePoolPage
使用构造器传入 parent 创建一个新的 AutoreleasePoolPage

在查找到一个可以使用的 AutoreleasePoolPage 之后，会将该页面标记成 hotPage ，然后调动上面分析过的 page->add 方法添加对象。

autoreleaseNoPage（没有 hotPage)

如果当前内存中不存在 hotPage ，就会调用 autoreleaseNoPage 方法初始化一个 AutoreleasePoolPage ：

static id *autoreleaseNoPage(id obj) {       AutoreleasePoolPage *page = new AutoreleasePoolPage(nil);     setHotPage(page);      if (obj != POOL_SENTINEL) {         page->add(POOL_SENTINEL);     }      return page->add(obj); }

既然当前内存中不存在 AutoreleasePoolPage ，就要 从头开始构建这个自动释放池的双向链表 ，也就是说，新的 AutoreleasePoolPage 是没有 parent 指针的。

初始化之后，将当前页标记为 hotPage ，然后会先向这个 page 中添加一个 POOL_SENTINEL 对象，来确保在 pop 调用的时候，不会出现异常。

最后，将 obj 添加到自动释放池中。

objc_autoreleasePoolPop 方法

同样，回顾一下上面提到的 objc_autoreleasePoolPop 方法：

void objc_autoreleasePoolPop(void *ctxt) {       AutoreleasePoolPage::pop(ctxt); }

看起来传入任何一个指针都是可以的，但是在整个工程并没有发现传入其他对象的例子。不过在这个方法中 传入其它的指针也是可行的 ，会将自动释放池释放到相应的位置。

我们一般都会在这个方法中传入一个哨兵对象 POOL_SENTINEL ，如下图一样释放对象：

[iOS] 自动释放池的前世今生

对 objc_autoreleasePoolPop 行为的测试

在继续分析这个方法之前做一个小测试，在 objc_autoreleasePoolPop 传入非哨兵对象，测试一下这个方法的行为。

下面是 main.m 文件中的源代码：

#import <Foundation/Foundation.h>  int main(int argc, const char * argv[]) {       @autoreleasepool {          NSString *s = @"Draveness";         [s stringByAppendingString:@"-Suffix"];      }     return 0; }

在代码的这一行打一个断点，因为这里会调用 autorelease 方法，将字符串加入自动释放池：

[iOS] 自动释放池的前世今生

当代码运行到这里时，通过 lldb 打印出当前 hotPage 中的栈内容：

[iOS] 自动释放池的前世今生

通过 static 方法获取当前 hotPage
打印 AutoreleasePoolPage 中的内容
打印当前 next 指针指向的内容，以及之前的内容， -2 时已经到了 begin() 位置
使用 print() 和 printAll() 打印自动释放池中内容

然后将字符串 @"Draveness-Suffix" 的指针传入 pop 方法，测试 pop 方法能否传入非哨兵参数。

[iOS] 自动释放池的前世今生

再次打印当前 AutoreleasePoolPage 的内容时，字符串已经不存在了，这说明 向 pop 方法传入非哨兵参数是可行的 ，只是我们一般不会传入非哨兵对象。

让我们重新回到对 objc_autoreleasePoolPop 方法的分析，也就是 AutoreleasePoolPage::pop 方法的调用：

static inline void pop(void *token) {       AutoreleasePoolPage *page = pageForPointer(token);     id *stop = (id *)token;      page->releaseUntil(stop);      if (page->child) {         if (page->lessThanHalfFull()) {             page->child->kill();         } else if (page->child->child) {             page->child->child->kill();         }     } }

在这个方法中删除了大量无关的代码，以及对格式进行了调整。

该静态方法总共做了三件事情：

使用 pageForPointer 获取当前 token 所在的 AutoreleasePoolPage
调用 releaseUntil 方法释放 栈中的 对象，直到 stop
调用 child 的 kill 方法

我到现在也不是很清楚为什么要根据当前页的不同状态 kill 掉不同 child 的页面。

if (page->lessThanHalfFull()) {       page->child->kill(); } else if (page->child->child) {     page->child->child->kill(); }

pageForPointer 获取 AutoreleasePoolPage

pageForPointer 方法主要是通过内存地址的操作，获取当前指针所在页的首地址：

static AutoreleasePoolPage *pageForPointer(const void *p) {       return pageForPointer((uintptr_t)p); }  static AutoreleasePoolPage *pageForPointer(uintptr_t p) {       AutoreleasePoolPage *result;     uintptr_t offset = p % SIZE;      assert(offset >= sizeof(AutoreleasePoolPage));      result = (AutoreleasePoolPage *)(p - offset);     result->fastcheck();      return result; }

将指针与页面的大小，也就是 4096 取模，得到当前指针的偏移量，因为所有的 AutoreleasePoolPage 在内存中都是对齐的：

p = 0x100816048   p % SIZE = 0x48   result = 0x100816000

而最后调用的方法 fastCheck() 用来检查当前的 result 是不是一个 AutoreleasePoolPage 。

通过检查 magic_t 结构体中的某个成员是否为 0xA1A1A1A1 。

releaseUntil 释放对象

releaseUntil 方法的实现如下：

void releaseUntil(id *stop) {       while (this->next != stop) {         AutoreleasePoolPage *page = hotPage();          while (page->empty()) {             page = page->parent;             setHotPage(page);         }          page->unprotect();         id obj = *--page->next;         memset((void*)page->next, SCRIBBLE, sizeof(*page->next));         page->protect();          if (obj != POOL_SENTINEL) {             objc_release(obj);         }     }      setHotPage(this); }

它的实现还是很容易的，用一个 while 循环持续释放 AutoreleasePoolPage 中的内容，直到 next 指向了 stop 。

使用 memset 将内存的内容设置成 SCRIBBLE ，然后使用 objc_release 释放对象。

kill() 方法

到这里，没有分析的方法就只剩下 kill 了，而它会将当前页面以及子页面全部删除：

void kill() {       AutoreleasePoolPage *page = this;     while (page->child) page = page->child;      AutoreleasePoolPage *deathptr;     do {         deathptr = page;         page = page->parent;         if (page) {             page->unprotect();             page->child = nil;             page->protect();         }         delete deathptr;     } while (deathptr != this); }

autorelease 方法

我们已经对自动释放池生命周期有一个比较好的了解，最后需要了解的话题就是 autorelease 方法的实现，先来看一下方法的调用栈：

- [NSObject autorelease] └── id objc_object::rootAutorelease()     └── id objc_object::rootAutorelease2()         └── static id AutoreleasePoolPage::autorelease(id obj)             └── static id AutoreleasePoolPage::autoreleaseFast(id obj)                 ├── id *add(id obj)                 ├── static id *autoreleaseFullPage(id obj, AutoreleasePoolPage *page)                 │   ├── AutoreleasePoolPage(AutoreleasePoolPage *newParent)                 │   └── id *add(id obj)                 └── static id *autoreleaseNoPage(id obj)                     ├── AutoreleasePoolPage(AutoreleasePoolPage *newParent)                     └── id *add(id obj)

在 autorelease 方法的调用栈中，最终都会调用上面提到的方法，将当前对象加到 AutoreleasePoolPage 中。

这一小节中这些方法的实现都非常容易，只是进行了一些参数上的检查，最终还要调用方法：

inline id objc_object::rootAutorelease() {       if (isTaggedPointer()) return (id)this;     if (prepareOptimizedReturn(ReturnAtPlus1)) return (id)this;      return rootAutorelease2(); }  __attribute__((noinline,used)) id objc_object::rootAutorelease2() {       return AutoreleasePoolPage::autorelease((id)this); }  static inline id autorelease(id obj) {      id *dest __unused = autoreleaseFast(obj);    return obj; }

由于在上面已经分析过 autoreleaseFast 方法的实现，这里就不会多说了。