转载

访问 NULL 指针错误背后的原理

说到 NULL 指针大家都是谈之色变，第一印象就是 NullPointerException , Segmentation fault 之类的错误。NULL 指针大部分情况下会导致程序被终止。但是其实严格来说，访问空指针会产生不可预料的结果。只不过大部分情况是程序被终止。为什么呢？接下来让我们来探讨访问 NULL 指针错误背后的原理。

NULL 在编译器中的实现

首先，我们来看看 NULL 指针到底是什么？

Null 是一个特殊指针值（或是一种对象引用）表示这个指针并不指向任何的对象。

举一些例子，C/C++ 中的 NULL ，Python 中的 None 等等。大部分 NULL 实现是用 0 代表 NULL ，例如说 C/C++ 。实际上，NULL 的值并不重要，重要的是它代表的含义。例如说，JVM 规范并没有规定 NULL 的值，不同虚拟机实现可以自己定义 NULL 的值。

总之， NULL 的值取决编译器实现。

访问 NULL 指针的过程

C 语言中，NULL 的值是 0，即 NULL == 0 是成立的。我们前面说访问 NULL 指针的行为会产生不可预料的后果。但是在 Linux 系统中后果是确定的：访问空指针会产生 Segmentation fault 的错误。因此这里的“不可预料”指的是在不同系统产生的后果不一样。

让我们假设现在使用的是 C 语言，运行在 Linux 系统上，以此来分析访问 NULL 指针的过程。

Linux 中，每个进程空间的 0x0 虚拟地址开始的线性区(memory region)都会被映射到一个用户态没有访问权限的页上。通过这样的映射，内核可以保证没有别的页会映射到这个区域。
编译器把空指针当做 0 对待，开心地让你去访问空指针。
缺页异常处理程序被调用，因为在 0x0 的页没有在物理内存里面。
缺页异常处理程序发现你没有访问的权限。
内核发送 SIGSEGV 信号给进程，该信号默认是让进程自杀。

可以看到：不需要特定的编译器实现或者内核的支持，只需要让一个页映射到 0x0 的虚拟地址上，就完美的实现了检测空指针的错误。