转载

Node.js模块加载过程module.js源码阅读

引言

nodejs中以模块来组织代码,加载模块是怎样的一个过程呢?require又是怎么在运作?

模块

nodejs中以模块为最小单位来组织代码,类似于Java中的package概念,而在nodejs中要搞清楚模块,就要搞清楚模块是怎么样加载的。

源码分析

我们都知道加载一个模块是使用require函数来实现的,那么先从require函数下手。

1.Module.prototype.require

我们从module.js里找,发现有个require方法, Module.prototype.require

Module.prototype.require = function(path) {   assert(path, 'missing path');   assert(util.isString(path), 'path must be a string');   return Module._load(path, this); }; 

2.Module._load

通过路径加载一个模块。 方法注释上给出如下解释:

从缓存中查找所要加载的模块

  1. 如果一个模块已经存在于缓存中:直接返回它的exports对象
  2. 如果模块是一个本地模块,调用’NativeModule.require()'方法,filename作为参数,并返回结果
  3. 否则,使用这个文件创建一个新模块并把它加入缓存中。在加载它只会返回exports对象。

3.Module._resolveFilename

而通常我们在某个模块中给出的路径都是一个模块的相对路径,那么会先调用 Module._resolveFilename 这个方法来查找下这个文件的真实路径的全路径文件名。

而在 Module._resolveFilename 这个方法中,首先会去检查,本地模块是否有这个模块,如果有,直接返回,如果没有,继续往下查找。

4.Module._resolveLookupPaths

接着就会碰到 Module._resolveLookupPaths 方法了,从代码来看,他返回了一个数组,数组的第一个元素是模块的id,而第二个元素是模块的paths。

这些paths接下来会用来查找是否存在需要require的这个模块了,存在就会返回一个文件名。

而接下来通过这个filename来到 Module._cache 中查找是否,有则返回 module.exports 对象,没有缓存则又会查找一次本地模块,不存在这个本地模块,就新创建一个模块,并在cache中缓存它。 这就是我们加载了一个模块之后,第二次在别处加载时也不会重新加载的原因。

5.Module.load

而在创建模块之后,还有个装载的过程 Module.load ,装载的过程中会将几种扩展名的文件执行不同的操作:

  • .js Module._complie,运行这个js并包裹在适当的作用域中,并传入参数require, module, exports
  • .json 读文件之后,使用JSON.parse转成对象
  • .node 使用process.dlopen加载扩展

如果js文件中包含模块引用,那么还会继续重复以上操作的。

这里会try catch一下,如果装载失败,就会从cache中将这个模块删除。

try {     module.load(filename);     hadException = false;   } finally {     if (hadException) {       delete Module._cache[filename];     }   } 

这里的细节给了我们一个思路,即当我们程序运行时,加载了某个模块,而我们可能在运行过程中修改了代码,或者是重新部署了代码,那么我们可以通过先删除cache中的内容,再加载一次,来实现动态加载,也可以说是热部署。 具体的做法可以参考这个文章 http://fex.baidu.com/blog/2015/05/nodejs-hot-swapping/

到这里一个模块基本上已经加载完成了。

正文到此结束
Loading...