本篇文章的话题是元编程。首先来认识元编程,我在第一篇《引子》里面已经介绍:元编程,指的是在运行时改变“类”的定义,例如访问、增加或修改等等。一言以蔽之,就是“用程序来写程序”。在第二篇的《类型系统》里面已经借由继承和接口的实现,介绍了一些利用元编程特性来增加或改变子类行为的方法。回顾语言发展的长河,其实是经历了一个从“对象 -> 类 -> 元类”到“对象 -> 原型”的发展过程的。所以,无论是类,还是元类,这样的概念其实都不是非有不可的,只是因为我们思考的习惯,特别是抽象的习惯而顺其自然地产生了。这一点我在 《编程范型:工具的选择》 里面已经详细描述了,建议在往下阅读前移步。
正式介入元编程的部分,先来看看Java,它的方式比较原始,也比较清晰,本身它定义了Class、Method、Field等等描述一个类的基本概念,基于静态语言的限制,没有办法真正在运行时改变一个类内部的结构(但是可以在运行时获取一个类内部的结构),于是有了像CGLib这样在运行时使用动态代理,创建一个类来替代的办法,让使用者看起来好像是改变了原始类的结构。当然,在编译期,像AspectJ这样的工具可以做到真正的“织入”逻辑,控制字节码的生成。对于Java的元编程本身而言,即便到今天,局限性很大,但是局限性并不意味着有用性,可以说如今元编程的应用已经铺天盖地,其中有这样两件事情大大加速了它元编程的发展:
再来看看Haskell,把它和Java放在一起介绍,因为二者都是静态语言,改变类或者定义结构的事情只能寄期望于编译期完成。Haskell的元编程并非核心内容,因此也更加初级,据我所知,基本上谈及Haskell的元编程,必谈 Template Haskell (TH)。我对TH的了解属于刚接触,对于进一步了解,需要知晓这样两个概念,抽象语法树(abstract syntax tree,AST),代码语法分析成功以后就会生成AST,它包含的内容和代码本身是一致的。而TH的执行结果,也是生成一棵AST。
接着要了解的概念是QuasiQuotation,里面可以存放任何字符串,被视作一个表达式,允许程序员写自定义的结构片段(下面的中括号组合加上里面的竖线的这个结构 [| |])。比如(例子来自 这里 ):
silly :: QuasiQuoter silly = QuasiQuoter { quoteExp = /_ -> [| "yeah!!!" |] }
这一篇 介绍 相对比较容易理解(里面还介绍了使用reify来自省)。比如 [d|head’ (x:_) = x|] 这样的表达式会被解析成为这样一棵AST:[FunD head’ [Clause [InfixP (VarP x_1) GHC.Types.: WildP] (NormalB (VarE x_1)) []]]。
如果表达式里面还有Quotation,就需要使用 $() 来区分,比如:
emptyShow :: Name -> Q [Dec] emptyShow name = [d|instance Show $(conT name) where show _ = ""|]
无论是上面的哪一个,限制都还是太多了,主要的原因还是在于,它们是静态语言;因此要用元编程用得自如,必须深入学习一门动态语言。
来看JavaScript。从静态语言的囚笼中解脱出来, JavaScript的元编程的能力虽然强大,但是却很容易归纳:
其余那些元编程的特性,都是其他人或者说第三方基于以上元编程基本的能力给后加上去的。
对于第一条,其实可以用下面这个最简单的例子来概括:
function Func(){}; var func = new Func(); func.a = function(){ console.log("a"); }; Func.b = function(){ console.log("b"); }; Func.prototype.c = function(){ console.log("c"); }; // instance func.a(); // function Func.b(); // prototype func.c();
而对于第二条,还是用一个最简单的例子来说明,数据和代码等价的道理(还有一个关于模板引擎使用代码生成的例子在这里):
var str = "{a:3, b:4}"; var obj = eval("(" + str + ")"); console.log(obj);
最后是Groovy,把Groovy放在最后是因为它的 元编程特性太丰富了 (下面的特性,如果要找例子都可以去这个官网的链接)。Java的所有元编程能力全部保留,在之基础上,下面我有选择地介绍几条。
1、MethodMissing:这是一个我非常喜欢的特性,简言之就是当被调用方法不存在时,可以执行的自定义方法,想一想,这相当于为对象提供了一个重要的特性:default行为。与methodMissing相对的,还有propertyMissing。
class Foo { def methodMissing(String name, def args) { return "this is me" } } assert new Foo().someUnknownMethod(42l) == 'this is me'
2、GroovyInterceptable:这个特性是给方法调用增加一层拦截逻辑,换句话说,是AOP的一种实现,比如:
class SimplePOGO implements GroovyInterceptable { void targetMethod(){ System.out.println("...") } def invokeMethod(String name, args){ System.out.println("${name} is being called") //Get the method that was originally called. def calledMethod = SimplePOGO.metaClass.getMetaMethod(name, args) calledMethod?.invoke(this, args) } } simplePogo = new SimplePOGO() simplePogo.targetMethod()
上面的例子调用targetMethod,但是拦截逻辑放在invokeMethod里面。
3、Categories,这是个从Objective C搬过来的特性。这个怎么说呢,很像电脑游戏里面角色的隐藏技能,平时不具备,但是危急关头(使用use关键字)可以触发打开,等到危急结束(use的代码块结束),技能又消失,恢复原状。
use(TimeCategory) { println 1.minute.from.now println 10.hours.ago def someDate = new Date() println someDate - 3.months }
4、Magic Package。“魔法包”?听起来就很牛的样子,对吧。如果我们遵循magic package的命名规约,我们可以创建自定义的元类(MetaClass):
groovy.runtime.metaclass.[package].[class]MetaClass
比如我们要改变java.lang.String的逻辑,那就实现一个MetaClass,并且这个类的路径是:
groovy.runtime.metaclass.java.lang.StringMetaClass
BTW,Groovy的 MetaClass的一系列子类 能力很强,连static method之类的东西都可以改变。更多的元编程特性,去官网找就好了。
但是回过头来看一下,若论功能和特性的种类和纷繁程度,自然没得说,但是从语言设计的简洁性来说,JavaScript这个老被说“有缺陷”的语言却可以甩Groovy几条街。这并非一个孰好孰坏的评判,正如同接口的设计一样,有人喜欢最简接口,有人喜欢人本接口。有的语言就是喜欢简洁,像我以前提过的Io语言,连关键字都省了;但是像Perl呢,却说:
There’s More Than One Way To Do It.
所以,程序员啊,开心最重要了。(-_-)~…
在下一篇,会比较一下这四位DSL的特性和能力。