最近, Linguist项目 统计了代码托管网站GitHub上各类编程语言的热度。下图展示了自2008年以来各编程语言的排名状况及它们的相对热度。
从上图中可以看出,Perl已经不再流行,C#开源之后流行度迅速上升,JavaScript高居榜首,Java则一路攀升至第二名,“最好的语言”PHP没有变化。 GitHub的Ben Balter说 ,十年前Java是一个闭源开发的语言,银行和企业用来开发应用;如今Java是构建开源软件的最流行语言之一。Balter认为,Java的崛起是Google选择用它构建Android的结果。作为当今智能手机最广泛使用的操作系统Android的兴起使得Java开发者增多,同时企业里对版本控制平台的需求大大增加,这些因素都可能促成了现在这样的结果。
这个排名是基于GitHub上公共和私有库使用的语言及其创建时的年份统计的,该排名并没有统计分支中的情况。由于没有统计每一个仓库中的分支,统计得到的数据并不是各种语言的使用总量。另外,这种方法没有对统计对象进行加权,比如说,GitHub上有相当多不同语言的Hello World项目仓库,它们之所以被创建,仅仅是因为使用者作为新手学习时进行的尝试。如果不把这一类意义不大的仓库剔除,编程语言使用情况的统计结果就会出现偏差。
如果采用加权法对统计进行改进的话,大型项目的权重需要设置得比小型项目的权重更大。这是因为,小型项目(如batch files、css、html、examples、tests等)往往约定俗成地使用某一种特定的语言,然而对于大型项目,却有多种语言可以选择。至于实现项目时到底选择哪一种语言,那么就要看程序员的考虑和喜好了,这也才是编程语言使用率统计的重点所在。新创建的(大型)项目相比于过往创建的(大型)项目,其权重也可以更大。将项目的代码行数和创建日期作为加权因子同时在统计中考虑,能够更好地体现各语言的使用率趋势。
感谢魏星对本文的审校。
给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号: InfoQChina )关注 我们,并与我们的编辑和其他读者朋友交流(欢迎加入InfoQ读者交流群 )。