今天,GitHub 2019 年 Octoverse 报告 发布,报告显示:超过 80%的存储库贡献来自美国以外,中国成除美国外贡献最大的国家;TensorFlow 被列为 GitHub 本年度最受欢迎的项目;Python 赶超 Java 成为 GitHub 社区第二热门语言(第一是 JavaScript);数据科学成为最热门领域。
在过去的一年里,GitHub 社区新增了 1000 万开发者,为世界各地 4400 多万个存储库做出了贡献。代码之外,GitHub 社区是一个全球化的、不断增长的贡献者团队,其中 80% 的贡献者来自美国以外。今年,我们看到软件开发比以往任何时候都更需要社区的努力。
一些顶级的开源项目不仅汇集了成千上万的贡献者,它们也是数百万存储库的数据支撑。开发者的工作方式也在快速变化,他们通过全新的方式参与富有激情项目、开源软件并与各地的公司一起更轻松、安全地协作。为了庆祝过去一年所取得的成就,我们来回顾下今年在 GitHub 上构建的代码和社区。
GitHub 社区 2019 年汇集了 4000 多万开发者,其中包括 1000 万新用户;去年创建了 4400 多万个存储库,2019 年在 GitHub 上新建存户库的开发者比 2018 年多了 44%;去年提出了 8700 多万个需求,2019 年首次提需求的开发者比 2018 年多了 28%;去年解决了 2000 多万个问题,完成了许多决策、漏洞修复和 boxes 检查。
开源项目往往是由全球性团队构建的,其中包括维护者、开发者、研究人员、设计人员、作者等等。今年 GitHub 上的每个开源项目平均约有 41 个不同国家和地区的贡献者参与。
自 2014 年起,我们发现越来越多开源贡献者都来自美国以外的国家。
除美国外,今年使用开源最多几个的国家为中国、印度和德国。今年中国成长起来的开发者数量比去年多了 48%。
从数据来看,今年的整体贡献较去年增幅明显,而且增长较快的不仅仅是开源这一项。2019 年亚洲个人和公众贡献和开发者社区都发展迅猛。亚洲总贡献中的 31% 来自中国,但是中国的开发者们却不仅仅只为本国做贡献。
自 2014 年以来,越来越多的贡献者来自美国以外。亚洲的贡献者社区年度增速要超越欧洲和北美。与开源一样,整个社区的全球化趋势每年都在加剧。今年,公共和私人数据库的 80% 的贡献者来自美国以外。
2019 年我们推出了免费的私人存储库,允许开发者在那些目前还没被大众关注的工作申请、业务项目或其他实验中按照自己的意愿进行使用。目前为止,已经形成了全球联动,甚至远在非洲的开发者都可以使用。自 2019 年 1 月发布起,80% 的私人存储库都是美国以外的开发者创立的。其中亚洲创建了 36%,开发者主要都来自于印度、中国和日本。
中国香港连续两年成为贡献者百分比增长最快的地区,而日本贡献者数量也在持续攀升。
TensorFlow 是今年 GitHub 上最受欢迎的项目之一,说是整个 GitHub 的焦点也不为过。在今年的 Octoverse 报告中,TensorFlow 的贡献者总数量达到了 9.9K,位居热门项目榜单第五。而且较去年的 2.2K,这个增长速度也是不容小觑的。据了解,目前在 TensorFlow 社区内,有成千上万的人正在为其依赖项做出贡献,例如 Numpy 、 Pytest 等。
在 2019 年度热门项目排行榜上,Microsoft 的 Visual Studio Code(19.1K)、Azure Docs(14K)、 Flutter(13K)分别占据该榜单的前三甲。除了排名第三的 Flutter,今年最新上榜的热门项目,还有 first-contributions 和 home-assistant。下图是 GitHub 本年度热门项目的具体排名情况:
跨语言和平台构建应用程序和网站的工具包和框架在今年的增长迅速,尤其是 flutter/flutter ,自 2018 年 12 月发布 1.0 版本以来,它已经攀升至现在的第二位。
今年 GitHub 上,最受欢迎的语言依旧是 JavaScript,不过有些令人意外的是,前三位的排名发生了改变:Python 首次超过 Java,成为 GitHub 上第二受欢迎的语言。除此之外,C++ 和 C 的排名都有所下降,C#和 Shell 的排名却是有所上升。
随着 Flutter 的热度一升再升,Dart 成为今年增长最快的编程语言也就不足为奇了。另外,根据 Octoverse 报告,我们还可以看到,针对类型安全和互操作性的静态类型语言,例如 Rust、Kotlin、TypeScript 等,依旧在快速发展着。
本次报告显示,GitHub 的明星领域是 数据科学 。
随着 Python 语言的快速增长,以数据科学专业人员和爱好者为主的新社区正在快速地扩展形成。他们每天都在 GitHub 上使用的相应的工具和框架,其中就包括许多由 Python 驱动的核心数据科学软件包,这些软件包不仅降低了数据科学工作的门槛,同时还成为了学术研究和公司企业的基础项目。
除了 Python 以外,越来越多的社区也开始关注数据科学行业,像深度学习、自然语言处理、机器学习等主题的存储库也随之变得更加流行。从基于“星标”的热度来看,带有数据科学的公共存储库中,有超过一半的存储库基于 numpy 构建,其中有许多存储库都是依赖于 scipy 、 scikit-learn 和 TensorFlow 。
从今年的全球趋势、热门项目和顶级编程语言可以看出,软件发展速度飞快。开发了 30 多年的语言正在寻找新的应用,新的框架正在吸引成千上万的贡献者,人们关注着周围发生的一切,从 Python 包到学术论文,从某一国家地区到全世界。我们可以通过 Apps、GitHub 等更多方式来管理、整合和支持新的 workflows,所以也更加迫不及待地想看构架软件的下一步发展。感谢所有陪伴着 GitHub 走过 2019 年的朋友们,是他们让软件变得比以前更好。你正在创建的代码、社区、工具和技术都会推动我们在未来几年中不断前进。