转载

ArangoDB、MongoDB和Neo4j性能比较

　　Claudius Weinberger 是 ArangoDB 的首席执行官。在他看来，原生多模型数据库是指数据库引擎兼有文档、图和键/值数据模型，提供了涵盖三种模型的统一查询语言和 API，并允许在单个查询中混合使用三种模型。他认为，多模型数据库可以与文档存储及图数据库（比如，MongoDB、Neo4j）一较高下。为了支持这个观点，其团队对 ArangoDB、MongoDB 和 Neo4j 进行了性能测试。近日，他发表了一篇博文，介绍测试过程和结果。

　　测试所用的数据集是一个社交网络快照，由斯坦福大学的 SNAP 提供，其中包含 160 多万个顶点（代表个人资料）和 3000 多万条边（代表朋友关系）。他们用顶点数据做文档数据库测试，用顶点和边的综合数据做图数据库测试。测试场景如下：

单次读：单文档（个人资料）读取（10 万次）；
单次写：单文档写入（10 万次）；
聚合：计算社交网络的年龄分布，即每个年龄出现多少次；
相邻顶点：为 500 个顶点查找直接相邻顶点以及相邻顶点的相邻顶点；
最短路径：在一个高度连通的社交图中查找 19 条最短路径。

　　其中，所有数据库都执行相同的操作，所有测试用例都是用 JavaScript 实现，在 node.js 中运行。

　　测试结果以 ArangoDB 的吞吐量指标为基准，百分比越小表明吞吐量越高，相反，百分比越高表明吞吐量越低：

ArangoDB、MongoDB和Neo4j性能比较

　　可以看出，测试结果支持 Weinberger 的观点。MongoDB 的单文档读/写更快，但 ArangoDB 的聚合和查找相邻顶点效率更高。由于在 MongoDB 中测试最短路径查询需要完全在客户端实现，所以他们没有对 MongoDB 做这项测试。令 Weinberger 吃惊的是，Neo4j 并没有在查找相邻顶点的测试中胜出。

　　在 Hacker News 上，部分网友对测试的客观性提出了质疑。网友 harunurhan 提出：