转载

Pivotal 开源其大数据套件

Pivotal决定开源其大数据套件和核心组件，并宣布成立ODP（ Open Data Platform ）组织，ODP旨在倡导和推进大数据领域的开源和标准化。

相比HortonWorks、Cloudera和MapR这些早先的玩家，Pivotal是大数据市场的后来者。但现在，为了解决大数据领域“分裂（fragmentation）和供应商锁定（vendor lock-in）”的问题，Pivotal决定将其大数据套件中的一些产品进行开源。这些产品包括 Greenplum Database （并行处理的数据仓库）、 HAWQ （和ANSI标准兼容的Hadoop上的SQL查询引擎）和 GemFire （分布式内存中的NoSQL数据库）

迈克尔·库基（Michael Cucchi），Pivotal的产品市场总监，对这一过程及其背后的原因提供了更多的细节。按照库基所说，客户虽然喜欢“Pivotal大数据套件的灵活性”，但他们的购买偏好却在发生变化，这其中的原因在于“这些日子客户想尽办法来争取同开源技术相结合，特别是在IT的基础设施领域”。所以结果就是，Pivotal决定开源其大数据套件的核心部分，并且库基也提到他们意图开源其套件的所有组件。

按照库基所说，开源的过程已经“进行了一段时间”，主要是处理一些复杂的事情，比如软件许可、知识产权和产品管治，并为后面的行动提供一些细节。

详细的计划还正在敲定中，但是Pivotal已计划按季度的节奏来开始发布和孵化 Pivotal GemFire 、 Pivotal HAWQ 和 Pivotal Greenplum Database 。现在Pivotal已接近完成GemFire、Greenplum Database和HAWQ代码所有权的结构改造，使其成为最适合大数据社区工作的实体。

Pivotal还宣布成立ODP（ Open Data Platform ）组织，初创的15个公司包括Hortonworks、IBM、Infosys、GE、SAS等，这些公司致力于推进大数据领域的开源和标准化。第一批被ODP关注的组件包括Ambari、HDFS、MapReduce和YARN，而且Pivotal很可能会将其套件的源码委托给ODP来管理。

于此同时，Pivotal的大数据组件还进行了一些服务上的增强：在Cloud Foundry上利用Operations Manager来部署套件的能力；以及同Spring XD（Pivotal的大数据集成运行环境）、Redis和RabbitMQ进行集成。按照库基所说，下一个版本的Pivotal HD（Pivotal的Hadoop发行版）将会同Spark以及“所有可用的Apache项目”进行集成。

查看英文原文： Pivotal Open Sources Their Big Data Suite

正文到此结束