Pivotal决定开源其大数据套件和核心组件,并宣布成立ODP( Open Data Platform )组织,ODP旨在倡导和推进大数据领域的开源和标准化。
相比HortonWorks、Cloudera和MapR这些早先的玩家,Pivotal是大数据市场的后来者。但现在,为了解决大数据领域“分裂(fragmentation)和供应商锁定(vendor lock-in)”的问题,Pivotal决定将其大数据套件中的一些产品进行开源。这些产品包括 Greenplum Database (并行处理的数据仓库)、 HAWQ (和ANSI标准兼容的Hadoop上的SQL查询引擎)和 GemFire (分布式内存中的NoSQL数据库)
迈克尔·库基(Michael Cucchi),Pivotal的产品市场总监,对这一过程及其背后的原因 提供了更多的细节 。按照库基所说,客户虽然喜欢“Pivotal大数据套件的灵活性”,但他们的购买偏好却在发生变化,这其中的原因在于“这些日子客户想尽办法来争取同开源技术相结合,特别是在IT的基础设施领域”。所以结果就是,Pivotal决定开源其大数据套件的核心部分,并且库基也提到他们意图开源其套件的所有组件。
按照库基所说,开源的过程已经“进行了一段时间”,主要是处理一些复杂的事情,比如软件许可、知识产权和产品管治,并为后面的行动提供一些细节。
详细的计划还正在敲定中,但是Pivotal已计划按季度的节奏来开始发布和孵化 Pivotal GemFire 、 Pivotal HAWQ 和 Pivotal Greenplum Database 。现在Pivotal已接近完成GemFire、Greenplum Database和HAWQ代码所有权的结构改造,使其成为最适合大数据社区工作的实体。
Pivotal还宣布 成立ODP( Open Data Platform )组织,初创的15个公司包括Hortonworks、IBM、Infosys、GE、SAS等,这些公司致力于推进大数据领域的开源和标准化。第一批被ODP关注的组件包括Ambari、HDFS、MapReduce和YARN,而且Pivotal很可能会将其套件的源码委托给ODP来管理。
于此同时,Pivotal的大数据组件还进行了一些服务上的增强:在Cloud Foundry上利用Operations Manager来部署套件的能力;以及同Spring XD(Pivotal的大数据集成运行环境)、Redis和RabbitMQ进行集成。按照库基所说,下一个版本的Pivotal HD(Pivotal的Hadoop发行版)将会同Spark以及“所有可用的Apache项目”进行集成。
查看英文原文: Pivotal Open Sources Their Big Data Suite