上周晚些时候,Hortonworks公司的Hadoop Data Platform(HDP)发布了一个重要更新,HDP可以运行于Google Cloud Platform。两家公司的工程师通力合作,以保证谷歌云获得更好的HDP集群支持。
项目工作中的重点包括整合“bdutil”(用来管理在谷歌计算引擎上Apache Hadoop实例的命令行脚本)和Apache Ambari(Hadoop管理项目)插件来提供和管理基础设施,并为HDP提供谷歌云存储连接器。Hortonworks技术渠道主管Ajay Singh特别在 博客 撰文公布此事。
Hortonworks,几年前从雅虎剥离出来,是最早一批开拓企业Hadoop市场的公司之一,它将开源技术应用到了软件业务。该框架使用户从便宜的商用服务器转向功能强大的计算集群,后者的好处是可以通过并行处理技术同步处理大量数据。而两家公司的合作意味着使用谷歌云服务器处理会更加容易。
开源Hadoop是多家公司创建的基础,Hortonworks便是这一领域的领导者之一。其他主要参与者还包括Cloudera和MAPR。
谷歌的投资部门谷歌风投和英特尔都是Cloudera的重要投资者。谷歌同样也是MapR的主要支持者。
Cloudera和谷歌最近合作致力于在实时大数据分析流处理框架Spark上运行谷歌数据流系统。
谷歌接触Hadoop还有个有趣的故事。去年七月,谷歌表示要 停止使用MapReduce ,MapReduce是谷歌自己创建的用于充当Hadoop基础的架构,然而,这并没有影响Hadoop的势头。
Hortonworks一直忙于IPO以及发展合作伙伴,比如上个月刚和一家名为Talend的公司建立了合作关系。
与谷歌的云Hadoop合作表现了几个趋势:因为经济和灵活,大数据的功能正在向云无限靠近;另外,企业正迎来大数据的开源技术。
其他大型云提供商,如Amazon Web Service,有大量易于理解的Hadoop配置。亚马逊的Elastic Map Reduce是在EC 2上提供Hadoop框架的管理服务。MapR平台在EMR上也可使用。
还有像Xplenty这样的创业公司提供了在AWS上易于使用的Hadoop。于是,在AWS上部署Hortonworks也成为可能。
“随着谷歌云平台和Hortonworks数据平台的建立,企业可以从无限扩展和由社区驱动的开源创新企业级平台中受益颇多,”Singh写道。
原文链接: Hortonworks Becomes Official Google Cloud Feature (译者/李贻丽 责编/钱曙光)