《 AirFlow加入Apache孵化器 》
AirFlow加入Apache孵化器工程。AirFlow是一个工作流和调度系统,用来管理数据管道。由AirBnb开发并在内部使用,于去年九月份开源。
《 Apache Apex成为Apache顶级项目 》
Apache Apex是基于Hadoop的流处理和批处理引擎,目前成为Apache顶级项目。
《 Apache Beam将统一大数据平台的开发 》
Apache Beam将统一大数据平台的开发。一直以来,大数据开发涉及到各种框架,比如,Hadoop、Storm、Spark和Flink等,基于这些框架的开发要求的技术栈都各不同,这对开发者来说开发成本比较高,在Beam的统一下可以实现写一个程序既能在Hadoop中运行又可在Spark中运行。
《 开源项目:Spark分布式训练深度神经网络 》
用Spark分布式训练深度神经网络,可直接在已有Spark集群上安装,简单易学习。
感谢杜小芳对本文的审校。
给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号: InfoQChina )关注我们。