Apache Hadoop 2.0 今天发布了首个 alpha 版本,该版本还不能用于生产环节,还有一些很重要的开发没完成。该版本包含很多新的很重要的功能:
除了新功能以外还有一些重要的改进,例如 HDFS Snapshots 和 auto-failover for HA NameNode, 另外在稳定性和性能方面都有提升。
可访问 Apache Hadoop Releases 来下载 hadoop-2.0.0-alpha ,同时访问 Documentation 获取更详细关于该版本的信息。
Hadoop并不仅仅是一个用于存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的框架。
下图是Hadoop的体系结构: