What: 一种开源软件,将数据计算分布到整个集群的常见商用服务器和存储上
Why: 传统的计算架构是一种沿纵向扩展模式,通过更快的SAN、大容量内存和多级缓存将数据加载到CPU上,成本比较高。
What: Hadoop 把大数据集合拆分区划为小数据集合,再把小数据集合分发到多台普通服务器上,是一种横向扩展模式。
Why: Scalable, Flexible, Cost Effective, Fault Tolerent
Components: Map Reduce, HDFS
点击链接下载全文: 【PPT】大数据分析的新型架构解决方案