转载

发表于 2015年03月31日
浏览 (781)
评论 (0)

不只是Hadoop：大数据技术的未来道路

在实时数据的世界当中，我们为什么还要执着于Hadoop这一片森林?

不只是Hadoop：大数据技术的未来道路

作为一套以批量处理为主要诉求的架构方案，Hadoop仍然堪称大数据技术领域的荣耀长子。然而根据451研究集团的调查数据显示，其实际普及效果仍然不及显赫的声誉。

那些已经率先部署了Hadoop解决方案的企业可能希望稍稍放慢自己的前进脚步。伴随着Apache Spark以及其它一系列技术方案的出台(包括Storm、Kafka等等)，我们似乎与Hadoop的批量处理思路渐行渐远、转而踏上了一条真正通往实时性未来的发展道路。

批量并非

Cloudera公司的Doug Cutting是一位极为睿智的技术人员，同时也是一位高产的开源开发者。Hadoop、Lucene以及众多其它大数据事务领域的根本性工具都有他的参与。

尽管Cutting坦言实时流技术的重要性毋庸置疑，但他并不在乎Hadoop这一主要面向批量处理任务的方案，并在与我们的采访邮件当中指出：

这并不是说Hadoop的架构设计不应该针对批量处理，因为批量处理确实非常重要。事实上，批量处理、特别是 MapReduce下的批量处理可谓最理想的起步方案，因为其相对容易实现而且具有重要的实际价值。在Hadoop诞生之前，我们根本没办法利用开源软件在商用硬件基础上存储并处理PB级别的数据。Hadoop的MapReduce帮助技术人员在资源容量领域迈进了重要的一步。

我们很难准确衡量大数据的商品化发展趋势对于整个世界的运作到底起到了怎样重要的作用。在Hadoop诞生之前面，我们面临着无数存储与分析容量方面的难题。在这种情况下，Hadoop让我们以可承受的使用成本拥有了这种关键性能力。

总体而言，Hadoop是大数据民主化进程——或者说“走入寻常企业家”的重要前提。

正文到此结束

所属分类：编程技术

本文标签： 企业 UI map 开源 apr 开发进程软件大数据 Hadoop 数据 apache 开源软件开发者
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,992) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,259) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,059) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,963) 评论(0)
Decorators in ES7

浏览(16,581) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,550) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,997) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,912) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,055) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,209) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG