转载

发表于 2016年02月01日
浏览 (715)
评论 (0)

大数据架构概览

Big Data非常复杂，涉及到的技术繁多。我们常“耳闻”的技术，如果MapReduce, Hadoop等处于哪一层次，下图会给你一个整体印象。

图片：databricks.jpg

大数据架构概览

下面是常见的技术简介：

HBase ：是一个分布式的、面向列的开源数据库。其设计理念源自谷歌的 BigTable，用 Java 语言编写而成。

MongoDB ：是目前非常流行的一种非关系型(NoSQL)数据库

YARN ：这是新一代的 MapReduce 计算框架，简称 MRv2，它是在第一代 MapReduce 的基础上演变而来的

Spark ：是一个基于内存计算的开源的集群计算系统，其目的在于，让数据分析更加快速。Spark 是由加州大学伯克利分校的 AMP 实验室采用 Scala 语言开发而成。Spark 的内存计算框架，适合各种迭代算法和交互式数据分析，能够提升大数据处理的实时性和准确性，现已逐渐获得很多企业的支持，如阿里巴巴、百度、网易、英特尔等公司均是其用户。

原文：

https://www.linkedin.com/pulse/100-open-source-big-data-architecture-papers-anil-madan

原文 http://www.thebigdata.cn/JieJueFangAn/29071.html

正文到此结束

所属分类：编程技术

本文标签： 集群数据企业数据库 UI 开源 map 百度 https NOSQL 开发 db sql 谷歌 tab HBase MongoDB Architect Hadoop apr HTML http java 阿里巴巴大数据 src
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,957) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,232) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,035) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,937) 评论(0)
Decorators in ES7

浏览(16,553) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,523) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,969) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,886) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,034) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,185) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG