近期,准确的说是2015年10月7日,亚马逊发布了一款新的服务,叫做亚马逊Kinesis FireHose。Kinesis FireHose是亚马逊2年前发布的Kinesis服务的后继服务。为了避免产生歧义,旧的Kinesis服务已经被重命名为亚马逊Kinesis流。
亚马逊Kinesis Firehose是一款托管服务,只需要很少的管理。可让用户传输应用、监控和日志数据到 亚马逊S3 (简单存储服务)或是 亚马逊Redshift 表,而无须使用定制的代码。
图片来源:截屏自 YouTube
来自亚马逊Kinesis的总经理,Roger Barga将亚马逊Kinesis Firehose 分解 为以下三个概念:
该服务是在数据被持久化的地方,或者是级联的地方,是面向批处理场景的,在摄入之前时间间隔在60秒到15分钟之间。系统管理员控制缓冲大小和缓冲时间,从而确定移动数据的频率。以下图像描述了这些输入参数是如何被管理的。
图片来源: 亚马逊官方博客
在所支持的特性中也包含了压缩和加密,压缩使用的是gzip压缩,加密是通过亚马逊的 KMS (密钥管理服务)。通过利用中心化的安全服务,也就意味着其它服务也可使用亚马逊的密钥来解密此数据。
像其它的亚马逊服务一样,Kinesis firehose也提供了自动伸缩的能力,但是需要一点系统管理员的参与。它还提供一些高级功能,包括文件轮询、通过Kinesis 代理 的检查点、以及若一个S3的bucket不可用了,允许数据持久化保留24小时。
Kinesis Firehose的目标是那些没有任何代码和配置经验的系统管理员。但是,在更加高级别的场景中,开发者还是可以利用Kinesis Firehose所提供的高级API将之整合进他们的应用中。API所提供的 操作 有:
亚马逊为用户提供了统一的终端,让用户可以使用一套工具来同时管理Kinesis Firehose和流。但是对于熟悉亚马逊Kinesis流的用户来说,这两个服务之间还是有着几个非常重要的区别的。亚马逊按照下面方法进行了 分类 :
查看英文原文: Amazon Release Kinesis FireHose
感谢张龙对本文的审校。
给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入InfoQ读者交流群 )。