Snowflake Computing 正式 发布 了他们的 Snowflake弹性数据仓库 。这是一款软件即服务产品,基于Amazon Web Services提供了一个SQL数据仓库。
在2014年10月的一篇 博文 中, Curt Monash 对此进行了阐述。该服务“是从头构建的(比如,不是以PostgreSQL或Hadoop为基础)”,“采用列式存储,而且只能添加,这在分析型RDBMS中非常普遍”。“数据存储在Amazon S3上大小为16MB的压缩文件中,并根据需要在查询执行时将数据拉入Amazon EC2服务器”。此外,虽然“Snowflake没有索引……但它有‘分区图(zone map)’,又名数据跳读”,这使它可以在为查询提供服务时跳过不必要的文件。
Snowflake的优势来自三个核心的系统特性。首先,Snowflake是一款全托管的SaaS产品,几乎将运维负担降到了零。虽然像Amazon Redshift这样的服务极大地降低了创建数据仓库的负担,但今后仍然会有管理和扩展Redshift的运维负担。
其次,Snowflake的构建是为了支持结构化和半结构化数据的组合使用。例如,它可以接收JSON、XML或Avro格式的任意数据,并且全部支持嵌套和重复数据类型。这使得Snowflake既适用于传统的数据仓库使用场景,也适用于Hadoop或其它半结构化使用场景。
最后,服务弹性为数据仓库市场带来了一种新的、有趣的价格模型。价格依据数据存储大小和每小时使用的计算资源而定。如果不需要计算(比如在夜间),那么就可以缩减计算资源,一直到再次需要为止。Redshift使用快照和恢复提供了类似的功能,但恢复需要花费大量的时间将数据重新复制到Redshift主机。相比之下,Snowflake根据需要向主机复制数据,其启动速度更快。
在另一份单独的公告中,Snowflake宣布,他们在新一轮的融资中从Altimeter Capital、Redpoint Ventures、Sutter Hill Ventures和Wing Ventures获得了4500万美元的投资。而这是建立在2014年10月上一轮融资的基础上。那一次,他们从Redpoint Ventures、Sutter Hill Ventures和Wing Ventures获得了2600万美元的投资。
查看英文原文: Snowflake Announces General Availability of their Cloud Data Warehouse Offering