2016年2月23日,Spotify宣布正将其技术基础设施和数据服务从目前租用的数据中心迁移至Google云平台(Google Cloud Platform,下同)。
Spotify是一个 流行的 音乐流媒体服务。它目前支持着200万播放列表,为超过7500万听众提供超过2000万小时的音乐。随着该业务逐年成长,Spotify团队正质疑自己是否愿意继续独立运营数据中心。几年前该公司认为公有云服务不能满足他们对于质量、性能和价格的期望,因此他们没有迁移到(公有)云上。Spotify工程和基础设施副总裁Nicholas Harteau,在最近的一篇 博文 中,解释了现在决定迁移到(公有)云上的部分原因:“云服务提供商提供的存储、计算和网络服务已经和传统方式一样,做到了高质量、高性能和廉价。于是,我们就很容易地做出了迁移到(公有)云上的决定”。
最近 Rightscale做的一项“关于云的调查” 表明,在公有云的使用率方面,Google云平台排名第三,位居行业领导者AWS和微软Azure之后。Google在该领域不是领先者,Harteau解释了为什么他们最终选择Google:“真正起决定作用的是,一直以来我们使用Google的数据平台和工具的体验。好的基础设施不只是保存和运行一些东西,它能让我们所有的团队更高效、高有效地工作。Google的数据栈的确帮我们做到了这些”。
Google对成为Spotify的合作伙伴同样很兴奋,在它自己的 博文 中,披露了Spotify将如何使用Google云平台的一些具体细节。就计算服务而言,Spotify将依赖于IOPS SSD和local SSD的高性能存储能力。他们也将利用自动扩容能力以便对“突发的场景”作出响应。其中一个这样的例子是去年11月13日Justin Bieber创造了单日最多音乐流的 记录 ——超过3600万条流于该日被收听。使用公有云模型,Spotify现在可以不用自己搭建基础设施,而是依赖Google提供灵活性来支持高峰负荷。
Spotify也将使用Google的网络服务,如: Direct Peering , Cloud VPN 和 Cloud Router ,以便高效地在这两家公司之间传送PB级的数据。
就数据服务而言,Spotify将放弃Hadoop, MapReduce, Hive而采用包括Google云服务,包括 Google Cloud Pub/Sub , Google Cloud Dataflow , Google BigQuery 和 Google Dataproc 。Google云平台带头的销售工程师Guillaume Leygues解释了Spotify为什么迁移到这些Google服务:“使用BigQuery和 Cloud Dataproc,数据团队可以执行复杂的查询并在一两分钟内而不是数小时内得到查询结果。这将使Spotify能够执行更多频繁、深入的、交互性的分析,指导产品的开发,新特性的测试和更多智能的、面向用户的特性”。
查看英文原文: Spotify Moves Infrastructure and Data Services to Google Cloud Platform