转载

Insta360容器化&DevOps之路

作为一个全景/VR创业公司，随着公司人员增加以及全球化方向转变，刀耕火种的CI/CD方式已经不能满足当前的需求。综合考虑当前的人员状况与技术架构的拓展性后，我们采用一套以阿里云为基础，Docker为核心，第三方服务为工具的开发、测试、部署流程，以及内部的代码提交，版本管理规范。

作者

> 苏依（杨贺强）

高级前端工程师兼Web组技术负责人，专职前端技术选型与架构设计。

就职于Insta360（全球360°全景相机（VR相机）全景领跑品牌，深圳岚锋创视网络科技有限公司）

背景

我司是一家集硬件研发与软件开发为一体的互联网创业公司。2016被称为全景/VR元年，预示了机遇到来的同时，也注定了我们将会面临一些列前所未有的问题，其中坑点无数，但不在本文讨论范围呢，废话不多说，我们直奔主题。

我司目前对用户开放的业务为主要包含以下三块：

视频图片分享（2C）
全景 / VR直播（2B）
新闻媒体合作（2B）

其中视频图像分享针对C端用户，用户遍布全球，要求各地用户都能够方便快速分享，同时也要求较好的浏览体验，由于点对点分享的特性，该部分流量正常情况不会太大；但是新闻媒体又扮演了特殊角色，例如11月25日，由于凤凰网首页嵌入我司分享页，从8:00至9:30期间，持续一小时多的(n)Gbps流量&以及每秒(n)K请求数几乎扮演了DDOS身份，瞬间拖垮后端统计服务器，导致普通用户完全无法访问。同理，全景 / VR直播目前虽然为测试功能，但仍存在潜在风险。故而要求我司能够建立快速的相应机制，以及可用预备方案。

挑战

面临的挑战简单罗列如下：

集群化部署
差异化部署
全球化部署
环境差异大
资源利用率低
项目数量&语言增加

具体到各个内容本身，首先我们需要前端服务器在各个region集群化部署，分摊访问压力，同时集群内在某些情况下需要同时提供线上测试环境（不同于常规的测试环境，是完全等同于正式环境的测试版），从而需要差异化部署能力支持。

其次，由于我司全球化战略，业务不光要考虑国内用户，同时也要为海外用户提供一致的体验，故而要求全球化部署。

环境差异大，是指采用前后端分离的方式进行开发后，前端及Web服务包含redis+nodejs环境，后端同时存在php+java+python+c等，传统方式部署已经无法满足及亚快速响应的需求，采用ansible虽然能够满足需求，但配置繁琐，故而也被放弃。

同时，考虑业务的拓展性，单机部署上述各种环境时，需要预留一定资源作储备，放置突发情况；即使采用镜像的方式对当前环境进行打包，在遇到突发情况时，还原依然需要较长时间，响应速度太慢；综合前几点考虑，采用了保证稳定性与可用性，降低资源利用率低的方式。

最后不得不说的是，从最初的几个项目到如今的几十个项目（日常更新10~20），如果继续按照以往的方式，则只能专人专职负责部署业务。对于一家创业公司来说，将更多的精力用于开发新功能与为用户提供更优体验，显然更为重要。综上所述，所有问题都要求我们转变原始的CI/CD方式，采用一种更加轻量，更加简单的方案势在必行

方案

ssh/fabric
ansible
docker

ssh/fabric是我最初尝试的方案，但是需要进行一些列的开发，基本在实验阶段就被放弃；ansible固然强大，但是也依然不利用上述挑战的解决，主要问题如下：

配置繁琐
扩展性差（相对而言）
可靠性差（使用ssh方式，受网络影响大）

而Docker也就是在此时成为可选方案之一，其优势不言而喻：

灵活将应用于系统容器化，不需要额外依赖
便捷任意linux发行版配置docker engine即可启动
开源&免费开源/免费低成本，linux内核驱动
轻量仅需添加或减小镜像即可，在一台服务器上可以布署多个容器
环境一致性镜像本身即包含运行环境，避免由于环境不一致带来的各种异常与风险

架构/容器化

第一代架构

ssh
fabric/ansible

刀耕火种的ssh方案与docker实验阶段，目前已经全面弃用。

第二代架构

使用阿里云VPC，内部使用ansible管理服务器
通过ansible运行docker命令进行容器进行部署
后端服务&rabbitmq，依然使用传统方式部署

第三代架构

第三代架构仍处于完善阶段，上图简单描述了我司三个region服务于应用的分布：

杭州/美西
- 前端服务
- 数据存储
- 镜像仓库
- 图像处理/视频转码 worker
- 服务ip地址
- 服务域名信息
香港
- 数据中心（数据库）
- 中间件（第三方服务）
- 统计系统
- 消息队列

前端服务

其中前端服务为主要为浏览服务，由cdn + slb + (nodejs+redis) 组成:

用户访问域名后通过dns-load-balancer进行第一次负载，解析到cdn的不同cname，cdn判断请求类型：

资源 mp4/mp3/jpg/png返回客户端
请求转发到slb，slb通过加权轮训方式进行二次负载
请求到达前端服务器(nodejs)，通过内部redis集区获取数据
数据存在则返回，不存在则请求数据中心并缓存，再返回客户端
作为cdn源站，通过nginx/haproxy反向代理oss，走阿里云内网对外提供媒体资源

数据存储

我司业务目前分为两类：

oss 使用aliyun oss存储服务，存储媒体资源如视频与图片
volume，使用阿里云ossfs搭建的docker volume，存放持久化数据

图像处理

视频处理目前使用了阿里云mts转码服务做普通视频视频转码，同时，由于行业特殊性，需要对全景视频和图像进行一些列处理，由python+celery+c配置的worker处理，该部分内容由香港数据中心的rabbitmq进行统一管理，消息到达rabbitmq后自动进行分发，由空闲的worker处理并通过mq返回结果（之前也有尝试过http方式进行返回，但由于网络环境较为服务，可能出现http请求无法达到，自行处理错误逻辑较为麻烦，因而使用mq，设置一定过期时间，如果无法获取结果，则重新发送任务），当前架构的优化版本mq已经由kafka代替。

kafka在内存占用上，大大超出rabbitmq，单机部署rabbitmq，当queue数量达到1w左右则开始出现无法继续处理的情况，同配置机器安装kafka，测试期间100w左右任务，内存状况依然完好。

配置服务

配置服务其实是简单的redis主从，主要功能是维护一些配置信息，如服务的ip地址（实测结果中，海外各类运营商dns解析有严重问题，故而放弃域名使用ip）；服务的配置信息，如服务名称，前端服务请求数据结果变更等；使用redis的原因也是一样，能够自我维护状态的，尽量放弃人工干预，因为该部分占用资源较小，master做持久化，slave直接运行即可，使用alpine镜像，仅仅10m左右。