在5月23号举办的开源中国源创会(图文回顾)上,来自重庆慧谷科技的蒋勇先生分享了主题为“Dockernizing SequoiaDB”的技术专题,分享主要介绍了他们公司如何使用 Docker 制作国内领先的 NoSQL 数据库 SequoiaDB 的镜像的过程,以及有关 Docker 和 Core OS 一些介绍和使用心得,那么笔者就将对他的演讲进行归纳总结,顺便谈一谈 Docker 与分布式数据库结合的必要性。
技术新潮流----Docker
随 着如今开源软件以及开源项目的热潮,Docker 作为如今在技术圈非常火爆的一款开源软件产品,除了开源项目的贡献非常活跃,目前应用也十分的广泛,包括 Redhat 在内的多个操作系统都已经能支持 Docker,而更是无数的软件已经在使用 Docker 镜像进行安装部署。
那么 Docker 是什么呢?
Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。几乎没有性能开销,可以很容易地在机器和数据中心中运行。最重要的是,他们 不依赖于任何语言、框架包括系统。
这是对 Docker 的一个官方解释,简单说,有两个部分:
1) 对于应用程序,曾经我们需要为了不同的系统专门的调整应用程序的代码或者是构造相应的依赖包驱动等等,大大增加了开发量以及开发的难度。现在,Docker 向不同的应用程序,提供了一个统一的环境。
2) 对于服务器,为了支持不同版本的应用,曾经可能需要在物理机上安装多个版本或者不同的 GuestOS 或者说虚拟机。这就大大占用了物理机的性能,影响了最终程序的表现,提高了资源的成本。
使用 Docker 容器的方式,对于应用程序,不需要开发多种多样的版本或者是针对 OS 每个版本的升级再进行代码方面的调整,实现了广泛的兼容性和开发的最简性。同时对于物理机,部署的环境“瘦身”也节约了更多的资源,将更多的资源用于提高应用程序本身的性能。
CoreOS是Docker的不二之选?
之前大概介绍了Docker,那么服务器上面还是需要最基本的应操作系统才能支撑 Docker 容器,那么这么多中的 Linux 内核 OS 究竟哪一个好呢?笔者和很多 Docker 技术专家的的观点就是 Core OS。
CoreOS 是一个基于 Linux 内核的轻量级操作系统,为了计算机集群的基础设施建设而生,专注于自动化,轻松部署,安全,可靠,规模化。作为一个操作系统,CoreOS 提供了在应用容器内部署应用所需要的基础功能环境以及一系列用于服务发现和配置共享的内建工具。
简单说,CoreOS 去掉了大量的非必要的功能,只保留了Server 端需要的最基本功能,真正意义做到了“轻量化”。
此外,CoreOS 还做到了:整体系统升级/回滚方案;容器化所有非系统应用、无包管理器;集群化调度器Fleet;分布式高可靠的KV存储系统 ETCD。
这些特性都让它成为 Docker 生态的首选操作系统。不过最新的消息是,CoreOS 不满足于做 Docker 生态下的一环,它正在推出自己的容器 AppC 计划,想对 Docker 来一招“釜底抽薪”。当然,现阶段并没有出现完全的两者 “分手”,所以对于普通使用者,并没有太大影响。
Docker+分布式数据库
数 据库是每一个软件项目必须的一个部分,作为这样的一类底层基础软件,兼容性、通用性、易用度都是需要考虑的重点。非常遗憾的是,现在的操作系统以及数据库 都没有完全的实现完全的通用。特别对于NoSQL数据库这样的分布式系统,需要部署在多台物理机时,对于通用性要求就更高了。
目前,像 SequoiaDB 已经实现了自动化的安装,大大提升了部署的效率,但是考虑到部署之后的配置以及不同环境下的调试问题,仍然可能会耗费不小的人力物力。 所以基于刚刚提到的 Docker 的优点,作为一个通用的基础软件,NoSQL 数据库的 Docker 化就成了必须。
一个简单的例子,你可以用 docker 把数据库的数据与数据库程序本身分离开:用一个 container A 作为数据存储,然后另一个 container B 运行数据库。当你想升级数据库时,用新的 container C 替换掉container B 即可。
Docker+ 分布式数据库的结合,带来诸多的好处:
1) 部署简单,使用镜像部署非常简单,特别是对集群环境,使用 Docker 镜像的部署还可以再数据库上提前集成 Hadoop、Spark 等架构,真正实现“一步到位”。
2) 方便应用的更新,应用的更新只需要考虑制作一个新的镜像就可以与容器适配,无需重新再调整与底层的配置。数据和程序的分离,这样升级替换等等都不会影响到数据。
3) 操作简单方便,除了底层免除了复杂的与环境进行配置的工作,操作也更加方便,配置好的 Docker 镜像在部署时候只需要一条指令就可以了。
4) 开发、应用环境一致,Docker 让数据库能做到 开发---测试---实施应用 三个阶段的环境是完全一致的。降低开发到应用过程中的工作量,开发出来就能保证实际应用环境上能同样的运行。
5) 系统稳定,因为 Docker 的隔离作用,将应用与 OS 独立开,这样能更好保证整个系统的稳定性。
6) 节省系统资源,系统只需要运行一个统一的环境就可以,不需要占用太多性能去支持运行环境本身,能将更多的系统资源投入到应用当中。
有了这些特性, Docker+ 数据库,将成为一个数据库发展的新方向,Docker 这样的通用性和简单操作解决方案,大大提高了数据库使用的效率,帮助使用者节约了大量成本。
Docker 是如今技术圈的新潮流,开发人员是最乐见于 Docker 的这种应用部署模式,因为应用的生命周期起始于开发人员的开发系统,经过开发,测试,压力测试,等 过程,最终应用发布到生产系统,并可能在不同的生产系统中迁移。应用开发人员对此都会有切身的体会,任何微小的运行环境的错误都会导致应用出现问题,尤其 在讲究快速敏捷的今天,应用模块,新的代码,新的配置,被快速的加入应用的环境中,可能还没等写入到文档,新特性就已经被推送到生产上了。作为一个新的技术,笔者也希望更多的产品能加强与 Docker 的结合,帮助产品更好的使用。