感谢各位已经关注我的微信公众号(VIPDOCKER)的同学,正是你们的鼓励让我能继续坚持写下来,如果还没有关注,欢迎你的加入!新近公众被赋予了原创公众号权限,大家可以直接在文章末尾留言了,欢迎任何建议,谢谢!
经历了好几个月起起伏伏,我们团队开发的基于 Dangdang Elastic Job 的分布式调度系统/平台终于成功开源了,开源地址 Saturn 。如果需要加入我们的开源微信群,请联系群主:微信号 duffqiu
身为技术人,折腾技术是人生的一种乐趣,也是一种挑战。上次看老肖为了能更便利的安装Mesos做了个开源项目 Crane 深有感触。不过这个方式是否还是太重了呢?既然技术上都是玩容器的,那么为什么不直接通过容器的方式来折腾Mesos集群呢?当然只是个人测试环境,不要考虑用到生产上啊。
我用的是Mac,所以就想用docker声称的”Native”的docker来快速安装一套Mesos集群。而不是使用虚拟机的方式来做,因为哪样和Linux搭建没啥区别了。谁知道,还是真的不少坑,弄了两天才搞定。自己都觉得有点丢人了。
下面总结一下是如何做的,希望你不用这么折腾就能在Mac上玩转Mesos,同时也不用安装一堆的应用工具如VirtualBox等。我已经将我自己机器的VirtualBox给删除了,因为没有磁盘空间了。
虽然是Mac下测试的,但是既然是以容器的方式启动,对于Linxu和Windows下原理是一样。
后面这些步骤,希望你能在电脑前一步一步参照去做,而不是只是读这个文章。现在太多文章是只能读读,这些没有太多作用。我还是希望技术类的文章真正能帮到大家去操作的。
折腾一个可以测试/试用的Mesos环境是为了测试一下Mesos新版本的unitified container的功能,但是在使用中就发现了,Mesosphere打Mesos Slave的Image中竟然没有 curl
命令,但是不知道为什么Mesos会直接使用curl的方式来拉取镜像Image。(据说会改掉,这个方式太low了)所以在开始搭建环境之前,想将mesosphere的Mesos Slave的Image补充curl命令
如果需要拉这些Image,最好用国内的代理镜像仓库,如Daocloud,不过正是因为用了这个代理镜像库,给我造成了另外一个坑。后面讲
前面讲了,需要给Slave镜像补个 CURL
命令,对应的Dockerfile为:
FROM mesosphere/mesos-slave:1.1.0-2.0.107.ubuntu1404 MAINTAINER duffqiu@gmail.com RUN apt-get update && apt-get install -y curl && apt-get clean
然后运行命令打包: docker build -t mesos-slave .
后面就使用这个包而不是mesosphere的官方包来运行。不过还是得吐槽下Mesosphere,做为容器生态体系的领军公司,这个容器image打的实在是不够水平。
搭建环境的目的是测试 Unitified Container
,它有个最大的优势是直接支持Docker Image,只需Slave启动的时候配置Registry的地址就可以使用镜像的国内代理地址(启动需要的参数: MESOS_DOCKER_REGISTRY
),原本挺好的设计,谁知道这里也有个坑,一点文档都没有。那就是它默认使用的是 HTTPS
传输,但是我一开始使用的是daocloud的代理库,它是http的最后造成拉包总是不成功。后来在Yu jie@Mesosphere的指导下,才知道,目前Mesos的实现是如果需要用http,则需要在配置url后面加上80端口。如果你用的私用仓库不是80端口,那么没有办法,因为Mesos还没支持类似Docker daemon那样的 insecure-registry
配置。所以最后在网上找了个阿里的registry地址来测试。估计这个地址的流量要猛涨了。-:)
另外需要提示一点,就是用容器启动Mesos,对应的官方文档对应的配置参数,都可以用环境变量的方式配置,对应环境变量名的规则是MESOS_
--docker_registry
,而环境变量是
MESOS_DOCKER_REGISTRY
一开始就被Docker的官方文档误导了,以为‘Native’就真的是类似Linux支持哪样,直接使用了Mac的能力来做Docker。好在jason@uber指导了一下,豁然开朗。其实Mac Native还是有VM的,只是从用户体验上让你感觉不到而已,对此相对于Mesos,还是要为Docker的用户体验点个赞。就像你在Mac下找不到docker daemon一样。其实docker daemon还是真实存在。但是这个docker daemon配置已经被hardcode了,你没法更改。同时有个问题,在Mac下这个VM占用的空间会一直增大,无论你是否删除了docker image。这个文件存放在 /Users/macbook/Library/Containers/com.docker.docker/Data/com.docker.driver.amd64-linux/Docker.qcow2
。之前犯了个低级错误,将这个文件一下子扩大了10G,而我的Mac的硬盘又小,害我一直要删文件腾空间。
Docker build会将Dockerfile所在的目录下的内容都装载进来后才开始打包。所以千万千万要给Dockerfile一个独立的目录。不然就会像我一样无端将Mac下虚拟机扩大了10G空间。
虽然Mac下的Docker还是用的虚拟机的方式,那么如何进入这个虚拟机呢?可以使用以下方式:
docker run -it --rm --privileged --pid=host --net=host -v /:/rootfs --entrypoint=/bin/sh alpine cd /rootfs chroot /rootfs
这个时候,你就可以查找出dockerd的进程了
ps -ef|grep dockerd
可以看到对应的dockerd的运行参数,这也就解释了为什么Mac下的docker不能配置tcp端口了,因为这个已经被这个VM的配置写死了,而且还改不了。(如何有任何方式可以改,请留言告诉我)以下是Mac的dockerd的启动命令
/usr/bin/dockerd --pidfile=/run/docker.pid -H unix:///var/run/docker.sock --swarm-default-advertise-addr=eth0 --debug --storage-driver aufs
同时可以查看这个虚拟机的磁盘情况,这里就比较清晰展示哪些是VM的磁盘,哪些是Mac的磁盘了。同时,也可以看见,docker用的VM是开了50几G的动态空间的,默认可以最大占用主机50几G的,这个大家一定要注意,不然哪天机器没有磁盘空间了都不知道用到那里去了。后续如果需要清理这些空间,只能卸载Docker再装一次。
最近通过阅读微信文章,找到一个本机管理Docker Daemon的一个好的带界面的Container: portainer/portainer ,可能需要翻墙。但是这个需要通过tcp的方式链接docker dameon,所以需要想个办法将Mac下的unix socket转为TCP。这个可以使用socat工具。Mac下可以通过port工具安装,不过最好还是翻墙安装,不然又是一个折磨。
socat的用法:
socat TCP-LISTEN:2375,range=192.168.31.254/32,reuseaddr,fork UNIX-CLIENT:/var/run/docker.sock
然后启动portainer:
docker run -d -p 9000:9000 --restart always portainer/portainer -H tcp://192.168.31.254:2375
192.168.31.254
是你的机器ip,需要根据你的实际情况替换
这里需要注意的是,不要使用127.0.0.1的方式链接docker,因为在portainer里的127.0.0.1不是主机的127.0.0.1
下面是portainer的一个界面预览,还是相当清爽的,值得使用
另外可以在Mesos的集群的每个Slave主机上装个这个容器,然后在集群的管理系统中嵌套改页面,这样就可以监控和管理主机的容器/Image等了。同时它还提供了WEB Terminal,可以直接进入容器,方便调试,非常好用。
到此,之前遇到的坑都列举出来了,我们正是开始进入正题,安装Mesos+Marathon集群
docker run --name zookeeper --restart always -d -p 2181:2181 -p 2888:2888 -p 3888:3888 zookeeper
启动单机版本的Zookeeper,如果需要保留Zookeeper的数据以备下次启动继续使用,则必须将zookeeper的data路径放到主机的目录下,这个具体就不详细描述了。
telnet 10.100.150.22 2181
连接到Zookeeper,并输入 stat
来验证是否安装正确。
docker run -d -p 5050:5050 / -e MESOS_PORT=5050 / -e MESOS_ZK=zk://192.168.31.254:2181/mesos / -e MESOS_QUORUM=1 / -e MESOS_REGISTRY=in_memory / -e MESOS_LOG_DIR=/var/log/mesos / -e MESOS_WORK_DIR=/var/tmp/mesos / -e MESOS_HOSTNAME=192.168.31.254 / mesosphere/mesos-master:1.1.0-2.0.107.ubuntu1404
这里有一点需要注意:需要设置MESOS_HOSTNAME为你主机的ip地址(例子是我的机器ip,你需要根据实际情况替换),不然打开 Mesos Master 地址的时候总是不稳定。
只要能打开mesos的UI地址,并且能在界面打得开LOG则证明安装成功了。
这里就需要用到我之前提的自己打包的Mesos Slave镜像了,因为需要用到CURL命令来启动Unified Container。同时我也希望Slave能够同时使用Docker Container或者Mesos Container。
docker run -d --privileged -p 5051:5051 / -v /usr/bin/docker:/usr/bin/docker / -v /var/run/docker.sock:/var/run/docker.sock / -v /sys/fs/cgroup:/sys/fs/cgroup / -e MESOS_PORT=5051 / -e MESOS_MASTER=zk://172.17.0.3:2181/mesos / -e MESOS_SWITCH_USER=0 / -e MESOS_CONTAINERIZERS=mesos,docker / -e MESOS_LOG_DIR=/var/log/mesos / -e MESOS_WORK_DIR=/var/tmp/mesos / -e MESOS_IMAGE_PROVIDERS=docker / -e MESOS_ISOLATION=filesystem/linux,docker/runtime / -e MESOS_DOCKER_REGISTRY=https://r6w9c7qa.mirror.aliyuncs.com / -e MESOS_ADVERTISE_IP=192.168.31.254 / -e MESOS_ADVERTISE_PORT=5051 / -e GLOG_v=1 / mesos-slave
这里有几点注意点:
MESOS_MASTER
配置可以直接写Mesos Master的http地址就可,不用连接Zookeeper了。或许这样可以减轻Zookeeper的压力。不过依然可以使用zookeeper的方式链接。这里的地址使用容器间的地址就可。不过文档没有说如果是配置Master的http地址的话,如何支持多台Mesos地址。(据说目前http方式只能用于测试,生产的话要用zk的链接,因为zk支持多个服务器配置) MESOS_CONTAINERIZERS
需要指明mesos和docker,这样才可以运行docker container以及mesos container IMAGE_PROVIDERS
指明都是用docker镜像,这个是给Mesos container用的 MESOS_ISOLATION
使用Mesos Container,则必须制定这两个隔离器 MESOS_DOCKER_REGISTRY
指明用Unified Container需要的docker image的拉取地址。注意我前面提到的坑。这个和docker container没有关系 MESOS_ADVERTISE_IP
和 MESOS_ADVERTISE_PORT
公开对外的ip和对外的port。如果不是用这个,在容器部署里,无法在Mesos master上获取到agent的log MESOS_HOSTNAME
,因为设置了就无法在界面看见agent的LOG了 docker run -d --privileged -p 5052:5051 / -v /usr/bin/docker:/usr/bin/docker / -v /var/run/docker.sock:/var/run/docker.sock / -v /sys/fs/cgroup:/sys/fs/cgroup / -e MESOS_PORT=5051 / -e MESOS_MASTER=zk://172.17.0.3:2181/mesos / -e MESOS_SWITCH_USER=0 / -e MESOS_CONTAINERIZERS=mesos,docker / -e MESOS_LOG_DIR=/var/log/mesos / -e MESOS_WORK_DIR=/var/tmp/mesos / -e MESOS_IMAGE_PROVIDERS=docker / -e MESOS_ISOLATION=filesystem/linux,docker/runtime / -e MESOS_DOCKER_REGISTRY=https://r6w9c7qa.mirror.aliyuncs.com / -e MESOS_ADVERTISE_IP=192.168.31.254 / -e MESOS_ADVERTISE_PORT=5052 / -e GLOG_v=1 / mesos-slave
在同一台机器启动多个Slave,这里只需要更改暴露的端口就可以了
docker run -d -p 8080:8080 mesosphere/marathon:v1.3.6 --master zk://172.17.0.3:2181/mesos --zk zk://172.17.0.3:2181/marathon
然后在Mac主机访问 Marathon UI 就可
通过界面配置的方式启动一个docker容器应用,对应的json为
{ "id": "testapp", "cmd": " while true;do echo hello;sleep 1;done", "cpus": 1, "mem": 128, "disk": 0, "instances": 1, "container": { "docker": { "image": "centos", "network": "BRIDGE" }, "type": "DOCKER" } }
默认Marathon启动的是docker容器。启动后,可以在Mac上 docker ps
看到这个运行的容器了。
因为现在Marathon的界面还没有得选择Mesos容器类型,所以需要在JSON模式修改,将之前的JSON配置的type改为 MESOS
就可
{ "id": "mesostest", "cmd": "while true;do echo hello docker >> txt.log ;sleep 1;done", "cpus": 1, "mem": 128, "disk": 0, "instances": 1, "container": { "docker": { "image": "102010cncger/centos:v1", "network": "BRIDGE" }, "type": "MESOS" } }
上面的image名字是因为我随便搜索了个阿里的registry地址,所以要通过 curl https://r6w9c7qa.mirror.aliyuncs.com/v2/_catalog
获取它存在的镜像名字,然后再通过 curl https://r6w9c7qa.mirror.aliyuncs.com//v2/102010cncger/centos/tags/list
获取它的tag,从而指导它可用的镜像是 102010cncger/centos:v1
因为Slave用的是ubuntu,我又不太了解怎么装个nsenter,所以只能用一下方法进入到这个Mesos容器中
docker exec -it <slave container id> /bin/bash
从Mac进入到Slave的容器中 ps -ef |grep mesos-executor
找到mesos executor的执行命令参数,获得容器的具体路径 --rootfs
那段,如我的例子 /var/tmp/mesos/provisioner/containers/dd2a4567-4ad5-4b50-bdee-2351d0b863e8/backends/copy/rootfses/a913d575-9e5f-4384-b4bd-4ed36618f157
chroot /var/tmp/mesos/provisioner/containers/dd2a4567-4ad5-4b50-bdee-2351d0b863e8/backends/copy/rootfses/a913d575-9e5f-4384-b4bd-4ed36618f157 /bin/bash
,这样你就进入mesos的这个容器了的shell,但是无法获取这个容器的其它能力如网络等. ubuntu14.04安装nsenter的方式,这里谢谢黄浩松@shopee.sg
用docker 容器的方式来安装nsenter,步骤是
docker exec -it <slave container id> /bin/bash
docker run --rm -v /usr/local/bin:/target jpetazzo/nsenter
,而是要使用导出nsenter的方式 docker run --rm jpetazzo/nsenter cat /nsenter > /tmp/nsenter && chmod +x /tmp/nsenter
nsenter --target $PID --mount --uts --ipc --net --pid /bin/bash
进入容器, $PID为容器对应的进程pid,通过 ps -ef
查看,完整的容器镜像的cmd那个进程id 到此Mesos container的安装部署测试完成了。不过这里还是需要吐槽一下Mesos Container,这样启动容器,就算你配置上是 "network": "BRIDGE"
,但是如果没有配置CNI,还是没有bridge的,只能是host模式。
正好我的公众号开通了打赏,看在写的这么幸苦以及亲自验证的份上,请多多支持,赞赏一下吧,谢谢!