答:首选,业务放到云上并不是一切自动化了,使用云只是服务器、网络等硬件不需要投入,系统由云提供,系统之上的应用、服务还需要自己安装、配置、管理。
第二,一些常用的服务,比如LAMP,一般公有云都有专用的镜像,可以拿来就用,但是如果是自己的业务,比如游戏,公有云肯定不能提供部署好的镜像。
如果需要大规模的部署业务,可以采用以下方案:
1)申请云主机之后,利用脚本部署,这个实际上和自己在物理机上部署的过程是一样的,即将云主机当作物理机来使用,这种方案比较灵活,需要维护的是脚本,需要根据业务变化更新脚本。
2)大部分云都支持自定义镜像,就是自己搞一个模版,然后上传,载通过自己的模版克隆,这种方案比较快,但是需要维护自己的镜像,有变化需要更新镜像。
3)使用公有云的API接口,完成云主机创建、业务部署完全自动化,这种方案需要公有云提供完善的API接口,运维组目前也在开放这样的管理平台,能够将游戏业务及云主机部署的自动部署一条线打通。
答:大部分云上的监控,都是从宿主机上看到云主机的资源占用,一般CPU、网络、磁盘资源使用可以观察的比较精确,但是内存只能看到占用多少,不能看到实际的内容到底是被缓存了还是被使用了,也不能看到SWAP的使用情况,因为从宿主机上也不能探测云主机系统内部的情况。
也有一些公有云、或者第三方服务商,比如监控宝,可以提供监控服务,但是一般都需要在云主机内部案子agent,或者通过snmp这样的协议,抓去云主机的指标信息,这样就有一个信任、安全的问题。
另外,业务指标的监控,一般还需要自己动手,比如游戏业务的人数、游戏币的消耗等,一方面要监控什么指标,自己最清楚,一方面还有保密的需求。
所以,总的来说,云上的监控还是要依靠自己,尤其是业务相关的。
RDS服务实际就是将数据库的创建、管理、快照、性能、备份、恢复等底层维护交给云管理,云只提供数据库的使用接口给用户,这样的好处是用户不需要专业的知识也可以很好的使用数据库,不用担心数据库的管理维护问题。
云上的RDS有两种实施方案:
1)直接使用云主机实例,数据库服务实际是一个特殊的云主机镜像,需要使用就是生成一台数据库云主机镜像,亚马逊目前使用的是这种方案。
亚马逊的RDS提供以下监控指标:
详细情况请参考亚马逊RDS申请,使用简介。
2)使用数据库集群,用户申请数据库的时候,直接生成一个数据库实例,这种方案资源利用率更高,但是有以下难点:
业务的数据库,为保持业务稳定,为保证业务数据机密,建议从申请符合要求的高配云主机,自己搭建数据库开始,并且敏感数据加密,数据库做好应急预案,异地备份工作,RDS可以用做备用数据库。
答:以亚马逊为例,亚马逊实际提供的是一个大数据分析环境的黑箱,申请亚马逊大数据分析集群,会自动帮助搭建好Hadoop、Hive等环境,具体可以参考亚马逊大数据服务简介。
具体的业务方面的大数据指标获取还需要自己解决,如果分析、输出结果也要依靠自己,总大来说,使用亚马逊的大数据分析服务需要有一定的大数据分析知识,有一定的门槛。
答:这个问题同第二个问题,公有云最多只能监控云主机的CPU、磁盘、网络,以亚马逊为例,能提供的报警也只能是根据这些阀值设置报警,报警方式是在控制面板提示,也可以指定将报警发送到指定邮箱。另外,还可以设置达到报警阀值动作,比如关闭、重启云主机。
但是业务方面的报警还需和自己的监控平台结合,然后定制。
答:对业务自动化而言,没有api、sdk的话,也可以按照之前的物理机来操作,有API、sdk等各类接口的话,在新资源准备这一块效率会高很多。
答:业务的高可用建议从业务层面保证,而不是云的层面,原因如下:
有的公有云提供云主机的在线迁移,在线迁移实际迁移的是内存,必须云主机状态健康的情况下才能迁移,出故障的情况下是不能迁移的;
有的云提供云主机的高可用服务,即云主机在一台宿主机上宕机了,很快在另外一台宿主机行自动开机,但是这样的高可用只是系统层面的高可用,不能保证应用恢复;
所以应用层面的高可用首先要从应用的架构开始,设计架构的时候,就假定物理机或者云主机是不可靠的,当一台机器故障的时候,服务可能会降级,但是不会不可用。在申请云主机的时候,要申请冗余数量的云主机,以应对突发状况。
答:公有云内网流量不收费,有些云提供跨数据中心的内网联通,或者和企业内网的联通,需要使用收费专线。一般专线费用比较高。
也可以自己搭建基于公网的VPN,但是一般网络质量不能保证,尤其是在海外。所以一般建议同一业务相关的支撑系统,全部放一个数据中心,保证业务在一个区域内部的独立。
【责任编辑:Ophira TEL:(010)68476606】