转载

初创公司谁来当你们的运维

运维,哎,多么沉重的话题,初创公司的运维,哎,还能愉快的聊天吗?

初创公司谁来当你们的运维

初创公司的运维,如今其实兼技术支持、系统管理员(SA)、网管、网络工程师、研发工程师、架构师,干着这些看似不相干甚至矛盾的工作。

他们的具体工作?

  • 在办公室中安装系统、帮同事排除机器故障
  • 在机房插网线、搬机器、拆服务器箱子
  • 天天盯着N个监控屏幕、8小时一动不动盯着流量图
  • 在 BOSS、开发工程师、网络/系统工程师、DBA 中间跑来跑去进行沟通
  • 在夜半三更收到服务器监控系统的警报,起床赶到机房,节假日陪女朋友收到报警也得赶到机房(当然更多的是没女朋友)

初创公司谁来当你们的运维

。。。。。。初创公司有那种整天斗地主,麻将下棋的吗?(还缺人吗,会打麻将的那种)

上面这些是有一定规模的公司运维的工作,当然初创公司同样的工作也是要运维来做的,而且不乏一人当多人用,即使是这样,当出现下面这些问题或需求时,怎么淡定呢?

  • 系统升级,如升级成 centos7 换成了 systemd,不少运维脚本都得重写
  • 业务上加了中间件,需要迅速监控上
  • 研发,运营,QA,产品经理都找你要业务数据,用户数据,测试数据等
  • 监控的数据要高度可视化,BOSS 一眼也能看懂
  • 业务层面的数据也需要一同监控,运营需要的用户信息也想可视化。。。。

初创公司谁来当你们的运维

碰到上述问题一般怎么办呢?一般做法是找个大的 Zabbix/Nagios 框架,不停的写脚本,进行后期维护,图表不好看,那再接上 Graphite,这些如果熟悉还好,不熟悉的话还得先花一个月(?)去学习,而且规模大了一个人也不一定搞定的了,,,,但作为一个初创企业/团队,需要这么麻烦吗,真的需要弄这么大一个轮子吗,真的需要配备专门的人力去做这么这些事吗,毕竟公司一共就这几个人。。。。。

解放人力或者说把人用在更重要的地方(不是说运维不重要)才是现在公司应该采取的策略,现在市场上有那么多监控软件,找到自己适合的就要用啊啊啊啊啊,把一般运维的工作分散,服务器托管,用第三方工具,例如:

  • IDC 机房改成云服务器,安全也有保障,还提供免费的流量等监控
  • 对海量日志信息进行收集存储,并提供实时搜索功能,辅助快速定位故障
  • 通过第三方 APM 产品进行性能分析,故障诊断,缓慢代码定位等自动化运维任务
  • 收集服务数据,只要有线上服务在运行,服务数据流经过的所有节点产生的数据,都要采集、存储和分析起来,供不同的运维场景使用
  • 业务数据,运营数据通过直接 SDK/API 倒入实时显示图表的工具上,使得所有数据可视化
  • 设置监控告警,实现应用软件、中间件、数据库、主机、网络、存储、云资源的全方位监控告警
  • 所有数据统一平台,谁想看什么数据都有

运维的本质——可视化,当你把应用所用的所有服务器数据,业务层数据,日志等都监控起来,都有相应的可视化的数据,出现问题都有据可查,或者根据已有数据做趋势预测,设置报警,出现问题时第一时间知道(网站反应慢了第一个发现的是运维而不是用户),公司不管哪个部门需要的数据都可以放在一起看,简直完美!

初创公司谁来当你们的运维

硬广来袭,非战斗人员迅速撤离~~~

作为次时代系统监控工具,数据处理平台Cloud Insight 完全能够解决上述问题,目前已经做到:

  • 一键部署,40s完成 Linux/Windows/Docker 系统服务器监控
  • 简单配置,支持30+ 数据库,中间件组件监控
  • 支持 SDK(API 开发中) 自定义上传时间序列数据
  • 仪表盘,自定义你的个人风格仪表盘
  • 告警/事件流,针对全指标设置报警策略

hostmap 等功能还在完善中,功能那么多,放哪张图好呢,好纠结。。。放张仪表盘展示 SDK 自定义上传数据的吧!

初创公司谁来当你们的运维

已经有很多初创公司选择Cloud Insight,因为部署简单迅速,支持的组件也多,可以自定义上传数据,有技术支持来解决问题,有一批(注意这个词是「批」)开发人员在不断增加功能,还有什么理由不用呢?

好啦,回答一下标题的问题:初创公司谁来当你们的运维?当然是 Cloud Insight 啦。。。

Cloud Insight 集监控、管理、计算、协作、可视化于一身,帮助所有 IT 公司,减少在系统监控上的人力和时间成本投入,让运维工作更加高效、简单。想阅读更多技术文章,请访问OneAPM 官方技术博客。

原文  http://news.oneapm.com/ci-ops/
正文到此结束
Loading...