转载

监控进程

有时候，进程突然终止服务，可能是没有资源了，也可能是意外，比如说：因为 OOM 被杀；或者由于 BUG 导致崩溃；亦或者误操作等等，此时，我们需要重新启动进程。

实际上，Linux 本身的初始化系统能实现简单的功能，无论是老牌的 SysVinit，还是新潮的 Upstart 或者 Systemd 均可，但它们并不适合处理一些复杂的情况，比如说：CPU 占用超过多少就重启；或者同时管理 100 个 PHP 实现的 Worker 进程等等，如果你有类似的需求，那么可以考虑试试 Monit 和 Supervisor ，相信会有不一样的感受。

让我们看看 Monit 的用法，假设我们要监控 Nginx 进程，一旦其 CPU 使用率连续 5 次超过 80% 的话，就重启进程，此时就可以按照如下方式设置：

check process nginx with pidfile /var/run/nginx.pid     start program = "/etc/init.d/nginx start"     stop program  = "/etc/init.d/nginx stop"     if cpu is greater than 80% for 5 cycles then restart

Monit 根据 pidfile 轮询对应的进程是否健在，满足条件就执行 start/stop 等操作。如果进程本身不存在 pidfile，那么也可以使用 matching 语法来匹配进程。

再让我们看看 Supervisor 的用法，假设我们要监控 100 个 PHP 实现的 Worker 进程，用来提供 Gearman 之类的服务，由于 PHP 本身运行模式的缘故，为了避免严重的内存泄漏问题，我们设定 PHP 进程服务一定次数或一段时间后就自动退出，这时候我们需要启动新的 Worker 进程，以便总数维持不变，此时就可以按照如下方式设置：

[program:worker] command=/usr/bin/php /path/to/worker.php process_name=%(program_name)s_%(process_num)02d numprocs=100 autostart=true autorestart=true

如果说 Supervisor 有什么缺点的话，那么首当其冲的是对使用者而言它不够透明：很多进程都是后台运行的，但 Supervisor 却要求必须改成前台运行。好在多数服务都提供了对应的配置选项，如果没有的话，我们也可以使用一些变通的方法：

How can I supervise a daemon that puts itself into the background?
Managing daemons with supervisor: no foreground mode available.

不管用什么来监控进程，如果监控者本身挂了，那么被监控者无疑就失控了。此时需要考虑如何监控监控者本身，这似乎是一个递归问题，不过文章开头我们说过，Linux 本身的初始化系统就能实现简单的监控功能，以 SysVinit 为例，编辑 /etc/inittab 文件：

SU:2345:respawn:/usr/bin/supervisord -c /etc/supervisord.conf

改好后运行「init q」命令让其生效，然后 kill 掉 supervisor 进程看看会不会发生奇迹。

注意：记得事先我们要配置 Supervisor 为 nodaemon=true 噢。

正文到此结束

所属分类：编程技术

本文标签： Nginx 时间 PHP 需求 linux 管理配置进程 tar tab REST
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

监控进程

热门推荐

相关文章

说给你听

本文目录

随机标签

书籍教程

近期评论

网站信息

其他链接

关于本站

问题交流