作者appleboy46 (小恶魔)
看板Soft_Job
标题[心得] 自动化监控网站运行服务 - Gatus
时间Sun Mar 27 06:47:13 2022
部落格:
https://bit.ly/docker-gatus
影片:
https://www.youtube.com/watch?v=Fdgp3NpsPIs
## 前言
不知道大家在部署网站後,怎麽明确让大家清楚知道现在网站的运行状况,就像 GitHub
就是提供整体运行的网页,监控常用的操作指令,像是 Git Operations, Webhooks 或
GitHub Actions 等服务状况。让开发者遇到问题的时候,可以即时查看现在状态做出相
对应动作。而类似这样的线上服务很多,像是 Atlassian 的 Statuspage 或 PingPong
等,更多免费服务可以直接参考 awesome-status-pages。而本篇要介绍一套开源软体
Gatus,它是用 Go 语言撰写出来的,非常轻量。
## 什麽是 Gatus
Gatus 提供一个轻量的监控服务健康网页,让开发者透过简单的 HTTP, ICMP, TCP 等
Protocol 来监控服务状况,并且根据网页回应的 Status Code 或 Response time 及
Body 内容来决定网站是否健康,如果发生异常,可以设定不同的 Alert 像是 Slack,
Email, Teams, Discord 或 Telegram 等常用的即时软体。可以参考此连结看看
Dashboard 实际状况。
## 为什麽选择 Gatus
> Why would I use Gatus when I can just use Prometheus, Alertmanager,
Cloudwatch or even Splunk?
第一点各位开发者可以想看看,如何监控整个服务的状况,而不是等到客户遇到问题,你
才知道状况的发生。而 Gatus 可以从客户角度对每个功能进行配置检查,团队可以根据
重要的服务或接口进行监控,即时数据整理,才可以让团队比客户更早知道状况。
第二点团队可以想看看,如果从 Prometheus 开始入手,是不是门槛过高,团队真的有多
余的时间跟人力可以做到完整的监控,用 Prometheus + Alert 到 Grafana 监控页面,
需要花费不少时间跟人力才能完成,而这些指标,真的是客户想看到的吗?以及是否可以
正确收到警报,这些配置都需要层层关卡,而 Gatus 透过简单的设定,让团队可以快速
监控整个服务,即时的通知设定,都可以在几个小时内完成。
## 心得
我选择此套原因就是简单设定跟方便部署,除了监控网站服务之外,测试团队其实可以拿
这套,去写大量的测试监控所有服务及效能,光是这点就可以替团队省下不少时间做测试
。另外每个服务还可以看到 response time 结果。
中间省略一段安装及使用说明,详细可以参考部落格:
https://bit.ly/docker-gatus
--
AppleBoy Blog:
http://blog.wu-boy.com
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.254.168.131 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1648334853.A.2B4.html
1F:推 safe: 老板最在意的免费要嗨赖起来呀 03/27 09:52
2F:推 ss8651twtw: 实用推 03/27 11:06
3F:推 ptta: 感谢分享 03/27 15:22
4F:→ OrzOGC: 免钱的最贵啊 03/27 15:27
5F:推 jamo: 免费真的最贵~ 03/27 18:02
6F:推 BignoZe: 免钱的最贵不是这样用的啦XD 03/27 18:24
7F:推 roccqqck: 实用 03/27 22:09
8F:推 Esh: 目前用Zabbix达到同样目的 03/28 00:07
9F:→ superpandal: 现在一堆人赖以爲生的都是免费的 经验有延续值得 没 03/28 01:48
10F:→ superpandal: 有遇到了被就轰炸 XD 03/28 01:50
11F:推 s51507: 推分享 03/31 21:01