proposal.detail
提议The Ubuntu TechHive
The 60-Minute Uptime Monitor: Build, Break, Alert, Fix
这是一个实用的 DevOps 实验,参与者将构建一个小型监控系统,模拟服务故障,并根据警报进行修复。
简介 · 2 小时 · 2026年十月12 · 2026年六月3
描述
section.description当系统真正出现故障时,监控才具有了实际意义。在本实验中,我们将构建一个小型在线状态监控器,将其指向一个演示服务,然后人为地使该服务发生故障。
参与者将从运维人员的角度观察检查、警报、日志和响应时间。我们将调整嘈杂的警报,并将故障症状与根本原因区分开来。
本次实验的收获是为小型项目提供一套入门级的监控模式,以便在项目变得难以维护之前做好准备。