Мониторинг
Раздел посвящён наблюдаемости (observability).
Охватываются:
- сбор метрик;
- логирование;
- алертинг;
- диагностика.
Основные задачи
- обнаружение инцидентов;
- контроль доступности;
- анализ производительности.
Инструменты
- Zabbix;
- Prometheus;
- Grafana.
Риски
- отсутствие алертов;
- ложные срабатывания;
- слепые зоны мониторинга.