Владимир Колобаев написал статью, как в Avito обновляли систему мониторинга (https://goo.gl/kamRhZ). За два года получился «мониторинг как сервис». Разработчики могут подключать новые микросервисы, добавлять метрики и оповещения самостоятельно, без участия DevOps-инженеров. Система полностью построена из компонентов с открытым исходным кодом: Graphite, Carbon-c-relay, Brubeck, Collectd, Grafana, Heapster и Moira.



Мойру написали разработчики из Контура на Python и Go. Мы выложили код на Github (https://github.com/moira-alert) и отвечаем на все вопросы в Gitter-чате (https://gitter.im/moira-alert/moira). Мойра получает метрики из сервисов и уведомляет о проблемах, если срабатывают настроенные триггеры. Она отказоустойчива и полностью независима от хранилища метрик и системы для их визуализации — если Graphite или Grafana сломаются, Мойра всё равно пришлёт оповещения. А ещё она легко справляется с нагрузкой — например, сейчас в Avito собирают 2 миллиона метрик в минуту, а в Контуре — 15 миллионов. Для Мойры это не предел.



Скоро будет релиз Мойры 2.0, целиком написанной на Go. А ещё мы готовим новый быстрый веб-интерфейс для Мойры, сделанный на JS с Flow и React. Сейчас веб-интерфейс Мойры выглядит так: