Друзья, привет! На связи Владимир.



Хочу продолжить тему, которую начал Андрей – постмортемы. Это безусловно очень важный инструмент, и пригодждается не только в продакт менеджмете и в разработке – вообще в жизни. Везде, где нужно искать причины каких-то конкретных ошибок и проблем.

При этом, несмотря на важность и необходимость обучения на ошибках, постмортемы – одна из последних вещей, которые хочется использовать для предотвращения аварий.



Важно отматывать время назад от мемента, когда уже "тлеют" последствия и остались только "головешки". Если у вас хороший мониторинг – стоит заглянуть за минуты и/или часы до аварии. Мониторинг и alerting звенит вовремя, если продакт знает, какие главные бизнес-метрики и SLI у продукта. Знает при каких именно значениях уже пора трубить тревогу. Если всё это продактом продумано заранее, то алерты прилетают воворемя, без необходимости постоянно смотреть на графики. Продукт можно быстро починить командой подготовленных людей (в больших компаниях их называют Site Reliability Engineers).

Если продакт не позаботился о дереве метрик заранее, то аварию можно не замечать довольно долго, а когда заметили – еще долго не понимать в чем причина.



Если отмотать время глубже, то мы столкнемся с тестированием. Волшебство тестов в том, что компьютер может повторять их очень много раз: например, проводить тестовые платежи при каждом изменении. А еще рефанды. А еще в разном порядке и на разные суммы... Тесты и сценарии тестов задает продакт, т.к. именно продакт знает свой продукт (а реализует тесты уже команда разработки).



Если отдалиться назад во времени еще дальше – мы увидим архитектуру. Архитектурные вопросы лежат на границе знаний и ответственности продакта, но именно продакт должен донести до техлида и архитектора особенности использования продукта и трафика.





Вкратце! Постмортем – важно, но нежелательно). Что продакт может сделать "до"?



- определять правильные метрики, понимать в какой момент метрика переходит границы "нормальности" и становится "нездоровой",

- SLO, алертинг,

- тестирование, область приложения тестов, формулировки тестов "человеческим языком",

- черный пояс: глубокое понимаение своего продукта, способность донести бизнес-требования до техлидов и архитекторов.



Надеюсь, было полезно.

Ниже эта тема раскрыта в формате мини-подкаста 👇