​​Найди то — не знаю что: как отлавливать сложные баги в системах хранения данных



Порядок действий в большей части тестов обычных приложений можно описать так: нужно зафиксировать начальное состояние системы, выполнить набор управляющих воздействий, а затем проверить, что финальное состояние системы соответствует ожиданиям. Но с такими высоконагруженными системами, как системы хранения данных, этот подход не работает по ряду причин. Как минимум из-за высокой интенсивности поступления входящих запросов и их большой вариативности.



Поэтому для тестирования и отладки СХД используется иной подход. Инженеры моделируют различные нагрузки и проверяют, что система обрабатывает их корректно. Основная задача — сымитировать как можно больше возможных тестовых сценариев. При этом нужно понимать, что их число никогда не будет исчерпывающим.



Главный эксперт по разработке ПО в YADRO Никита Гуцалов рассказал, как обеспечить быстрый поиск и исправление багов даже в такой сложной системе, как СХД. И какие решения, иногда специально разработанные под задачу, помогают разрешать даже самые запутанные случаи.



Из текста вы узнаете:



Что усложняет поиск багов в СХД;

Какие три условия существования ошибки должны быть удовлетворены, чтобы легко ее идентифицировать;

Как команда TATLIN.UNIFIED справилась с проблемой, где отсутствовали все эти условия;

Какие инструменты для траблшутинга облегчат работу инженера по тестированию.



Читать статью



#схд #приборы #инструменты