Что такое Парадокс Симпсона?



Парадокс Симпсона (или парадокс объединения) — эффект в статистике, когда мы видим в каждой из групп данных определенную зависимость, но при объединении этих групп зависимость становится противоположной.



Причина парадокса заключается в некорректном усреднении групп данных с различной долей наблюдений. Интуитивно предполагается, что доля будет одинаковой в обеих группах, но в исходных данных это не всегда так. По этой причине, к ним нельзя применять арифметическое усреднение.



В позавчерашней задаче про долю использования поиска не учитываются веса браузеров. Как итог, при объединении групп метрика сменила зависимость.



Решение проблемы – проставление весовых коэффициентов всем браузерам.



Хотите, чтобы я разобрал задание с вашего собеседования? Пришлите его мне в личные сообщения.)



#продуктоваяаналитика