📌 Когда берём t-критерий, а когда Манни-Уитни ?



💬 Спрашивают в 14% собеседований



Выбор между t-критерием Стьюдента и критерием Манна-Уитни зависит от свойств данных и конкретных гипотез, которые вы проверяете. Рассмотрим, в каких ситуациях предпочтителен каждый из этих тестов.



T-критерий Стьюдента (t-test)



Используется для сравнения средних значений двух групп и требует соблюдения определенных предпосылок:



1️⃣ Нормальное распределение: Данные в каждой группе должны быть нормально распределены.



2️⃣ Гомогенность дисперсий (гомоскедастичность): Дисперсии в двух группах должны быть примерно равны. Существует вариант t-теста (Welch's t-test), который не предполагает равенства дисперсий.



3️⃣ Независимость наблюдений: Данные в группах должны быть независимыми.



Примеры использования:



Проверка, отличается ли средний балл по математике между двумя классами.



Сравнение среднего уровня холестерина у двух групп пациентов (например, до и после лечения).



import numpy as np

from scipy import stats



# Пример данных

group_A = np.random.normal(loc=0.5, scale=1, size=100) # Группа A

group_B = np.random.normal(loc=0.7, scale=1, size=100) # Группа B



# Проведение t-теста

t_stat, p_value = stats.ttest_ind(group_A, group_B)



print(f"T-статистика: {t_stat}")

print(f"P-значение: {p_value}")




Критерий Манна-Уитни (Mann-Whitney U test)



Это непараметрический тест, который используется для сравнения распределений двух независимых выборок. Этот тест не требует предположений о нормальности распределения данных.



1️⃣ Не требует нормального распределения: Можно использовать для данных, которые не распределены нормально.



2️⃣ Независимость наблюдений: Данные в группах должны быть независимыми.



3️⃣ Сравнение медиан: Часто используется для сравнения медиан, но фактически он проверяет гипотезу о сдвиге распределений.



Примеры использования:



Сравнение рангов спортсменов из двух разных команд.



Оценка эффективности двух разных методов лечения, когда данные не распределены нормально.



import numpy as np

from scipy import stats



# Пример данных

group_A = np.random.normal(loc=0.5, scale=1, size=100) # Группа A

group_B = np.random.normal(loc=0.7, scale=1, size=100) # Группа B



# Проведение U-теста

u_stat, p_value = stats.mannwhitneyu(group_A, group_B)



print(f"U-статистика: {u_stat}")

print(f"P-значение: {p_value}")




Сравнение и выбор теста



Используйте t-критерий Стьюдента, если:



Данные в каждой группе нормально распределены.



Дисперсии в группах примерно равны (или используйте Welch's t-test).



Вы хотите сравнить средние значения двух групп.



Используйте критерий Манна-Уитни, если:



Данные не распределены нормально или вы не уверены в нормальности распределения.



Данные представлены в виде рангов или имеют выбросы.



Вы хотите сравнить распределения или медианы двух групп.



t-критерий Стьюдента используется для сравнения средних значений двух групп при условии нормального распределения и равенства дисперсий.



Критерий Манна-Уитни применяется для сравнения распределений двух независимых выборок, особенно когда данные не распределены нормально.



Выбор теста зависит от распределения данных и целей вашего анализа.



🔥 ТОП ВОПРОСОВ С СОБЕСОВ



🔒 База собесов | 🔒 База тестовых