📌 Когда берём t-критерий, а когда Манни-Уитни ?💬 Спрашивают в 14% собеседований Выбор между t-критерием Стьюдента и критерием Манна-Уитни зависит от свойств данных и конкретных гипотез, которые вы проверяете. Рассмотрим, в каких ситуациях предпочтителен каждый из этих тестов.
T-критерий Стьюдента (t-test)Используется для сравнения средних значений двух групп и требует соблюдения определенных предпосылок:
1️⃣ Нормальное распределение: Данные в каждой группе должны быть нормально распределены.
2️⃣ Гомогенность дисперсий (гомоскедастичность): Дисперсии в двух группах должны быть примерно равны. Существует вариант t-теста (Welch's t-test), который не предполагает равенства дисперсий.
3️⃣ Независимость наблюдений: Данные в группах должны быть независимыми.
Примеры использования:
➕ Проверка, отличается ли средний балл по математике между двумя классами.
➕ Сравнение среднего уровня холестерина у двух групп пациентов (например, до и после лечения).
import numpy as np
from scipy import stats
# Пример данных
group_A = np.random.normal(loc=0.5, scale=1, size=100) # Группа A
group_B = np.random.normal(loc=0.7, scale=1, size=100) # Группа B
# Проведение t-теста
t_stat, p_value = stats.ttest_ind(group_A, group_B)
print(f"T-статистика: {t_stat}")
print(f"P-значение: {p_value}")
Критерий Манна-Уитни (Mann-Whitney U test)Это непараметрический тест, который используется для сравнения распределений двух независимых выборок. Этот тест не требует предположений о нормальности распределения данных.
1️⃣ Не требует нормального распределения: Можно использовать для данных, которые не распределены нормально.
2️⃣ Независимость наблюдений: Данные в группах должны быть независимыми.
3️⃣ Сравнение медиан: Часто используется для сравнения медиан, но фактически он проверяет гипотезу о сдвиге распределений.
Примеры использования:
➕ Сравнение рангов спортсменов из двух разных команд.
➕ Оценка эффективности двух разных методов лечения, когда данные не распределены нормально.
import numpy as np
from scipy import stats
# Пример данных
group_A = np.random.normal(loc=0.5, scale=1, size=100) # Группа A
group_B = np.random.normal(loc=0.7, scale=1, size=100) # Группа B
# Проведение U-теста
u_stat, p_value = stats.mannwhitneyu(group_A, group_B)
print(f"U-статистика: {u_stat}")
print(f"P-значение: {p_value}")
Сравнение и выбор тестаИспользуйте t-критерий Стьюдента, если:
➕ Данные в каждой группе нормально распределены.
➕ Дисперсии в группах примерно равны (или используйте Welch's t-test).
➕ Вы хотите сравнить средние значения двух групп.
Используйте критерий Манна-Уитни, если:
➕ Данные не распределены нормально или вы не уверены в нормальности распределения.
➕ Данные представлены в виде рангов или имеют выбросы.
➕ Вы хотите сравнить распределения или медианы двух групп.
➕ t-критерий Стьюдента используется для сравнения средних значений двух групп при условии нормального распределения и равенства дисперсий.
➕ Критерий Манна-Уитни применяется для сравнения распределений двух независимых выборок, особенно когда данные не распределены нормально.
Выбор теста зависит от распределения данных и целей вашего анализа.
🔥 ТОП ВОПРОСОВ С СОБЕСОВ🔒 База собесов |
🔒 База тестовых