🤔 Как использовать P-value, когда мы проверяем какую-то гипотезу?



P-value (уровень значимости) является ключевым элементом в статистической гипотезе. Он используется для оценки вероятности того, что наблюдаемые данные (или более экстремальные данные) могли бы быть получены при условии, что нулевая гипотеза верна. Вот как использовать P-value при проверке гипотезы:



🚩Шаги использования P-value для проверки гипотезы



Формулировка гипотез:

🟠Нулевая гипотеза (H0): утверждение, которое мы хотим проверить. Обычно это гипотеза об отсутствии эффекта или различий.

🟠Альтернативная гипотеза (H1): утверждение, которое принимается, если нулевая гипотеза отклоняется. Это гипотеза о наличии эффекта или различий.



Выбор уровня значимости (α): Уровень значимости (α) — это пороговое значение, которое определяет критическую область. Обычно используется значение 0.05 (5%), но может быть и другим в зависимости от контекста исследования.



Сбор данных и расчет статистического теста:

🟠Сбор данных и проведение соответствующего статистического теста (например, t-тест, χ²-тест, ANOVA и т.д.).

🟠Расчет P-value на основе полученных данных.



Интерпретация P-value:

🟠Сравнение P-value с уровнем значимости α.

🟠Если P-value ≤ α, отвергаем нулевую гипотезу (H0). Это означает, что результаты статистически значимы, и существует достаточно доказательств в пользу альтернативной гипотезы (H1).

🟠Если P-value > α, не отвергаем нулевую гипотезу. Это означает, что результаты не являются статистически значимыми, и нет достаточных доказательств для принятия альтернативной гипотезы.



Задача: Проверить, отличается ли средний рост мужчин в популяции от 175 см.



Формулировка гипотез:

🟠 Нулевая гипотеза (H0): Средний рост мужчин равен 175 см.

🟠Альтернативная гипотеза (H1): Средний рост мужчин не равен 175 см.



Выбор уровня значимости: Уровень значимости α = 0.05.



Сбор данных и расчет статистического теста:

🟠Предположим, у нас есть выборка из 50 мужчин с средним ростом 178 см и стандартным отклонением 10 см.

🟠Используем t-тест для одной выборки.

🟠Вычисляем t-статистику и P-value.



import scipy.stats as stats



# Данные выборки

sample_mean = 178

population_mean = 175

sample_std = 10

sample_size = 50



# Вычисление t-статистики

t_statistic = (sample_mean - population_mean) / (sample_std / (sample_size ** 0.5))



# Вычисление P-value для двустороннего теста

p_value = 2 * (1 - stats.t.cdf(abs(t_statistic), df=sample_size-1))



print("t-статистика:", t_statistic)

print("P-value:", p_value)




Интерпретация P-value:

🟠Предположим, P-value = 0.03.

🟠Сравниваем P-value с уровнем значимости α:

🟠P-value = 0.03 ≤ 0.05.

🟠Отвергаем нулевую гипотезу (H0). Это означает, что средний рост мужчин в выборке статистически значимо отличается от 175 см.



Ставь 👍 и забирай 📚 Базу знаний