Это статистическая мера центральной тенденции, которая представляет собой значение, делящее упорядоченный набор данных на две равные части. То есть, половина значений набора данных будет меньше медианы, а другая половина – больше. В отличие от среднего значения (mean), медиана менее чувствительна к выбросам и экстремальным значениям, что делает её полезной в случае асимметричных распределений данных или данных с выбросами.
Если количество наблюдений (n) нечетное, медиана – это среднее значение в упорядоченном наборе данных.
Пример: Набор данных: [3, 1, 4, 2, 5]
Упорядоченный набор: [1, 2, 3, 4, 5]
Медиана: 3 (среднее значение)
Если количество наблюдений (n) четное, медиана – это среднее арифметическое двух средних значений в упорядоченном наборе данных.
Пример: Набор данных: [3, 1, 4, 2]
Упорядоченный набор: [1, 2, 3, 4]
Медиана: (2 + 3) / 2 = 2.5
Медиана менее подвержена влиянию экстремальных значений по сравнению со средним арифметическим.
В случаях, когда данные имеют асимметричное распределение, медиана может лучше представлять центральную тенденцию, чем среднее арифметическое.
В исследованиях доходов медиана часто используется вместо среднего, поскольку доходы могут быть сильно искажены очень высокими значениями.
Для оценки средней стоимости жилья медиана является полезным показателем, так как она не подвержена влиянию чрезвычайно дорогих или дешевых объектов недвижимости.
В медицинских исследованиях медиана может использоваться для описания типичных значений биологических показателей, таких как уровень холестерина или артериального давления, в группе пациентов.
Пример вычисления медианы на Python
import numpy as np
Пример с нечетным количеством элементов
data_odd = [3, 1, 4, 2, 5]
median_odd = np.median(data_odd)
print(f"Медиана для нечетного количества элементов: {median_odd}")
Пример с четным количеством элементов
data_even = [3, 1, 4, 2]
median_even = np.median(data_even)
print(f"Медиана для четного количества элементов: {median_even}")
Ставь 👍 и забирай 📚 Базу знаний