🤔 Что такое mode?



Это статистическая мера центральной тенденции, представляющая собой значение, которое встречается в наборе данных чаще всего. В отличие от среднего значения (mean) и медианы (median), мода не обязательно должна быть уникальной: в одном наборе данных может быть несколько мод или не быть ни одной (если все значения встречаются одинаково часто).



🚩Характеристики



🟠Частота появления

Мода определяется как значение или значения, которые имеют наибольшую частоту появления в наборе данных.

🟠Устойчивость к выбросам

Поскольку мода основана на частоте, она не подвержена влиянию выбросов или экстремальных значений.

🟠Применимость

Мода особенно полезна для категориальных данных, где среднее значение не имеет смысла (например, самый популярный цвет, наиболее частое место назначения).



🚩Примеры



🟠Набор данных с одной модой

Набор данных: [1, 2, 2, 3, 4] 2 (появляется чаще всего)

🟠Набор данных с двумя модами (бимодальный)

Набор данных: [1, 2, 2, 3, 3, 4] 2 и 3 (оба значения появляются одинаково часто и чаще остальных)

🟠Набор данных без моды

Набор данных: [1, 2, 3, 4] отсутствует (все значения появляются с одинаковой частотой)



🚩Применение моды



🟠Бизнес и маркетинг

Определение самых популярных продуктов, услуг или предпочтений клиентов.

🟠Медицина

Анализ наиболее частых симптомов или заболеваний в определённой группе пациентов.

🟠Социология

Выявление наиболее распространенных ответов на опросы или анкеты.



Моды на Python

from scipy import stats



# Пример с одной модой

data_single_mode = [1, 2, 2, 3, 4]

mode_single = stats.mode(data_single_mode)

print(f"Мода для набора с одной модой: {mode_single.mode[0]} (появляется {mode_single.count[0]} раз)")



# Пример с двумя модами

data_bimodal = [1, 2, 2, 3, 3, 4]

mode_bimodal = stats.mode(data_bimodal)

print(f"Моды для набора с двумя модами: {mode_bimodal.mode} (каждая появляется по {mode_bimodal.count[0]} раз)")




Для категориальных данных на Python

from collections import Counter



# Категориальные данные

data_categorical = ['red', 'blue', 'blue', 'green', 'red', 'red']

counter = Counter(data_categorical)

mode_categorical = counter.most_common(1)[0] # most_common(1) возвращает список с одной парой (элемент, частота)

print(f"Мода для категориальных данных: {mode_categorical[0]} (появляется {mode_categorical[1]} раз)")




Ставь 👍 и забирай 📚 Базу знаний