Визуализация. Часть 1
Поговорим сегодня про визуализацию данных, а также почему это не просто графики и картинки
Когда вы создаете эксперимент, выявляете в данных закономерности и приходите к какому-то выводу, который поможет вам и вашей компании принять решение, вы хотите донести мысль, хотите показать результативность эксперимента (если так оно и есть).
Для того, чтобы другой человек понял основную идею вашей работы, ему желательно нужно донести информацию разными понятными способами, один из них визуализация. Визуализация особенна важна, если вы хотите презентовать свои эксперименты ML модели для людей, которые не знакомы с вашей работой.
Начнем с разных видов представлений. Код и примеры графиков представлены на картинках выше (seaborn, maplotlib).
1. Pie Chart ⭕️
Довольно популярный график, используется, когда вы хотите показать пропорции в данных, размер каждой из групп, их соотношение.
2. Histogram 📉
Подходят для того, чтобы показать распределение величины, структура представлена в виде распределения частоты значений. Например, кол-во покупок по дням, месяцам, есть ли выбросы, какой характер распределения. Также отлично подходят для наглядного сравнения двух распределений.
3. Bar plot 📊
Используется для оценки количества/соотношения классов, признаков между собой, есть ли дисбаланс классов (влияет на обучение модели), а также соотношение значений в количественных признаках. Например, сколько человек имеют те или иные оценки, плюс группировка по полу.
4. Scatter plot🌌
Диаграмма рассеяния является полезным типом графика для исследования пар числовых признаков, построение графика от двух переменных и просмотр взаимосвязи между ними. Scatter plot может выявить симметрию данных, кластеры, корреляцию между переменными, а также экстремальные значения или выбросы.
https://github.com/miracl1e6/credit-scoring - данные
Поговорим сегодня про визуализацию данных, а также почему это не просто графики и картинки
Когда вы создаете эксперимент, выявляете в данных закономерности и приходите к какому-то выводу, который поможет вам и вашей компании принять решение, вы хотите донести мысль, хотите показать результативность эксперимента (если так оно и есть).
Для того, чтобы другой человек понял основную идею вашей работы, ему желательно нужно донести информацию разными понятными способами, один из них визуализация. Визуализация особенна важна, если вы хотите презентовать свои эксперименты ML модели для людей, которые не знакомы с вашей работой.
Начнем с разных видов представлений. Код и примеры графиков представлены на картинках выше (seaborn, maplotlib).
1. Pie Chart ⭕️
Довольно популярный график, используется, когда вы хотите показать пропорции в данных, размер каждой из групп, их соотношение.
2. Histogram 📉
Подходят для того, чтобы показать распределение величины, структура представлена в виде распределения частоты значений. Например, кол-во покупок по дням, месяцам, есть ли выбросы, какой характер распределения. Также отлично подходят для наглядного сравнения двух распределений.
3. Bar plot 📊
Используется для оценки количества/соотношения классов, признаков между собой, есть ли дисбаланс классов (влияет на обучение модели), а также соотношение значений в количественных признаках. Например, сколько человек имеют те или иные оценки, плюс группировка по полу.
4. Scatter plot🌌
Диаграмма рассеяния является полезным типом графика для исследования пар числовых признаков, построение графика от двух переменных и просмотр взаимосвязи между ними. Scatter plot может выявить симметрию данных, кластеры, корреляцию между переменными, а также экстремальные значения или выбросы.
https://github.com/miracl1e6/credit-scoring - данные