Привет!



Решил сегодня поделиться промежуточными результатами учебно-исследовательского проекта с применением анализа данных 😃



Проект направлен на изучение паттернов поведения и активности студентов во время обучения и исследования успеваемости студентов.



На блок-схеме представлен возможный логический процесс исследования паттернов на основе данных о посещении студентов лекций/семинаров, а также их оценки за прошедшие экзамены



Гипотеза: успеваемость студентов зависит от посещаемости пар.



Вроде звучит очень просто. Но смысл аналитики данных в том, чтобы доказывать или опровергать гипотезы основываясь на данных (фактах, которые происходили)



После исследования данных действительно можно подтвердить гипотезу и сказать, что в среднем студенты получают "отлично" на экзамене при посещаемости около 87% пар. А вот студенты, получающие "неудовлетворительно" посещают всего 23% пар.



Вывод: чтобы поднять успеваемость студентов, необходимо работать с их посещаемостью. А вот как это сделать - вопрос другого анализа