​​Русский рэп через тематическое моделирование: о чем читает русскоговорящая хип-хоп сцена

#arts



«Русский рэпер» — словосочетание, ставшее если не ругательным, то как минимум пренебрежительным. Оно связано с целым букетом стереотипов. Представьте себе русского рэпера. Что вы видите? Человека в спортивках, окруженного «своими пацанами», или, может, парня с золотыми грилзами перед его новенькой машиной? Долой стереотипы! Время разобраться с тем, кто такие русские рэперы, и о чем они читают на самом деле.



Рэп как жанр зародился в 1970-ых годах в Южном Бронксе (район в Нью-Йорке). Первые рэперы — представители бедного чернокожего населения, поднимавшие в своем творчестве проблемы убийств, нищеты, употребления наркотиков. С тех пор рэп сильно изменился — из маленькой культуры бедного района Нью-Йорка он вырос в популярный жанр, приобретая в каждой стране свои особенности.



В Россию рэп пришел в конце 1980-ых и на заре своего существования многое заимствовал с западных образцов. Позже он обрел относительную самостоятельность как жанр, создавая свой стиль как в музыке, так и в смысловой нагрузке текстов.



В 2017 году рэпу удалось обойти по прослушиваниям рок, который больше 50 лет держал первенство музыкального олимпа, и стать самым популярным жанром музыки в мире. Рэп, будучи настолько популярным, может влиять на то, как сотни тысяч людей мыслят и каких ценностей придерживаются. Значит, важно разобраться, о чем он говорит.



Как мы изучали рэп



Перед анализом и извлечением транслируемых идей нам предстояло собрать данные. Для исследования мы взяли два сайта: ныне уже не существующий рэп-текст. рф и genius.com. Всего после удаления дубликатов и искаженных текстов для анализа осталось 11 396 уникальных текстов. Все тексты мы предобработали — удалили все символы, кроме кириллических, произвели лемматизация и удалили стоп-слова.



Основным методом анализа мы выбрали тематическое моделирование — набор методов, направленных на извлечение из большого корпуса текстов так называемых тем, то есть наборов связанных слов. «Системный Блокъ» уже рассказывал, как работает тематическое моделирование, а также как его можно делать в Tableau и в Mallet.



Мы использовали тематическую модель BigARTM, которая позволяет найти устойчивую базовую модель и, изменяя ее параметры, улучшать ее как с точки зрения интерпретации, так и с позиции формальных метрик. Результатом использования метода стала тематическая модель русского рэпа, состоящая из 17 тем.



О чем же читают рэперы



Нам удалось выделить следующие темы: «смерть», «природа», «житейские истории», «размышления о мире», «поиск и „становление“ себя», «(несчастная) любовь», «город», «создание и чтение рэпа», «мат», «разборки», «жизнь на районе», «вечеринки и секс», «(тяжелое) детство», «размышления о родине», «исполнение музыки», «успех» и «рэперские атрибуты».



Оказалось, что чаще всего рэперы читают о своем жизненном пути, о любви и о природе. Ниже прикреплена визуализация итоговой тематической модели.



Если высокая распространенность тем жизненного пути и любви кажется закономерной, то тема природы и ее высокая распространенность выглядит подозрительно. Но появление темы природы в тексте рэпера вовсе не означает, что рэпер решил прочитать о своей любимой сосне или речке. Просто рэперы часто используют образы природы как художественный прием, как метафору для описания обстановки. Так, например, в тексте Скриптонита «Положение» мы видим строчки:



Тихо, как падал снег, падал весь квартал, мы падали на полпути во сне в поисках нала.



Слово «снег» в данном случае «поднимет» вероятность встретить тему природы в тексте артиста, однако о природе как таковой речи здесь не идет.



Подробнее про каждую из тем рассказываем в нашей статье: https://sysblok.ru/arts/russkij-rjep-cherez-tematicheskoe-modelirovanie-o-chem-chitaet-russkogovorjashhaja-hip-hop-scena/



Антон Бойченко, Светлана Жучкова