Системный Блокъ

Мама мыла LSTM: как устроены рекуррентные нейросети с долгой краткосрочной памятью

#knowhow

Системный Блокъ подготовил крафтовый техно-лонгрид, в котором разбирается по винтикам одна из самых ходовых технологий в современной компьютерной лингвистике — рекуррентные нейросети с архитектурой LSTM.

Именно на LSTM-сетях впервые взлетел качественный нейросетевой машинный перевод. Несмотря на бум нейросетей-трансформеров, о которых мы расскажем в наших следующих техно-лонгридах, рекуррентные LSTM-сети остаются одним из популярнейших рабочих инструментов в задачах машинной обработки естественного языка.

Зачем обрабатывать текст на компьютере

Было бы круто научить компьютер генерировать связный текст, выделять логические конструкции, потом делать с ними что-нибудь интересное, как умеет человек. Может получиться чат-бот, поисковая машина, «умная» клавиатура на телефоне, онлайн-переводчик, генератор пересказов.

Эти задачи решает обработка естественного языка. С ней есть сложности: в языке бывают омонимы, бывают многозначные слова. А что делать, если «Трофей не поместился в чемодан, потому что он был слишком большим»? Как тут программе сориентироваться, к чему относится слово «он»?

К счастью, речь людей статистически предсказуема. Есть популярные цепочки слов, которые повторяют почти все. Велика вероятность после слов «чайник уже» найти слово «вскипел». И напротив, есть последовательности, которые никогда не услышишь в речи. Например, «чайник уже… обиделся».

О чем рассказываем в статье:

— Как использовать неслучайность речи

— Как работает языковая модель на цепях Маркова без нейросетей

— Что такое рекуррентность

— Как RNN сохраняет свое состояние и передает его дальше

— Почему неэффективно передавать контекст со слоя на слой

— Что происходит внутри одного слоя нейронов

— Как работает LSTM — Long Short Term Memory

— Как реализуется забывание контекста в LSTM

— Как реализуется запоминание контекста в LSTM

— Как реализуется запись новых значений в контекст

— Как получается предсказание LSTM

Обо всем этом — в нашей статье: https://sysblok.ru/knowhow/mama-myla-lstm-kak-ustroeny-rekurrentnye-nejroseti-s-dolgoj-kratkosrochnoj-pamjatju/