Сергей Булаев AI 🤖

🧠 Исследователи из Huawei Noah's Ark Lab и University College London представили EM-LLM - модель с эпизодической памятью, имитирующую некоторые аспекты работы человеческого мозга. Это очередной шаг в улучшении обработки длинных контекстов в AI. Полный текст публикации.

EM-LLM сегментирует информацию на события, используя уровень неожиданности (surprise) и графовые алгоритмы. Как это работает?

1. Модель оценивает, насколько каждый новый токен неожидан в контексте предыдущих. Чем выше неожиданность, тем вероятнее, что это начало нового "события".

2. Далее используется матрица сходства между ключами внимания в слоях трансформера. Эта матрица рассматривается как граф, где токены - вершины, а сходство между ними - веса рёбер. Применяются алгоритмы кластеризации графов для уточнения границ событий.

Процесс извлечения памяти включает два этапа:

1. Поиск по сходству: выбираются k событий, наиболее похожих на текущий запрос.

2. Сохранение временной последовательности: для каждого выбранного события добавляются соседние события из исходной последовательности.

Это имитирует эффекты временной смежности и асимметрии, наблюдаемые в человеческой памяти - тенденцию вспоминать события, близкие по времени и в определенном порядке.

Результаты тестировались на LongBench - наборе задач для оценки работы с длинными текстами:

- 4.3% общий рост по сравнению с современными моделями

- 33% улучшение в задаче PassageRetrieval, где нужно найти исходный параграф по его краткому содержанию

EM-LLM можно применить к существующим моделям без переобучения, что упрощает внедрение

Этот подход перекликается с моим проектом https://flashbacks.ai, где я рабатаю над AI-ассистентом для людей которые боятся деменции (таких как я). Принципы EM-LLM могут помочь в создании подобного помощника, способного лучше организовывать и извлекать воспоминания.

Хотя EM-LLM показывает неплохие результаты, она все ещё очень далека от полного воспроизведения сложности человеческой памяти.

#AIMemory #flashbacksAI

@sergiobulaev - об AI и когнитивных технологиях