«Просто используй RAG», — сказали они. Но КАКОЙ RAG?



Вот 7 различных архитектур RAG, которые стоит знать



1️⃣ Наивный RAG: Классический подход



Наивный RAG — это стандартная реализация с простым процессом:



🔸Пользователь отправляет запрос.

🔸Система извлекает релевантные документы из векторной базы данных.

🔸Извлечённые документы добавляются в контекст запроса.

🔸LLM генерирует ответ на основе запроса и контекста.



Этот метод хорошо работает для простых приложений, таких как базовые системы вопросов-ответов или помощники по документам.



2️⃣ RAG с повторным ранжированием (Retrieve and Rerank RAG)



Добавляет этап повторного ранжирования для повышения качества извлечённых данных:



🔸Изначально извлекается расширенный набор потенциально релевантных документов.

🔸Модель ранжирования оценивает их и присваивает оценки релевантности.

🔸Только документы с наивысшими оценками передаются в LLM.



3️⃣ Мультимодальный RAG



Использует модели, работающие с различными типами данных: текстом, изображениями, аудио, видео и т. д.



4️⃣ Графовый RAG



Использует графовую базу данных для учёта связей между документами:



🔸Документы или их фрагменты представляются узлами графа.

🔸Связи между документами — рёбра графа.

🔸Запрос может следовать по связям, чтобы находить более контекстно релевантную информацию.



5️⃣ Гибридный RAG (Vector DB + Graph DB)



Комбинирует векторный поиск и графовую базу данных:



🔸Векторный поиск находит семантически схожий контент.

🔸Графовая база предоставляет структурированные связи между данными.

🔸Запросы используют как семантическое сходство, так и явные связи.

🔸Ответ может включать информацию, найденную при обходе графа.



6️⃣ Агентный RAG с маршрутизатором (Agentic RAG with Router Agent)



Один агент управляет процессом извлечения знаний:



🔸Анализирует запрос и определяет, какие источники данных использовать.

🔸Принимает стратегические решения о способах извлечения информации.

🔸Координирует процесс извлечения на основе понимания запроса.



7️⃣ Мультиагентный RAG



Использует несколько специализированных агентов:



🔸Главный агент управляет процессом.

🔸Специализированные агенты выполняют разные задачи.

🔸Агенты взаимодействуют, чтобы решать сложные запросы.



Например, один агент отвечает за поиск по источникам, другой за преобразование данных, третий — за персонализацию ответа, а главный агент собирает окончательный результат.



👉 @DataSciencegx