
«Просто используй RAG», — сказали они. Но КАКОЙ RAG?
Вот 7 различных архитектур RAG, которые стоит знать
1️⃣ Наивный RAG: Классический подход
Наивный RAG — это стандартная реализация с простым процессом:
🔸 Пользователь отправляет запрос.
🔸 Система извлекает релевантные документы из векторной базы данных.
🔸 Извлечённые документы добавляются в контекст запроса.
🔸 LLM генерирует ответ на основе запроса и контекста.
Этот метод хорошо работает для простых приложений, таких как базовые системы вопросов-ответов или помощники по документам.
2️⃣ RAG с повторным ранжированием (Retrieve and Rerank RAG)
Добавляет этап повторного ранжирования для повышения качества извлечённых данных:
🔸 Изначально извлекается расширенный набор потенциально релевантных документов.
🔸 Модель ранжирования оценивает их и присваивает оценки релевантности.
🔸 Только документы с наивысшими оценками передаются в LLM.
3️⃣ Мультимодальный RAG
Использует модели, работающие с различными типами данных: текстом, изображениями, аудио, видео и т. д.
4️⃣ Графовый RAG
Использует графовую базу данных для учёта связей между документами:
🔸 Документы или их фрагменты представляются узлами графа.
🔸 Связи между документами — рёбра графа.
🔸 Запрос может следовать по связям, чтобы находить более контекстно релевантную информацию.
5️⃣ Гибридный RAG (Vector DB + Graph DB)
Комбинирует векторный поиск и графовую базу данных:
🔸 Векторный поиск находит семантически схожий контент.
🔸 Графовая база предоставляет структурированные связи между данными.
🔸 Запросы используют как семантическое сходство, так и явные связи.
🔸 Ответ может включать информацию, найденную при обходе графа.
6️⃣ Агентный RAG с маршрутизатором (Agentic RAG with Router Agent)
Один агент управляет процессом извлечения знаний:
🔸 Анализирует запрос и определяет, какие источники данных использовать.
🔸 Принимает стратегические решения о способах извлечения информации.
🔸 Координирует процесс извлечения на основе понимания запроса.
7️⃣ Мультиагентный RAG
Использует несколько специализированных агентов:
🔸 Главный агент управляет процессом.
🔸 Специализированные агенты выполняют разные задачи.
🔸 Агенты взаимодействуют, чтобы решать сложные запросы.
Например, один агент отвечает за поиск по источникам, другой за преобразование данных, третий — за персонализацию ответа, а главный агент собирает окончательный результат.
👉 @DataSciencegx
Вот 7 различных архитектур RAG, которые стоит знать
Наивный RAG — это стандартная реализация с простым процессом:
Этот метод хорошо работает для простых приложений, таких как базовые системы вопросов-ответов или помощники по документам.
Добавляет этап повторного ранжирования для повышения качества извлечённых данных:
Использует модели, работающие с различными типами данных: текстом, изображениями, аудио, видео и т. д.
Использует графовую базу данных для учёта связей между документами:
Комбинирует векторный поиск и графовую базу данных:
Один агент управляет процессом извлечения знаний:
Использует несколько специализированных агентов:
Например, один агент отвечает за поиск по источникам, другой за преобразование данных, третий — за персонализацию ответа, а главный агент собирает окончательный результат.