Data Portal | Data Science & Машиннное обучение

«Просто используй RAG», — сказали они. Но КАКОЙ RAG?

Вот 7 различных архитектур RAG, которые стоит знать

1️⃣

Наивный RAG: Классический подход

Наивный RAG — это стандартная реализация с простым процессом:

🔸Пользователь отправляет запрос.

🔸Система извлекает релевантные документы из векторной базы данных.

🔸Извлечённые документы добавляются в контекст запроса.

🔸LLM генерирует ответ на основе запроса и контекста.

Этот метод хорошо работает для простых приложений, таких как базовые системы вопросов-ответов или помощники по документам.

2️⃣

RAG с повторным ранжированием (Retrieve and Rerank RAG)

Добавляет этап повторного ранжирования для повышения качества извлечённых данных:

🔸Изначально извлекается расширенный набор потенциально релевантных документов.

🔸Модель ранжирования оценивает их и присваивает оценки релевантности.

🔸Только документы с наивысшими оценками передаются в LLM.

3️⃣

Мультимодальный RAG

Использует модели, работающие с различными типами данных: текстом, изображениями, аудио, видео и т. д.

4️⃣

Графовый RAG

Использует графовую базу данных для учёта связей между документами:

🔸Документы или их фрагменты представляются узлами графа.

🔸Связи между документами — рёбра графа.

🔸Запрос может следовать по связям, чтобы находить более контекстно релевантную информацию.

5️⃣

Гибридный RAG (Vector DB + Graph DB)

Комбинирует векторный поиск и графовую базу данных:

🔸Векторный поиск находит семантически схожий контент.

🔸Графовая база предоставляет структурированные связи между данными.

🔸Запросы используют как семантическое сходство, так и явные связи.

🔸Ответ может включать информацию, найденную при обходе графа.

6️⃣

Агентный RAG с маршрутизатором (Agentic RAG with Router Agent)

Один агент управляет процессом извлечения знаний:

🔸Анализирует запрос и определяет, какие источники данных использовать.

🔸Принимает стратегические решения о способах извлечения информации.

🔸Координирует процесс извлечения на основе понимания запроса.

7️⃣

Мультиагентный RAG

Использует несколько специализированных агентов:

🔸Главный агент управляет процессом.

🔸Специализированные агенты выполняют разные задачи.

🔸Агенты взаимодействуют, чтобы решать сложные запросы.

Например, один агент отвечает за поиск по источникам, другой за преобразование данных, третий — за персонализацию ответа, а главный агент собирает окончательный результат.

👉

@DataSciencegx