Question 1

Чем RAG лучше обычной работы с LLM?

Accepted Answer

Обычные LLM ограничены данными, на которых обучались, и не знают актуальной информации. RAG дополняет запрос свежими данными из внешних источников, что делает ответы более точными и актуальными.

Question 2

Как работает Sparse-ретривер?

Accepted Answer

Sparse-ретривер ищет по точному совпадению ключевых слов методом TF-IDF или BM25. Запрос остаётся текстом и сравнивается с индексированными документами по термам.

Question 3

В чём разница между Sparse и Dense ретриверами?

Accepted Answer

Sparse ищет по словам и их частоте, Dense — по смыслу через векторные представления. Dense может найти документы с похожим смыслом даже без общих слов.

Question 4

Когда стоит использовать Hybrid-ретривер?

Accepted Answer

Hybrid-ретривер лучше использовать, когда нужна максимальная точность поиска. Он комбинирует преимущества обоих методов и снижает риск пропуска релевантных документов.

Question 5

Какие типы контекста поддерживает RAG?

Accepted Answer

RAG работает с тремя типами контекста: структурированным (JSON, таблицы), неструктурированным (обычный текст) и векторным (эмбеддинги документов).

Question 6

Почему RAG может давать неточные ответы?

Accepted Answer

Если ретривер извлекает нерелевантные или устаревшие данные, модель сгенерирует ответ на основе плохого контекста. Это называется «галлюцинации» — модель может придумать несуществующие факты.

Question 7

Можно ли использовать RAG для юридических задач?

Accepted Answer

Да, RAG активно применяется в юриспруденции для поиска прецедентов, анализа документов и генерации выводов на основе актуальной базы законов.

Question 8

Как влияет лимит контекста на качество RAG?

Accepted Answer

У LLM есть ограничение на длину контекста. Длинные документы могут обрезаться или обрабатываться не полностью, что снижает качество итогового ответа.

Question 9

Какой тип ретривера выбрать для поиска по документам с техническими терминами?

Accepted Answer

Для технических документов лучше подходит Dense или Hybrid ретривер, так как он учитывает семантику и может найти релевантные документы даже при разных формулировках терминов.

Question 10

RAG медленнее обычных ответов LLM?

Accepted Answer

Да, RAG требует дополнительного этапа поиска перед генерацией, поэтому работает медленнее, чем прямые ответы модели без использования внешнего контекста.

FAQ

Посты по теме