RAG для сканов PDF: OCR, Qdrant, Gemini

Продавец Продано Возвратов Отзывы
Automatizator 0 0
0
0
599.00
Описание
# Отвечает на вопросы по PDF через чат с OCR, Qdrant и Gemini

Этот сценарий автоматизирует поиск информации в сканированных PDF-документах с помощью RAG-системы на базе n8n, Mistral OCR и Google Gemini. Пользователь задаёт вопрос в чате — система находит релевантный фрагмент в документах и возвращает точный ответ. Идеально подходит для работы с договорами, регламентами и другими неструктурированными документами.

## Кому подойдёт
- Специалисты по работе с документами, нуждающиеся в быстром поиске информации в сканах
- Юридические и финансовые команды, обрабатывающие большие объемы PDF
- Разработчики, создающие RAG-решения для клиентов
- Компании, автоматизирующие внутренние знания из неструктурированных документов

## Что делает автоматизация
- При получении триггера (чат, ручной запуск) извлекает PDF из Google Drive
- Обрабатывает файлы через Mistral OCR для извлечения текста
- Разбивает текст на чанки и векторизует с помощью OpenAI Embeddings
- Сохраняет эмбеддинги в Qdrant для последующего поиска
- При поступлении вопроса через чат ищет релевантные фрагменты в базе
- Генерирует ответ с помощью Google Gemini и отправляет пользователю
- Поддерживает массовую обработку документов из папки Google Drive

## Что входит в пакет
- Готовый workflow под n8n
- Логика обработки триггеров: chat_message, manual_trigger, execute_workflow_trigger
- Интеграции с Google Drive, Mistral AI, Qdrant, Google Gemini
- Базовая текстовая инструкция по запуску и адаптации

## Что нужно для запуска
- Аккаунт n8n с доступом к HTTP API и LangChain
- Доступ к Google Drive (API)
- Ключи Mistral AI (OCR)
- Запущенный экземпляр Qdrant (локально или облачный)
- API-ключ Google Gemini
- Настроенное окружение для работы с OpenAI Embeddings

## Польза и эффекты
- Автоматическая оцифровка и индексация сканированных документов
- Быстрый поиск информации без ручного просмотра PDF
- Точность ответов за счёт RAG-подхода и векторного поиска
- Экономия времени юристов, аналитиков и сотрудников поддержки
- Масштабируемость: поддержка сотен документов
- Гибкость: можно использовать как бэкенд для чат-бота

## Важное о формате продукта и поддержке
**Важно:** вы приобретаете именно готовый шаблон сценария автоматизации. Разворот под вашу инфраструктуру, интеграция с конкретными аккаунтами и сервисами, индивидуальная помощь в настройке, доработки под нестандартные стеки и любая консультационная поддержка оказываются отдельно и оплачиваются по индивидуальному тарифу. Для обсуждения доработок и индивидуальной помощи вы можете связаться с нами через чат.
Дополнительное описание