Назад на главную
EXCERFIA.CASE // 01LLM-АГЕНТИЗАЦИЯ
[ КЕЙСОВЫЙ ОТЧЕТ #1 : СВЕРХРАЗУМНЫЕ СИСТЕМЫ ]

EXCERFIA-INTELLIGENCE

Мультиагентный автономный комплекс оптимизации логистики и B2B клиентского сервиса

СКОРОСТЬ ВЫБОРКИ ИНФОРМАЦИИ
< 150 мс

Гибридный поиск по базе знаний в 400 000 единиц товаров.

МАСШТАБИРОВАНИЕ ЗАПРОСОВ
2 500 RPS

Конвейерная предобработка семантики на выделенных инференс-серверах.

СТЭК ТЕХНОЛОГИЙ ПРИМИНЕНИЯ
LlamaIndexFastAPILLM APIWeaviate

ЧТО ПРИМЕНЯЛОСЬ И СТЕК СВЯЗИ

Для достижения бескомпромиссного качества и исключения «галлюцинаций» ИИ-модели была разработана двухуровневая архитектура Retrieval-Augmented Generation (RAG).

  • Векторный слой Weaviate Cluster: все технические спецификации и регламенты компании автоматически векторизуются и хранятся в виде многомерных векторов.
  • LangGraph Router: маршутизирует запросы между 4 узкоспециализированными агентами (Логист, Продавец, Юрист и Аналитик API).
  • LLM Inference: оптимальный баланс скорости вычислений, длины контекстного окна и интеллекта в обработке JSON-вызовов инструментов.

КАК ЭТО БЫЛО РЕАЛИЗОВАНО

ФАЗА 1: СЕМАНТИЧЕСКОЕ ИНДЕКСИРОВАНИЕ

Документы разбиваются на перекрывающиеся семантические фрагменты (chunk size: 512, overlap: 64). Каждому чанку присваивается вектор высокой размерности через embedding-модель.

ФАЗА 2: ОГРАНИЧЕНИЕ ЦЕПОЧКИ РАССУЖДЕНИЙ

Использование жесткого Guardrails-валидатора для входящих запросов. Предотвращает любые попытки джейлбрейка, инъекций сторонних промптов и утечки конфиденциальной отчетной информации.

AGÈNT ORCHESTRATION CONSOLE

Введите тестовую гипотетическую задачу для ИИ-агента (например, «проверь баланс доставки на узле Тверь-3») и посмотрите, как пролетит конвейер RAG и сработает семантическое связывание.

[ СТЕП-ЛОГИ ПОТОКА ]:
Ждем ввода выше для сборки дерева шагов.