О себе

Я — Slava Dubrov, также известный как Viacheslav Dubrov. Я разрабатываю производственные системы на основе методов машинного обучения и ИИ, а также руководю командами, занимающимися тем же.

В настоящее время я работаю в команде Agent Execution в HubSpot: занимаюсь развертыванием больших языковых моделей, их доработкой, оценкой, а также элементами работы в реальном времени, которые определяют поведение агентов в производственной среде. До этого я работал над инфраструктурой поиска информации, связывания данных с контекстом и хранения информации в HubSpot, поэтому у меня есть четкое представление о том, что происходит после успешной демонстрации функционала.

Зачем читать этот блог

Я пишу заметки, которые хотел бы иметь при отладке производственных систем ИИ. Многие проекты в области ИИ выглядят аккуратно в ноутбуках для разработки, но становятся сложными, когда в игру вступают реальные пользователи, задержки, права доступа, изменения данных и расходы. Этот блог посвящен именно такой стороне работы.

Релевантный опыт:

HubSpot Agent Execution: доработка больших языковых моделей, оптимизация процессов вывода результатов, оценка агентов и реализация механизмов безопасности в производственной среде.
HubSpot Embedding Hub и Context Layer: инфраструктура поиска информации, связывания данных с контекстом и хранения информации для ИИ-агентов.
Wayfair: системы обнаружения мошенничества и подделок, а также системы эмбеддингов, которые я разработал и возглавлял; ежегодная экономия составила около 4 млн долларов.
Докладчик на World Agentic AI Summit Berlin 2026: «Инженерия стека агентных систем».
Доктор наук в области диагностики ИИ, статьи, рассмотренные в рецензируемых изданиях, и патенты.
Опыт работы с данными, процессами обучения, оценки, развертывания и операционными аспектами, связанными с ними.
Производственные системы машинного обучения на платформах AWS и GCP в режимах пакетной обработки, потоковой обработки и в реальном времени.
Открытый исходный код, учебные материалы и статьи для тех, кто разрабатывает системы ИИ, должные работать в продакшене.

Выступления

«Инженерия стека агентных систем» — Всемирный саммит по агентным ИИ, Берлин (2026). Архитектура производства для агентных ИИ-систем: когнитивный двигатель, Cortex (архитектура памяти) и рассуждения с использованием схем.

О чём я пишу

В основном о сбоях в производстве и о том, что я делал для их устранения.

Архитектура агента: Циклы рассуждения ИИ-агента, Архитектура памяти агента ИИ, Использование инструментов агента ИИ, Безопасность AI-агентов, Среда выполнения долгоживущих агентов ИИ
Контекст и извлечение: Инжиниринг контекста для ИИ-агентов для агентных систем — шаблоны RAG
Разработка больших языковых моделей: Руководство по фин-тюнингу LLM, Расчеты с использованием схем в vLLM, Руководство по развертыванию LoRAX
Инструменты для разработчиков: настройка среды Python, UV-инструменты в macOS, Учебник по серверу MCP с использованием uv и FastMCP

Технологический радар

Обслуживание и настройка LLM: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO

Агенты: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents

Безопасность и оценка: механизмы контроля, автоматизированные тесты, использование LLM в качестве судьи, возможности наблюдения

Векторные базы данных и поиск: Qdrant, Faiss, семантический поиск, гибридные методы поиска, переранкинг, компрессия контекста

Инструменты и рабочие процессы: MCP (Model Context Protocol), A2A, FastMCP, n8n

MLOps: AWS (два сертификата), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow

Основные языки и фреймворки: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars

Давайте свяжемся

Я обычно интересуюсь промышленным использованием методов машинного обучения, системами агентов, механизмами поиска информации, процедурами оценки качества моделей, а также оптимизацией работающих пайплайнов, которые стали слишком сложными для управления.