Обо мне
👋 Привет, я Slava Dubrov. Я уже больше десяти лет вывожу ML- и AI-системы в production и руковожу командами, которые делают то же самое. Сейчас я в команде Agent Execution в HubSpot, где занимаюсь deployment LLM, fine-tuning и тем, чтобы агенты вели себя как надо. До этого я несколько лет работал над retrieval- и memory-инфраструктурой, на которую опираются эти агенты, так что когда они галлюцинируют, я воспринимаю это немного слишком лично.
Зачем читать этот блог
В основном потому, что я записываю то, что сам хотел бы прочитать. В production AI полно вещей, которые выглядят нормально в ноутбуке и разваливаются в понедельник. Мне ближе версия для понедельника.
Коротко о том, что я реально делал:
- В команде Agent Execution в HubSpot: fine-tuning LLM, оптимизация inference, оценка агентов и safety guardrails — всё это работает в production.
- Ранее в HubSpot, в Embedding Hub и Context Layer: retrieval, grounding и memory layer, стоящие за агентами HubSpot.
- В Wayfair: около $4M в год экономии за счёт detection fraud и scam, а также embedding-систем, которые я строил и которыми руководил.
- Выступал с докладом "Engineering the Agentic Stack" на World Agentic AI Summit в Берлине (2026).
- PhD по AI diagnostics, peer-reviewed статьи и пара патентов.
- Уверенно работаю end-to-end: data pipelines, training, evaluation, deployment и всеми негламурными частями между ними.
- ML-системы на AWS и GCP, в batch, streaming и real-time конфигурациях.
- Open source код, туториалы и технические разборы для тех, кто делает реальную работу.
Выступления
- "Engineering the Agentic Stack" — World Agentic AI Summit, Берлин (2026). Production-архитектура для agentic AI systems: Cognitive Engine, Cortex (memory architecture) и Schema-Guided Reasoning.
О чём я пишу
В основном о том, что ломалось, и что я с этим делал.
- Архитектура агентов: Циклы рассуждений AI-агентов, Архитектура памяти AI-агентов, Использование инструментов AI-агентами, Безопасность AI-агентов, Runtime для долгоживущих AI-агентов
- Контекст и retrieval: Context Engineering для AI-агентов для agentic systems, паттерны RAG
- Разработка LLM: Руководство по fine-tuning LLM, Schema-Guided Reasoning на vLLM, Руководство по LoRAX Serving
- Инструменты разработчика: настройка Python, uv на macOS, Туториал по MCP Server с uv и FastMCP
Технический радар
Serving и fine-tuning LLM: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO
Агенты: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents
Безопасность и evaluation: guardrails, automated evals, LLM-as-a-judge, observability
Векторный поиск и retrieval: Qdrant, Faiss, semantic search, hybrid retrieval, reranking, context compression
Инструменты и workflow: MCP (Model Context Protocol), A2A, FastMCP, n8n
MLOps: AWS (две сертификации), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow
База: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars
На связи
Буду рад пообщаться, особенно если вы решаете сложные ML-задачи в масштабе или вам просто нужен кто-то, кто подтвердит: да, ваш pipeline и правда должен быть настолько сложным.