Перейти к содержанию

Обо мне

👋 Привет, я Slava Dubrov. Я уже больше десяти лет вывожу ML- и AI-системы в production и руковожу командами, которые делают то же самое. Сейчас я в команде Agent Execution в HubSpot, где занимаюсь deployment LLM, fine-tuning и тем, чтобы агенты вели себя как надо. До этого я несколько лет работал над retrieval- и memory-инфраструктурой, на которую опираются эти агенты, так что когда они галлюцинируют, я воспринимаю это немного слишком лично.


Зачем читать этот блог

В основном потому, что я записываю то, что сам хотел бы прочитать. В production AI полно вещей, которые выглядят нормально в ноутбуке и разваливаются в понедельник. Мне ближе версия для понедельника.

Коротко о том, что я реально делал:

  • В команде Agent Execution в HubSpot: fine-tuning LLM, оптимизация inference, оценка агентов и safety guardrails — всё это работает в production.
  • Ранее в HubSpot, в Embedding Hub и Context Layer: retrieval, grounding и memory layer, стоящие за агентами HubSpot.
  • В Wayfair: около $4M в год экономии за счёт detection fraud и scam, а также embedding-систем, которые я строил и которыми руководил.
  • Выступал с докладом "Engineering the Agentic Stack" на World Agentic AI Summit в Берлине (2026).
  • PhD по AI diagnostics, peer-reviewed статьи и пара патентов.
  • Уверенно работаю end-to-end: data pipelines, training, evaluation, deployment и всеми негламурными частями между ними.
  • ML-системы на AWS и GCP, в batch, streaming и real-time конфигурациях.
  • Open source код, туториалы и технические разборы для тех, кто делает реальную работу.

Выступления

  • "Engineering the Agentic Stack" — World Agentic AI Summit, Берлин (2026). Production-архитектура для agentic AI systems: Cognitive Engine, Cortex (memory architecture) и Schema-Guided Reasoning.

О чём я пишу

В основном о том, что ломалось, и что я с этим делал.


Технический радар

Serving и fine-tuning LLM: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO

Агенты: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents

Безопасность и evaluation: guardrails, automated evals, LLM-as-a-judge, observability

Векторный поиск и retrieval: Qdrant, Faiss, semantic search, hybrid retrieval, reranking, context compression

Инструменты и workflow: MCP (Model Context Protocol), A2A, FastMCP, n8n

MLOps: AWS (две сертификации), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow

База: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars


На связи

Буду рад пообщаться, особенно если вы решаете сложные ML-задачи в масштабе или вам просто нужен кто-то, кто подтвердит: да, ваш pipeline и правда должен быть настолько сложным.