Ir para o conteúdo

Sobre Mim

👋 Olá, sou Slava Dubrov. Tenho colocado em produção sistemas de ML e IA há mais de uma década, e liderado equipas que fazem o mesmo. Atualmente, estou na equipa de Agent Execution da HubSpot, a trabalhar em deployment de LLM, fine-tuning e em fazer com que os agentes se comportem. Antes disso, passei alguns anos na infraestrutura de retrieval e memória de que esses agentes dependem, por isso, quando alucinam, levo isso um pouco para o lado pessoal.


Porque ler este blogue

Sobretudo porque estou a escrever aquilo que eu próprio gostaria de ler. A IA de produção está cheia de coisas que parecem funcionar bem num notebook e se desfazem na segunda-feira. Eu prefiro a versão de segunda-feira.

Uma versão curta do que realmente fiz:

  • Na equipa de Agent Execution da HubSpot: fine-tuning de LLM, otimização de inferência, avaliação de agentes e safety guardrails, tudo a correr em produção.
  • Antes, na HubSpot, no Embedding Hub e Context Layer: a camada de retrieval, grounding e memória por trás dos agentes da HubSpot.
  • Na Wayfair, cerca de $4M por ano poupados através de deteção de fraude e burlas e dos sistemas de embeddings que construí e liderei.
  • Apresentei \"Engineering the Agentic Stack\" no World Agentic AI Summit, em Berlim (2026).
  • Doutoramento em diagnóstica de IA, com artigos revistos por pares e um par de patentes.
  • À vontade de ponta a ponta: pipelines de dados, treino, avaliação, deployment e as partes pouco glamorosas pelo meio.
  • Sistemas de ML em AWS e GCP, em configurações batch, streaming e real-time.
  • Código open source, tutoriais e write-ups para quem faz o trabalho a sério.

Palestras

  • \"Engineering the Agentic Stack\" — World Agentic AI Summit, Berlim (2026). Arquitetura de produção para sistemas de IA agentic: Cognitive Engine, Cortex (arquitetura de memória) e Schema-Guided Reasoning.

Sobre o que escrevo

Sobretudo sobre coisas que falharam e o que fiz para resolver.


Radar tecnológico

Serving e fine-tuning de LLM: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO

Agentes: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents

Segurança e avaliação: guardrails, evals automatizadas, LLM-as-a-judge, observability

Vector e retrieval: Qdrant, Faiss, pesquisa semântica, hybrid retrieval, reranking, context compression

Ferramentas e workflows: MCP (Model Context Protocol), A2A, FastMCP, n8n

MLOps: AWS (duas certificações), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow

Base: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars


Vamos ligar-nos

Todo o gosto em falar, especialmente se estiveres a trabalhar em problemas difíceis de ML à escala, ou se só quiseres que alguém confirme que sim, o teu pipeline é mesmo suposto ser assim tão complicado.