Sobre mim

Sou Slava Dubrov, também conhecido como Viacheslav Dubrov. Desenvolvo sistemas ML e AI para produção, além de liderar equipas que realizam o mesmo trabalho.

Atualmente, trabalho na equipa de Agent Execution da HubSpot, ocupando-me da implementação de LLM, da fine-tuning, da avaliação, bem como dos componentes de runtime que garantem o correto funcionamento dos agentes em ambiente de produção. Antes disso, estive envolvido na infraestrutura de recuperação de informação, ancoragem de conhecimento e gestão de memória da HubSpot, o que me permite ter uma perspetiva clara sobre os desafios que surgem após a fase de demonstração.

Por que ler este blogue

Eu escrevo as notas que gostaria de ter tido enquanto depurava sistemas AI em produção. Muitos trabalhos de AI parecem bem organizados num notebook, mas tornam‑se complexos quando usuários reais, latência, permissões, deriva de dados e custos entram em jogo. Este blog foca precisamente nessa realidade.

Contexto relevante:

Execução de Agentes HubSpot: LLM fine-tuning, otimização da inferência, avaliação de agentes e mecanismos de segurança em ambiente de produção.
Camada de Base de Dados e Contexto HubSpot Embedding: infraestrutura de recuperação de informações, ancoragem de conhecimento e gestão de memória para agentes AI.
Wayfair: sistemas de deteção de fraude e golpes, além de sistemas embedding que desenvolvi e gerei, gerando poupanças anuais na ordem dos 4 milhões de dólares.
Orador no World Agentic AI Summit Berlin 2026: “Engenharia da pilha tecnológica Agentic”.
Doutoramento em diagnóstico AI, publicações revistas por pares e patentes.
Atuação abrangendo as fases de tratamento de dados pipelines, treino, avaliação, implementação e os detalhes operacionais associados.
Operações em produção ML nas plataformas AWS e GCP, em sistemas de processamento em lote, em fluxo contínuo e em tempo real.
Código-fonte aberto, tutoriais e artigos técnicos destinados a quem desenvolve sistemas AI que precisam de funcionar de forma estável.

Fala

“Engenharia da pilha Agentic” - World Agentic AI Summit, Berlim (2026). Arquitetura de produção para sistemas agentic AI: Motor Cognitivo, Cortex (arquitetura de memória) e Raciocínio Orientado por Esquema.

Sobre o que escrevo

Principalmente falhas em produção e as medidas que adotei para resolvê-las.

Arquitetura de agente: Laços de Raciocínio de Agente AI, Arquitetura de Memória de Agente AI, AI Agente Tool Use, AI Segurança de Agente, Agente Runtime de execução contínua AI
Contexto e recuperação: Context Engineering para Agentes AI em sistemas agentic, padrões RAG
LLM desenvolvimento: LLM Fine-Tuning Guia, Raciocínio Guiado por Esquema em vLLM, Guia LoRAX Serving
Ferramentas para desenvolvedores: configuração em Python, UV no macOS, MCP Tutorial de servidor com uv e FastMCP

Radar Tecnológico

LLM serving e fine-tuning: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO

Agentes: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents

Segurança e avaliação: restrições de segurança, avaliações automatizadas, LLM como árbitro, observabilidade

Vectores e recuperação de informação: Qdrant, Faiss, busca semântica, recuperação híbrida, reranking, compressão de contexto

Ferramentas e fluxos de trabalho: MCP (Model Context Protocol), A2A, FastMCP, n8n

MLOps: AWS (duas certificações), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow

Núcleo: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars

Vamos conectar-nos

Geralmente, estou interessado em produção ML, sistemas de agente, recuperação de informação, avaliação e tarefas de limpeza em pipelines que se tornaram excessivamente complexas.