Sobre mí
👋 Hola, soy Slava Dubrov. Llevo más de una década poniendo en producción sistemas de ML e IA, y liderando equipos que hacen lo mismo. Actualmente estoy en el equipo de Agent Execution de HubSpot, trabajando en despliegue de LLM, fine-tuning y en conseguir que los agentes se comporten como deben. Antes de eso, pasé unos años en la infraestructura de retrieval y memoria de la que dependen esos agentes, así que cuando alucinan me lo tomo un poco como algo personal.
Por qué leer este blog
Principalmente porque estoy escribiendo lo que a mí mismo me gustaría leer. La IA en producción está llena de cosas que parecen funcionar bien en un notebook y se desmoronan el lunes. Yo prefiero la versión del lunes.
Una versión corta de lo que he hecho realmente:
- En el equipo de Agent Execution de HubSpot: fine-tuning de LLM, optimización de inferencia, evaluación de agentes y guardrails de seguridad, todo ello ejecutándose en producción.
- Antes en HubSpot, en Embedding Hub y Context Layer: la capa de retrieval, grounding y memoria detrás de los agentes de HubSpot.
- En Wayfair, unos $4M al año ahorrados mediante detección de fraude y estafas, y los sistemas de embeddings que construí y lideré.
- Ponente de "Engineering the Agentic Stack" en el World Agentic AI Summit de Berlín (2026).
- PhD en diagnóstico con IA, con artículos revisados por pares y un par de patentes.
- Cómodo trabajando end-to-end: pipelines de datos, entrenamiento, evaluación, despliegue y las partes poco glamurosas de en medio.
- Sistemas de ML en AWS y GCP, en entornos batch, streaming y tiempo real.
- Código open source, tutoriales y write-ups para gente que hace el trabajo de verdad.
Ponencias
- "Engineering the Agentic Stack" — World Agentic AI Summit, Berlín (2026). Arquitectura de producción para sistemas de IA agéntica: Cognitive Engine, Cortex (arquitectura de memoria) y Schema-Guided Reasoning.
Sobre qué escribo
Sobre todo, sobre cosas que se rompieron y lo que hice para arreglarlas.
- Arquitectura de agentes: AI Agent Reasoning Loops, AI Agent Memory Architecture, AI Agent Tool Use, AI Agent Security, Long-Running AI Agent Runtime
- Contexto y retrieval: Context Engineering for AI Agents para sistemas agénticos, patrones RAG
- Desarrollo con LLM: LLM Fine-Tuning Guide, Schema-Guided Reasoning on vLLM, LoRAX Serving Guide
- Tooling para desarrolladores: configuración de Python, uv on macOS, MCP Server Tutorial with uv and FastMCP
Radar tecnológico
Serving y fine-tuning de LLM: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO
Agentes: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents
Seguridad y evaluación: guardrails, evals automatizadas, LLM-as-a-judge, observabilidad
Vectorial y retrieval: Qdrant, Faiss, búsqueda semántica, hybrid retrieval, reranking, compresión de contexto
Herramientas y workflows: MCP (Model Context Protocol), A2A, FastMCP, n8n
MLOps: AWS (dos certificaciones), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow
Base: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars
Conectemos
Encantado de hablar, especialmente si estás trabajando en problemas difíciles de ML a escala, o si simplemente quieres que alguien te confirme que sí, que tu pipeline realmente se supone que debe ser así de complicado.