Saltar a contenido

Sobre mí

👋 Hola, soy Slava Dubrov. Llevo más de una década poniendo en producción sistemas de ML e IA, y liderando equipos que hacen lo mismo. Actualmente estoy en el equipo de Agent Execution de HubSpot, trabajando en despliegue de LLM, fine-tuning y en conseguir que los agentes se comporten como deben. Antes de eso, pasé unos años en la infraestructura de retrieval y memoria de la que dependen esos agentes, así que cuando alucinan me lo tomo un poco como algo personal.


Por qué leer este blog

Principalmente porque estoy escribiendo lo que a mí mismo me gustaría leer. La IA en producción está llena de cosas que parecen funcionar bien en un notebook y se desmoronan el lunes. Yo prefiero la versión del lunes.

Una versión corta de lo que he hecho realmente:

  • En el equipo de Agent Execution de HubSpot: fine-tuning de LLM, optimización de inferencia, evaluación de agentes y guardrails de seguridad, todo ello ejecutándose en producción.
  • Antes en HubSpot, en Embedding Hub y Context Layer: la capa de retrieval, grounding y memoria detrás de los agentes de HubSpot.
  • En Wayfair, unos $4M al año ahorrados mediante detección de fraude y estafas, y los sistemas de embeddings que construí y lideré.
  • Ponente de "Engineering the Agentic Stack" en el World Agentic AI Summit de Berlín (2026).
  • PhD en diagnóstico con IA, con artículos revisados por pares y un par de patentes.
  • Cómodo trabajando end-to-end: pipelines de datos, entrenamiento, evaluación, despliegue y las partes poco glamurosas de en medio.
  • Sistemas de ML en AWS y GCP, en entornos batch, streaming y tiempo real.
  • Código open source, tutoriales y write-ups para gente que hace el trabajo de verdad.

Ponencias

  • "Engineering the Agentic Stack" — World Agentic AI Summit, Berlín (2026). Arquitectura de producción para sistemas de IA agéntica: Cognitive Engine, Cortex (arquitectura de memoria) y Schema-Guided Reasoning.

Sobre qué escribo

Sobre todo, sobre cosas que se rompieron y lo que hice para arreglarlas.


Radar tecnológico

Serving y fine-tuning de LLM: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO

Agentes: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents

Seguridad y evaluación: guardrails, evals automatizadas, LLM-as-a-judge, observabilidad

Vectorial y retrieval: Qdrant, Faiss, búsqueda semántica, hybrid retrieval, reranking, compresión de contexto

Herramientas y workflows: MCP (Model Context Protocol), A2A, FastMCP, n8n

MLOps: AWS (dos certificaciones), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow

Base: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars


Conectemos

Encantado de hablar, especialmente si estás trabajando en problemas difíciles de ML a escala, o si simplemente quieres que alguien te confirme que sí, que tu pipeline realmente se supone que debe ser así de complicado.