Sobre mí

Soy Slava Dubrov, también conocido como Viacheslav Dubrov. Diseño sistemas ML y AI para entornos de producción, además de dirigir equipos que realizan tareas similares.

Actualmente formo parte del equipo de Agent Execution en HubSpot, donde me ocupo de la implementación de LLM, el fine-tuning, la evaluación, así como de los componentes de runtime que determinan el comportamiento de los agentes en entornos de producción. Antes de eso, trabajé en la infraestructura de recuperación de información, anclaje semántico y memoria de HubSpot, por lo que dispongo de conocimientos sobre lo que ocurre una vez que la demostración funciona correctamente.

Por qué leer este blog

Escribo las notas que hubiera deseado tener mientras depuraba sistemas AI en entorno de producción. Gran parte del trabajo AI parece ordenado en un cuaderno de notas, pero se vuelve complicado cuando entran en juego usuarios reales, latencias, permisos, deriva de datos y costes. Este blog se centra precisamente en esa faceta.

Contexto relevante:

Ejecución de HubSpot Agent: LLM fine-tuning, optimización de la inferencia, evaluación de los agentes y mecanismos de seguridad en entornos de producción.
Capa de núcleo y contexto de HubSpot Embedding: infraestructura de recuperación de información, anclaje semántico y gestión de memoria para agentes AI.
Wayfair: sistemas de detección de fraude y estafas, además de los sistemas embedding que desarrollé y dirigí, lo que generó un ahorro anual de aproximadamente 4 millones de dólares.
Orador en la Cumbre Mundial de Agentic AI en Berlín 2026: “Ingeniería de la pila tecnológica Agentic”.
Doctorado en diagnóstico AI, artículos revisados por pares y patentes.
Trabajo en áreas como el procesamiento de datos pipelines, entrenamiento, evaluación, despliegue y los aspectos operativos relacionados con ellos.
Entorno de producción ML en AWS y GCP, tanto para sistemas por lotes como en tiempo real o continuo.
Código de fuente abierto, tutoriales y documentación para quienes desarrollan sistemas AI que deben funcionar de manera estable.

Habla

“Ingeniería de la pila Agentic” - Cumbre Mundial de Agentic AI, Berlín (2026). Arquitectura de producción para sistemas agentic AI: Motor Cognitivo, Cortex (arquitectura de memoria) y Razonamiento Guiado por Esquemas.

De qué escribo

En su mayoría, fallos en producción y las medidas que tomé al respecto.

Arquitectura de agente: AI Bucles de razonamiento del agente, AI Arquitectura de memoria del agente, AI Agente Tool Use, AI Seguridad de agentes, Agente Runtime de ejecución prolongada AI
Contexto y recuperación de información: Context Engineering para Agentes AI En los sistemas agentic, los patrones RAG
LLM desarrollo: LLM Fine-Tuning Guía, Razonamiento guiado por esquema en vLLM, Guía de LoRAX Serving
Herramientas para desarrolladores: configuración de Python, UV en macOS, MCP Tutorial de servidor con uv y FastMCP

Radar tecnológico

LLM serving y fine-tuning: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO

Agentes: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents

Seguridad y evaluación: medidas de contención, pruebas automatizadas, LLM como árbitro, observabilidad

Vectores y recuperación de información: Qdrant, Faiss, búsqueda semántica, recuperación híbrida, reranking, compresión de contexto

Herramientas y flujos de trabajo: MCP (Model Context Protocol), A2A, FastMCP, n8n

MLOps: AWS (dos certificaciones), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow

Núcleo: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars

Conectémonos

Por lo general, me interesa la fase de producción ML, los sistemas de agente, la recuperación de información, la evaluación, así como las tareas de limpieza en pipelines que se han vuelto excesivamente complejas.