Over mij
👋 Hoi, ik ben Slava Dubrov. Ik lever al meer dan tien jaar ML- en AI-systemen in productie op, en leid teams die hetzelfde doen. Tegenwoordig zit ik in het Agent Execution-team bij HubSpot, waar ik werk aan LLM-deployment, fine-tuning en zorgen dat agents zich gedragen. Daarvoor heb ik een paar jaar gewerkt aan de retrieval- en geheugeninfrastructuur waarop die agents steunen, dus als ze hallucineren trek ik me dat een beetje persoonlijk aan.
Waarom deze blog lezen
Vooral omdat ik opschrijf wat ik zelf zou willen lezen. Productie-AI zit vol met dingen die er in een notebook prima uitzien en op maandag uit elkaar vallen. Ik geef de voorkeur aan de maandagversie.
Een korte versie van wat ik daadwerkelijk heb gedaan:
- Bij HubSpot's Agent Execution-team: LLM fine-tuning, inference-optimalisatie, agent-evaluatie en safety guardrails, allemaal draaiend in productie.
- Eerder bij HubSpot, op de Embedding Hub en Context Layer: de retrieval-, grounding- en geheugenlaag achter HubSpot's agents.
- Bij Wayfair, ongeveer $4M per jaar bespaard via fraude- en scamdetectie en de embeddingsystemen die ik heb gebouwd en geleid.
- Gesproken over "Engineering the Agentic Stack" op de World Agentic AI Summit in Berlijn (2026).
- PhD in AI-diagnostiek, met peer-reviewed papers en een paar patenten.
- Comfortabel end-to-end: datapijplijnen, training, evaluatie, deployment en de minder glamoureuze stukken ertussenin.
- ML-systemen op AWS en GCP, in batch-, streaming- en real-timeopstellingen.
- Open-sourcecode, tutorials en write-ups voor mensen die het echte werk doen.
Spreken
- "Engineering the Agentic Stack" — World Agentic AI Summit, Berlijn (2026). Productiearchitectuur voor agentic AI-systemen: Cognitive Engine, Cortex (geheugenarchitectuur) en Schema-Guided Reasoning.
Waar ik over schrijf
Vooral dingen die stukgingen en wat ik eraan heb gedaan.
- Agentarchitectuur: AI Agent Reasoning Loops, AI Agent Memory Architecture, AI Agent Tool Use, AI Agent Security, Long-Running AI Agent Runtime
- Context en retrieval: Context Engineering for AI Agents voor agentic systemen, RAG-patronen
- LLM-ontwikkeling: LLM Fine-Tuning Guide, Schema-Guided Reasoning on vLLM, LoRAX Serving Guide
- Developer tooling: Python-setup, uv on macOS, MCP Server Tutorial with uv and FastMCP
Tech-radar
LLM serving en fine-tuning: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO
Agents: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents
Safety en evaluatie: guardrails, geautomatiseerde evals, LLM-as-a-judge, observability
Vector en retrieval: Qdrant, Faiss, semantic search, hybrid retrieval, reranking, context compression
Tools en workflows: MCP (Model Context Protocol), A2A, FastMCP, n8n
MLOps: AWS (twee certificeringen), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow
Core: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars
Laten we verbinden
Praat graag, vooral als je werkt aan lastige ML-problemen op schaal, of als je gewoon wilt dat iemand bevestigt dat ja, je pipeline echt zo ingewikkeld hoort te zijn.