Ga naar inhoud

Over mij

👋 Hoi, ik ben Slava Dubrov. Ik lever al meer dan tien jaar ML- en AI-systemen in productie op, en leid teams die hetzelfde doen. Tegenwoordig zit ik in het Agent Execution-team bij HubSpot, waar ik werk aan LLM-deployment, fine-tuning en zorgen dat agents zich gedragen. Daarvoor heb ik een paar jaar gewerkt aan de retrieval- en geheugeninfrastructuur waarop die agents steunen, dus als ze hallucineren trek ik me dat een beetje persoonlijk aan.


Waarom deze blog lezen

Vooral omdat ik opschrijf wat ik zelf zou willen lezen. Productie-AI zit vol met dingen die er in een notebook prima uitzien en op maandag uit elkaar vallen. Ik geef de voorkeur aan de maandagversie.

Een korte versie van wat ik daadwerkelijk heb gedaan:

  • Bij HubSpot's Agent Execution-team: LLM fine-tuning, inference-optimalisatie, agent-evaluatie en safety guardrails, allemaal draaiend in productie.
  • Eerder bij HubSpot, op de Embedding Hub en Context Layer: de retrieval-, grounding- en geheugenlaag achter HubSpot's agents.
  • Bij Wayfair, ongeveer $4M per jaar bespaard via fraude- en scamdetectie en de embeddingsystemen die ik heb gebouwd en geleid.
  • Gesproken over "Engineering the Agentic Stack" op de World Agentic AI Summit in Berlijn (2026).
  • PhD in AI-diagnostiek, met peer-reviewed papers en een paar patenten.
  • Comfortabel end-to-end: datapijplijnen, training, evaluatie, deployment en de minder glamoureuze stukken ertussenin.
  • ML-systemen op AWS en GCP, in batch-, streaming- en real-timeopstellingen.
  • Open-sourcecode, tutorials en write-ups voor mensen die het echte werk doen.

Spreken

  • "Engineering the Agentic Stack" — World Agentic AI Summit, Berlijn (2026). Productiearchitectuur voor agentic AI-systemen: Cognitive Engine, Cortex (geheugenarchitectuur) en Schema-Guided Reasoning.

Waar ik over schrijf

Vooral dingen die stukgingen en wat ik eraan heb gedaan.


Tech-radar

LLM serving en fine-tuning: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO

Agents: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents

Safety en evaluatie: guardrails, geautomatiseerde evals, LLM-as-a-judge, observability

Vector en retrieval: Qdrant, Faiss, semantic search, hybrid retrieval, reranking, context compression

Tools en workflows: MCP (Model Context Protocol), A2A, FastMCP, n8n

MLOps: AWS (twee certificeringen), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow

Core: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars


Laten we verbinden

Praat graag, vooral als je werkt aan lastige ML-problemen op schaal, of als je gewoon wilt dat iemand bevestigt dat ja, je pipeline echt zo ingewikkeld hoort te zijn.