Over mij

Ik ben Slava Dubrov, ook bekend als Viacheslav Dubrov. Ik ontwikkel productie ML en AI systemen, en ik leid teams die hetzelfde doen.

Tegenwoordig werk ik bij HubSpot in het Agent uitvoeringsteam: LLM deployment, fine-tuning, evaluatie, en de runtime componenten die ervoor zorgen dat agents correct functioneert in productieomgevingen. Eerder was ik betrokken bij HubSpot’s retrieval, grounding, en geheugeninfrastructuur, waardoor ik een goed beeld heb van wat er gebeurt nadat de demo succesvol is getest.

Waarom deze blog lezen?

Ik maak notities van wat ik graag had gehad tijdens het debuggen van productiesystemen AI. Veel AI werk ziet er in een notebook netjes uit, maar wordt chaotisch zodra echte gebruikers, latency, toegangsrechten, data-drift en kosten een rol spelen. Deze blog richt zich op die aspecten.

Relevante achtergrondinformatie:

HubSpot Agent uitvoering: LLM fine-tuning, inference optimalisatie, agent evaluatie en veiligheid guardrails in productieomgevingen.
HubSpot Embedding Hub- en Contextlaag: retrieval, grounding en geheugeninfrastructuur voor AI agents.
Wayfair: systemen voor het detecteren van fraude en oplichting, plus embedding systemen die ik heb ontwikkeld en geleid, wat resulteerde in jaarlijks ongeveer 4 miljoen dollar aan besparingen.
Spreekster op de World Agentic AI Summit Berlin 2026: “Engineering the Agentic Stack”.
PhD in AI diagnostiek, peer-reviewed artikelen en patenten.
Werkzaamheden op het gebied van data pipelines, training, evaluatie, deployment en de operationele aspecten daartussen.
Productie ML op AWS en GCP voor batch-, stream- en real-time systemen.
Open source code, tutorials en documentaties voor mensen die AI systemen moeten bouwen die continu moeten draaien.

Spraakuitvoering

“Het ontwerpen van de Agentic-stack” - World Agentic AI Summit, Berlijn (2026). Productiearchitectuur voor agentic AI-systemen: Cognitive Engine, Cortex (geheugenarchitectuur) en Schema-Guided Reasoning.

Waarover ik schrijf

Voornamelijk productiefouten en de maatregelen die ik daartegen heb genomen.

Agent architectuur: AI Agent Reasoning Lussen, AI Agent Memory Architectuur, AI Agent Tool Use, AI Agent Beveiliging, Langdurig lopende AI Agent Runtime
Context en retrieval: Context Engineering voor AI Agents voor agentic-systemen, RAG-patronen
LLM ontwikkeling: LLM Fine-Tuning Gids, Schema-gestuurde Reasoning op vLLM, LoRAX Serving Gids
Ontwikkelaartooling: configuratie van Python, UV op macOS, MCP Server-tutorial met uv en FastMCP

Technologieradar

LLM serving en fine-tuning: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO

Agents: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents

Veiligheid en evaluatie: guardrails, geautomatiseerde evals, LLM-als-een-judge, observability

Vector en retrieval: Qdrant, Faiss, semantic search, hybride retrieval, reranking, context compression

Hulpmiddelen en workflows: MCP (Model Context Protocol), A2A, FastMCP, n8n

MLOps: AWS (twee certificaten), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow

Kernel: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars

Laten we een verbinding maken

Ik ben meestal geïnteresseerd in productiesystemen ML, agent, retrieval, evaluaties en opruimwerkzaamheden aan pipelines die te complex zijn geworden.