Über mich
👋 Hi, ich bin Slava Dubrov. Ich liefere seit über einem Jahrzehnt produktive ML- und AI-Systeme aus und leite Teams, die genau das ebenfalls tun. Aktuell bin ich im Team Agent Execution bei HubSpot und arbeite an LLM-Deployment, Fine-Tuning und daran, dass Agenten sich vernünftig verhalten. Davor habe ich einige Jahre an der Retrieval- und Memory-Infrastruktur gearbeitet, auf die diese Agenten angewiesen sind — wenn sie also halluzinieren, nehme ich das ein bisschen persönlich.
Warum du diesen Blog lesen solltest
Vor allem, weil ich die Dinge aufschreibe, die ich selbst gern lesen würde. Production AI ist voll von Sachen, die im Notebook gut aussehen und am Montag auseinanderfallen. Ich bevorzuge die Montag-Version.
Eine kurze Zusammenfassung dessen, was ich tatsächlich gemacht habe:
- Im Team Agent Execution bei HubSpot: LLM-Fine-Tuning, Inference-Optimierung, Agenten-Evaluierung und Safety-Guardrails, alles in Produktion.
- Zuvor bei HubSpot, im Embedding Hub und Context Layer: die Retrieval-, Grounding- und Memory-Schicht hinter HubSpots Agenten.
- Bei Wayfair: rund $4M pro Jahr eingespart durch Fraud- und Scam-Detection sowie die Embedding-Systeme, die ich aufgebaut und geleitet habe.
- Vortrag zu "Engineering the Agentic Stack" auf dem World Agentic AI Summit in Berlin (2026).
- Promotion in AI-Diagnostik, mit peer-reviewten Publikationen und ein paar Patenten.
- End-to-End sicher unterwegs: Datenpipelines, Training, Evaluierung, Deployment und die unglamourösen Teile dazwischen.
- ML-Systeme auf AWS und GCP, in Batch-, Streaming- und Echtzeit-Setups.
- Open-Source-Code, Tutorials und Write-ups für Leute, die die eigentliche Arbeit machen.
Vorträge
- "Engineering the Agentic Stack" — World Agentic AI Summit, Berlin (2026). Produktionsarchitektur für agentische AI-Systeme: Cognitive Engine, Cortex (Memory-Architektur) und Schema-Guided Reasoning.
Worüber ich schreibe
Meistens über Dinge, die kaputtgegangen sind, und was ich dagegen getan habe.
- Agentenarchitektur: AI Agent Reasoning Loops, AI Agent Memory Architecture, AI Agent Tool Use, AI Agent Security, Long-Running AI Agent Runtime
- Kontext und Retrieval: Context Engineering for AI Agents für agentische Systeme, RAG-Patterns
- LLM-Entwicklung: LLM Fine-Tuning Guide, Schema-Guided Reasoning on vLLM, LoRAX Serving Guide
- Entwickler-Tooling: Python-Setup, uv on macOS, MCP Server Tutorial with uv and FastMCP
Tech-Radar
LLM-Serving und Fine-Tuning: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO
Agenten: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents
Safety und Evaluierung: Guardrails, automatisierte Evals, LLM-as-a-judge, Observability
Vektor und Retrieval: Qdrant, Faiss, Semantic Search, hybrides Retrieval, Reranking, Context Compression
Tools und Workflows: MCP (Model Context Protocol), A2A, FastMCP, n8n
MLOps: AWS (zwei Zertifizierungen), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow
Core: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars
Lass uns vernetzen
Ich freue mich auf den Austausch — besonders, wenn du an schwierigen ML-Problemen im großen Maßstab arbeitest oder einfach jemanden brauchst, der dir bestätigt, dass deine Pipeline ja, tatsächlich so kompliziert sein soll.