Zum Inhalt

Über mich

👋 Hi, ich bin Slava Dubrov. Ich liefere seit über einem Jahrzehnt produktive ML- und AI-Systeme aus und leite Teams, die genau das ebenfalls tun. Aktuell bin ich im Team Agent Execution bei HubSpot und arbeite an LLM-Deployment, Fine-Tuning und daran, dass Agenten sich vernünftig verhalten. Davor habe ich einige Jahre an der Retrieval- und Memory-Infrastruktur gearbeitet, auf die diese Agenten angewiesen sind — wenn sie also halluzinieren, nehme ich das ein bisschen persönlich.


Warum du diesen Blog lesen solltest

Vor allem, weil ich die Dinge aufschreibe, die ich selbst gern lesen würde. Production AI ist voll von Sachen, die im Notebook gut aussehen und am Montag auseinanderfallen. Ich bevorzuge die Montag-Version.

Eine kurze Zusammenfassung dessen, was ich tatsächlich gemacht habe:

  • Im Team Agent Execution bei HubSpot: LLM-Fine-Tuning, Inference-Optimierung, Agenten-Evaluierung und Safety-Guardrails, alles in Produktion.
  • Zuvor bei HubSpot, im Embedding Hub und Context Layer: die Retrieval-, Grounding- und Memory-Schicht hinter HubSpots Agenten.
  • Bei Wayfair: rund $4M pro Jahr eingespart durch Fraud- und Scam-Detection sowie die Embedding-Systeme, die ich aufgebaut und geleitet habe.
  • Vortrag zu "Engineering the Agentic Stack" auf dem World Agentic AI Summit in Berlin (2026).
  • Promotion in AI-Diagnostik, mit peer-reviewten Publikationen und ein paar Patenten.
  • End-to-End sicher unterwegs: Datenpipelines, Training, Evaluierung, Deployment und die unglamourösen Teile dazwischen.
  • ML-Systeme auf AWS und GCP, in Batch-, Streaming- und Echtzeit-Setups.
  • Open-Source-Code, Tutorials und Write-ups für Leute, die die eigentliche Arbeit machen.

Vorträge

  • "Engineering the Agentic Stack" — World Agentic AI Summit, Berlin (2026). Produktionsarchitektur für agentische AI-Systeme: Cognitive Engine, Cortex (Memory-Architektur) und Schema-Guided Reasoning.

Worüber ich schreibe

Meistens über Dinge, die kaputtgegangen sind, und was ich dagegen getan habe.


Tech-Radar

LLM-Serving und Fine-Tuning: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO

Agenten: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents

Safety und Evaluierung: Guardrails, automatisierte Evals, LLM-as-a-judge, Observability

Vektor und Retrieval: Qdrant, Faiss, Semantic Search, hybrides Retrieval, Reranking, Context Compression

Tools und Workflows: MCP (Model Context Protocol), A2A, FastMCP, n8n

MLOps: AWS (zwei Zertifizierungen), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow

Core: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars


Lass uns vernetzen

Ich freue mich auf den Austausch — besonders, wenn du an schwierigen ML-Problemen im großen Maßstab arbeitest oder einfach jemanden brauchst, der dir bestätigt, dass deine Pipeline ja, tatsächlich so kompliziert sein soll.