Über mich

Ich bin Slava Dubrov, auch bekannt als Viacheslav Dubrov. Ich entwickle produktionsreife ML- und KI-Systeme sowie leite Teams, die dasselbe tun.

Derzeit arbeite ich im Team Agent Execution bei HubSpot: dort kümmere ich mich um den Einsatz von LLMs, deren Feinabstimmung, Bewertung sowie um die Komponenten im Laufzeitumfeld, die dafür sorgen, dass Agenten in der Produktion ordnungsgemäß funktionieren. Zuvor war ich an HubSpots Infrastrukturen für Informationsabruf, Kontextverarbeitung und Speicherung beteiligt, wodurch ich fundierte Einschätzungen zu den Aspekten nach dem erfolgreichen Testlauf habe.

Warum diesen Blog lesen?

Ich schreibe die Notizen, die ich mir gewünscht hätte, als ich Produktions-KI-Systeme debuggte. Viele KI-Projekte sehen in Notebooks sauber aus, werden jedoch unübersichtlich, sobald reale Nutzer, Latenzzeiten, Berechtigungen, Datenverschiebungen und Kosten eine Rolle spielen. Dieser Blog konzentriert sich auf genau diese Situation.

Relevante Hintergrundinformationen:

HubSpot Agent Execution: Feinabstimmung von LLMs, Optimierung der Inferenzprozesse, Bewertung von Agenten sowie Sicherheitsmechanismen in der Produktion.
HubSpot Embedding Hub und Context Layer: Infrastrukturen für Informationsabruf, Kontextverarbeitung und Speicherung von KI-Agenten.
Wayfair: Systeme zur Erkennung von Betrug und Scams sowie eingebettete Systeme, die ich entwickelt und geleitet habe – mit jährlichen Einsparungen von rund 4 Mio. US-Dollar.
Redner auf dem World Agentic AI Summit Berlin 2026: „Engineering the Agentic Stack“.
Doktortitel in KI-Diagnostik, wissenschaftlich geprüfte Artikel und Patente.
Arbeit an Datenpipelines, Schulungsprozessen, Bewertungen, Implementierungen sowie den operativen Aspekten dazwischen.
Produktionsreife ML-Lösungen auf AWS und GCP in Batch-, Streaming- und Echtzeitsystemen.
Open-Source-Code, Tutorials und Dokumentationen für Entwickler, die KI-Systeme erstellen müssen, die kontinuierlich laufen sollen.

Vorträge

„Engineering the Agentic Stack“ – World Agentic AI Summit, Berlin (2026). Produktionsarchitektur für agentebasierte KI-Systeme: Cognitive Engine, Cortex (Speicherarchitektur) sowie schema-gesteuertes Reasoning.

Worüber ich schreibe

Hauptsächlich Produktionsfehler und die Maßnahmen, die ich dagegen ergriffen habe.

Agentenarchitektur: Reifungszyklen von KI-Agenten, Architektur der Speicherverwaltung für KI-Agenten, Verwendung von Tools für KI-Agenten, Security von KI-Agenten, Laufzeitumgebung für langlaufende KI-Agenten
Kontext und Abruf: Kontextengineering für KI-Agenten Für agierende Systeme: Muster des RAG-Ansatzes
Entwicklung von LLMs: Leitfaden zur Feinabstimmung von LLMs, Schema-gestütztes Reasoning bei vLLM, LoRAX-Bereitstellungsleitfaden
Entwicklerwerkzeuge: Python-Einrichtung, UV auf macOS, Tutorial zum MCP-Server mit uv und FastMCP

Technologieradar

LLM-Server und Feinabstimmung: vLLM, LoRAX, LoRA/QLoRA, VLMs, SGR/SO

Agenten: LangGraph, Claude, Google ADK, CrewAI, LlamaIndex, SmolAgents

Sicherheit und Bewertung: Sicherheitsmechanismen, automatisierte Evaluierungen, LLM als Richter, Observabilität

Vektoren und Abruf: Qdrant, Faiss, semantische Suche, hybrider Abruf, Neubewertung, Kontextkompression

Tools und Workflows: MCP (Model Context Protocol), A2A, FastMCP, n8n

MLOps: AWS (zwei Zertifizierungen), GCP/Vertex AI, Kubernetes, Kubeflow, Airflow, Ray, MLflow

Grundlagen: Python, SQL, Scala, Java, Rust, PyTorch, FastAPI, Spark, Polars

Lassen Sie uns in Kontakt treten

Ich beschäftige mich in der Regel mit Produktionsszenarien im Bereich Machine Learning, Agentensystemen, Retrieval-Methoden, Bewertungskonzepten sowie der Optimierung von Pipelines, die zu komplex geworden sind.