Автоматический перевод
Эта статья была автоматически переведена с оригинальной английской версии.
Edge of Context
Практическая AI-инженерия от Славы Дуброва. Я пишу о тех частях AI-систем, которые должны выдерживать production: runtime-архитектуры агентов, память, безопасность, retrieval, evaluation, инфраструктура LLM и developer tooling вокруг них.
Начните здесь
- Архитектура агентов: циклы рассуждений, память, использование инструментов, безопасность и долгоживущие runtime-системы.
- Retrieval и evaluation: оценка RAG, ранжирование поиска и контекстная инженерия.
- Инфраструктура LLM: fine-tuning, структурированные выходы vLLM, сервинг LoRAX и концепции LLM-инженерии.
- Developer tooling: uv на macOS, pyproject.toml и локальные LLM на macOS.
Последние публикации
Полный архив доступен в индексе блога. Информацию об авторе, доклады на конференциях и обзор тем смотрите в разделе Обо мне.