Tradução automática
Este artigo foi traduzido automaticamente a partir da versão original em inglês.
Edge of Context
Engenharia prática de IA por Slava Dubrov. Escrevo sobre as partes dos sistemas de IA que têm de sobreviver em produção: runtimes de agentes, memória, segurança, retrieval, avaliação, infraestrutura de LLM e as ferramentas de desenvolvimento à sua volta.
Comece aqui
- Arquitetura de agentes: loops de raciocínio, memória, uso de ferramentas, segurança e runtimes de longa duração.
- Retrieval e avaliação: avaliação de RAG, ranking de pesquisa e engenharia de contexto.
- Infraestrutura de LLM: fine-tuning, structured outputs no vLLM, serving com LoRAX e conceitos de engenharia de LLM.
- Ferramentas de desenvolvimento: uv no macOS, pyproject.toml e LLMs locais no macOS.
Escrita recente
O arquivo completo está no índice do blog. Para contexto sobre o autor, palestras em conferências e cobertura de tópicos, veja Sobre mim.