Продакшн-разработка ИИ-агентов · Модуль 6
Производительность и эксплуатация
Стоимость и латентность (prompt caching, каскад моделей, батчинг, стриминг, дистилляция, бюджеты токенов); деплой и инфраструктура (агент как сервис, конкурентность на Go, хранилища состояния, очереди, durable workflows, версионирование промптов, CI/CD и A/B); адаптация моделей (fine-tuning, дистилляция, RFT).
0 / 3 уроков