Продакшн-разработка ИИ-агентов · Модуль 6

Производительность и эксплуатация

Стоимость и латентность (prompt caching, каскад моделей, батчинг, стриминг, дистилляция, бюджеты токенов); деплой и инфраструктура (агент как сервис, конкурентность на Go, хранилища состояния, очереди, durable workflows, версионирование промптов, CI/CD и A/B); адаптация моделей (fine-tuning, дистилляция, RFT).

0 / 3 уроков

  1. 6.1 Глава 12. Стоимость и латентность
  2. 6.2 Глава 13. Деплой и инфраструктура
  3. 6.3 Глава 14. Адаптация моделей (опционально)