Claude Certified Architect · Модуль 4 · Урок 4.2
Few-shot промптинг
Суть
Few-shot примеры демонстрируют рассуждение за решением, а не только само решение. Явные пометки «почему сообщили / почему пропустили» позволяют обобщать на новые паттерны.
Сколько и какие
Самые ценные — примеры пограничных случаев: показывают, почему спорный случай попадает на ту или иную сторону черты. 2–4 точечных примера эффективнее 10+. Для извлечения включайте примеры из каждого основного формата документа — иначе переобучение на один формат.
Anti-patterns
| Ловушка | Почему не работает | Верный паттерн |
|---|---|---|
| Дать 10+ примеров на все случаи | Раздувает токены без роста качества | 2–4 примера на самые трудные, особенно пограничные случаи |
| Показывать только верные ответы без рассуждения | Модель копирует примеры, но не обобщает правило | Включить рассуждение: «почему сообщили / почему пропустили» |
| Один формат документа в извлечении | Модель выучит его, но провалится на других структурах | Примеры из каждого основного варианта документа |
Exam traps
| Ловушка | Почему не работает | Верный паттерн |
|---|---|---|
| Исчерпывающее покрытие примерами | Убывающая отдача, перерасход | 2–4 точечных примера |
| Опустить рассуждение | Нет обобщения | Включать «почему» в каждый пример |
| Примеры одного формата | Хрупкость к формату | Примеры из каждого варианта |
Практическое задание (T2)
- Составить промпт код-ревью с 3 few-shot: настоящий баг, склонный к ложному случай для пропуска, пограничный случай с решением.
- Включить рассуждение «почему сообщили / почему пропустили» в каждый пример.
- Прогнать 20 образцов кода; измерить согласованность по 3 прогонам.
- Сравнить с подходом «только инструкции» (без примеров) на тех же 20.
- Для извлечения: добавить примеры из 3 форматов документов; измерить точность полей и долю галлюцинаций.
Проверка знаний
Извлечение структурированных данных
Конвейер извлечения из научных статей оставляет поле methodology пустым в 35% документов, хотя методология описана прямо в разделе результатов, а не в отдельном Methods. Что сделать?
Верный ответ: B
B верно. Модель ищет в отдельном разделе и не обобщает на инлайн-описание без примеров такой структуры; few-shot учит нужному паттерну. A вызывает галлюцинацию — обязательность без починки извлечения. C — модель смотрит в то же место. D — это ошибочный диагноз: дело в формате промпта, не в способностях.
Извлечение структурированных данных
Извлечение из сканов счетов даёт два режима сбоя: (1) имена вендоров с запятыми разбиваются неверно, (2) даты DD/MM/YYYY переставляются в MM/DD/YYYY. Что добавить?
Верный ответ: C
C верно. Точечные примеры, изолирующие каждый сбой, эффективнее; самый частый первым даёт неявное взвешивание. A мешает понять, что что починило. B по сути верно, но упускает принцип порядка. D улучшает обобщение, но не бьёт по известным сбоям.
Извлечение структурированных данных
Извлечение финансовых данных из отчётных звонков даёт несогласованный формат выручки: «$1.2B», «1,200,000,000», «1.2 billion». Доступно 50 транскриптов для примеров. Что добавить?
Верный ответ: B
B верно. 2–3 удачных примера задают нужный формат точно и экономно. A (50) резко растит стоимость при убывающей отдаче. C (10) больше нужного. D (только описание) слабее примеров для навязывания формата.