Claude Certified Architect · Модуль 4 · Урок 4.2

Few-shot промптинг

Суть

Few-shot примеры демонстрируют рассуждение за решением, а не только само решение. Явные пометки «почему сообщили / почему пропустили» позволяют обобщать на новые паттерны.

Сколько и какие

Самые ценные — примеры пограничных случаев: показывают, почему спорный случай попадает на ту или иную сторону черты. 2–4 точечных примера эффективнее 10+. Для извлечения включайте примеры из каждого основного формата документа — иначе переобучение на один формат.

Anti-patterns

ЛовушкаПочему не работаетВерный паттерн
Дать 10+ примеров на все случаиРаздувает токены без роста качества2–4 примера на самые трудные, особенно пограничные случаи
Показывать только верные ответы без рассужденияМодель копирует примеры, но не обобщает правилоВключить рассуждение: «почему сообщили / почему пропустили»
Один формат документа в извлеченииМодель выучит его, но провалится на других структурахПримеры из каждого основного варианта документа

Exam traps

ЛовушкаПочему не работаетВерный паттерн
Исчерпывающее покрытие примерамиУбывающая отдача, перерасход2–4 точечных примера
Опустить рассуждениеНет обобщенияВключать «почему» в каждый пример
Примеры одного форматаХрупкость к форматуПримеры из каждого варианта

Практическое задание (T2)

  • Составить промпт код-ревью с 3 few-shot: настоящий баг, склонный к ложному случай для пропуска, пограничный случай с решением.
  • Включить рассуждение «почему сообщили / почему пропустили» в каждый пример.
  • Прогнать 20 образцов кода; измерить согласованность по 3 прогонам.
  • Сравнить с подходом «только инструкции» (без примеров) на тех же 20.
  • Для извлечения: добавить примеры из 3 форматов документов; измерить точность полей и долю галлюцинаций.

Проверка знаний

Извлечение структурированных данных

Конвейер извлечения из научных статей оставляет поле methodology пустым в 35% документов, хотя методология описана прямо в разделе результатов, а не в отдельном Methods. Что сделать?

  • A Сделать methodology обязательным в схеме, чтобы вынудить заполнение
  • B Добавить few-shot примеры извлечения из статей с инлайн-методологией без отдельного заголовка Methods
  • C Добавить цикл повторов, переотправляющий документы, где methodology пустая
  • D Перейти на большую модель с лучшим пониманием текста

Извлечение структурированных данных

Извлечение из сканов счетов даёт два режима сбоя: (1) имена вендоров с запятыми разбиваются неверно, (2) даты DD/MM/YYYY переставляются в MM/DD/YYYY. Что добавить?

  • A Один комплексный пример с верным разбором и вендора, и даты
  • B Два отдельных примера — один для вендоров с запятыми, один для дат DD/MM/YYYY
  • C По одному примеру на каждый режим сбоя, поставив самый частый сбой первым
  • D Три примера с разными макетами счетов

Извлечение структурированных данных

Извлечение финансовых данных из отчётных звонков даёт несогласованный формат выручки: «$1.2B», «1,200,000,000», «1.2 billion». Доступно 50 транскриптов для примеров. Что добавить?

  • A Все 50 транскриптов как примеры с размеченными верными выходами
  • B 2–3 точечных примера с точным форматом выхода, каждый с разным порядком величины выручки
  • C 10 примеров на все вариации формата из 50 транскриптов
  • D Описать правило формата в system prompt вместо примеров