Few-shot промптинг

Суть

Few-shot примеры демонстрируют рассуждение за решением, а не только само решение. Явные пометки «почему сообщили / почему пропустили» позволяют обобщать на новые паттерны.

Сколько и какие

Самые ценные — примеры пограничных случаев: показывают, почему спорный случай попадает на ту или иную сторону черты. 2–4 точечных примера эффективнее 10+. Для извлечения включайте примеры из каждого основного формата документа — иначе переобучение на один формат.

Anti-patterns

Ловушка	Почему не работает	Верный паттерн
Дать 10+ примеров на все случаи	Раздувает токены без роста качества	2–4 примера на самые трудные, особенно пограничные случаи
Показывать только верные ответы без рассуждения	Модель копирует примеры, но не обобщает правило	Включить рассуждение: «почему сообщили / почему пропустили»
Один формат документа в извлечении	Модель выучит его, но провалится на других структурах	Примеры из каждого основного варианта документа

Exam traps

Ловушка	Почему не работает	Верный паттерн
Исчерпывающее покрытие примерами	Убывающая отдача, перерасход	2–4 точечных примера
Опустить рассуждение	Нет обобщения	Включать «почему» в каждый пример
Примеры одного формата	Хрупкость к формату	Примеры из каждого варианта

Практическое задание (T2)

Составить промпт код-ревью с 3 few-shot: настоящий баг, склонный к ложному случай для пропуска, пограничный случай с решением.
Включить рассуждение «почему сообщили / почему пропустили» в каждый пример.
Прогнать 20 образцов кода; измерить согласованность по 3 прогонам.
Сравнить с подходом «только инструкции» (без примеров) на тех же 20.
Для извлечения: добавить примеры из 3 форматов документов; измерить точность полей и долю галлюцинаций.

Проверка знаний

Извлечение структурированных данных

Конвейер извлечения из научных статей оставляет поле methodology пустым в 35% документов, хотя методология описана прямо в разделе результатов, а не в отдельном Methods. Что сделать?

A Сделать methodology обязательным в схеме, чтобы вынудить заполнение
B Добавить few-shot примеры извлечения из статей с инлайн-методологией без отдельного заголовка Methods
C Добавить цикл повторов, переотправляющий документы, где methodology пустая
D Перейти на большую модель с лучшим пониманием текста

Извлечение структурированных данных

Извлечение из сканов счетов даёт два режима сбоя: (1) имена вендоров с запятыми разбиваются неверно, (2) даты DD/MM/YYYY переставляются в MM/DD/YYYY. Что добавить?

A Один комплексный пример с верным разбором и вендора, и даты
B Два отдельных примера — один для вендоров с запятыми, один для дат DD/MM/YYYY
C По одному примеру на каждый режим сбоя, поставив самый частый сбой первым
D Три примера с разными макетами счетов

Извлечение структурированных данных

Извлечение финансовых данных из отчётных звонков даёт несогласованный формат выручки: «$1.2B», «1,200,000,000», «1.2 billion». Доступно 50 транскриптов для примеров. Что добавить?

A Все 50 транскриптов как примеры с размеченными верными выходами
B 2–3 точечных примера с точным форматом выхода, каждый с разным порядком величины выручки
C 10 примеров на все вариации формата из 50 транскриптов
D Описать правило формата в system prompt вместо примеров