Claude Certified Architect · Модуль 5 · Урок 5.6

Сохранение происхождения данных и работа с неопределённостью при синтезе из многих источников

Суть

Структурированные сопоставления «утверждение–источник» (URL, дата публикации, релевантная цитата) должны проходить через синтез, а не суммироваться в прозу. Проза безвозвратно срывает атрибуцию (URL, статистику, даты).

Конфликты и время

Конфликтующую статистику аннотируйте обоими источниками с атрибуцией и методологическим контекстом — пусть читатель решит, не выбирайте произвольно. Временны́е различия требуют дат публикации: 35% (2020) против 67% (2023) — это эволюция, а не противоречие.

Структурированное сопоставление утверждение–источник
claimMapping := map[string]any{
	"claim":             "Внедрение ИИ среди Fortune 500 достигло 67%",
	"source_url":        "https://example.com/report",
	"source_name":       "McKinsey",
	"publication_date":  "2023-09",
	"relevant_excerpt":  "...67% of Fortune 500 companies...",
	"methodology_notes": "опрос 500 CIO, самоотчёт",
	"confidence":        0.8,
}

Anti-patterns

ЛовушкаПочему не работаетВерный паттерн
Суммировать находки в прозу перед синтезомПроза срывает URL, статистику, даты; атрибуция потеряна навсегдаПередавать структурированные сопоставления; синтез сливает данные с сохранённой атрибуцией
Выбрать более качественный источник, отбросив конфликтующийОба могут быть верны в разных контекстах (время, популяция, методология)Аннотировать конфликт обоими источниками, датами, методологическим контекстом
Опускать даты публикации в выводахВременна́я эволюция (35%→67%) выглядит как противоречиеТребовать даты публикации и сбора данных во всех выводах субагентов

Exam traps

ЛовушкаПочему не работаетВерный паттерн
Прозаическая суммаризацияБезвозвратно срывает атрибуциюСтруктурированные сопоставления
Выбор одного источникаОшибочное допущение, что оба не верныАннотировать оба
Без датВременна́я эволюция кажется разногласиемТребовать даты

Практическое задание (T6)

  • Спроектировать схему субагента: claim, source_url, source_name, publication_date, relevant_excerpt, methodology_notes, confidence.
  • Велеть синтезатору сохранять сопоставления при объединении; проверить, что цитаты доживают до финального вывода.
  • Дать две конфликтующие статистики из надёжных источников; проверить, что синтез аннотирует обе с атрибуцией, а не выбирает.
  • Дать находки с разными годами публикации (2020, 2022, 2024); проверить трактовку как эволюции, а не противоречия.
  • Построить финальный отчёт с разделами: устоявшиеся находки, спорные (с аннотацией источников), пробелы покрытия.

Проверка знаний

Потеря атрибуции при синтезе

Синтез объединяет находки субагентов веб-поиска и анализа документов. Каждый возвращает прозаические сводки. В финальном отчёте статистика без источников, утверждения без атрибуции, нет прослеживаемости. Структурное решение?

  • A Велеть синтезатору: «всегда включай ссылки на источники»
  • B Требовать от субагентов структурированные сопоставления утверждение–источник, которые синтез обязан сохранять и сливать, а не суммировать в прозу
  • C Велеть субагентам включать цитаты в прозаические сводки
  • D Пост-синтезный проход извлечения цитат для трассировки находок

Конфликт отчётов аналитиков (McKinsey 67% vs Gartner 45%)

McKinsey сообщает 67% внедрения ИИ среди Fortune 500; Gartner — 45%. Оба надёжны, тот же год. Как синтезу поступить?

  • A Взять McKinsey (67%), отбросить Gartner
  • B Усреднить до 56%
  • C Аннотировать конфликт обеими цифрами, атрибуцией источников, методологическим контекстом; пусть читатель интерпретирует
  • D Пометить для человеческого ревью; опустить обе до разрешения

Смешение региональных/канальных цифр

Отчёт гласит: «Рост выручки 23–31% CAGR подтверждён тремя источниками». Разбор: источник A (Северная Америка 23%), B (Азия-Тихоокеанский регион 31%), C (только цифровые каналы 27%). Синтез фактически неверен. Корень?

  • A Синтез галлюцинировал цифры
  • B Синтез использовал неверную формулу усреднения
  • C Синтез смешал цифры с разными областями охвата; потерял происхождение, которое выявило бы несовместимость
  • D Три источника противоречивы; их надо исключить