Материал предназначен для участников моего сообщества в телеграме https://t.me/ainovasapiens

Этот подход был исследован 28 Mar 2025 в работе "QuestBench: Can LLMs ask the right question to acquire information in reasoning tasks?"

Пруф: https://arxiv.org/pdf/2503.22674

Исследование QuestBench оценивает, насколько хорошо большие языковые модели (LLM) умеют задавать правильные уточняющие вопросы, когда им не хватает информации для решения задач на логику, планирование или математику. Результаты показывают, что LLM справляются с математическими задачами лучше, чем с логикой и планированием, и часто затрудняются определить, какую именно информацию им нужно запросить, даже если способны решить задачу при полной информации.

Объяснение сути метода

Суть исследования заключается в проверке способности LLM не просто отвечать на запросы, а активно выявлять неполноту информации и формулировать корректные уточняющие вопросы. Авторы создали бенчмарк QuestBench, где для решения каждой задачи (логической, на планирование, математической) не хватает ровно одного фрагмента данных. LLM предлагается выбрать наиболее подходящий уточняющий вопрос из предложенного списка вариантов.

Методология использует формализацию неполных задач как "задач удовлетворения ограничений с пропущенными переменными" (Constraint Satisfaction Problem, CSP). Исследователи анализируют, как различные LLM справляются с разными типами таких задач:

Logic-Q: Логические задачи, где не хватает одного утверждения.
Planning-Q: Задачи планирования (например, перемещение блоков) с частично описанным начальным состоянием.
GSM-Q / GSME-Q: Школьные математические задачи, представленные в текстовом виде (GSM-Q) или в виде уравнений (GSME-Q), где отсутствует одно числовое значение или условие.

Главные выводы для пользователя:

LLM не универсальны в запросе информации: Модели гораздо лучше справляются с выявлением недостающих данных в математических задачах, чем в задачах, требующих логических выводов или планирования последовательности действий. Если ваша задача относится к последним, будьте особенно внимательны к полноте исходных данных.
Умение решать ≠ умение спрашивать: То, что LLM может решить задачу при всех известных, не означает, что она поймет, чего именно ей не хватает, если вы что-то упустили.
Склонность к "галлюцинациям" или поспешным выводам: LLM часто предпочитают попытаться ответить на основе неполных данных, вместо того чтобы признать их нехватку (например, редко выбирают опцию "не уверен").
Структура помогает: Более формализованное или структурированное представление задачи (например, математические уравнения вместо словесного описания) может помочь LLM лучше идентифицировать недостающие элементы.

Эти выводы подчеркивают, что при работе с LLM над задачами, требующими рассуждений на основе потенциально неполных данных, пользователю необходимо активно управлять процессом, а не пассивно ожидать, что модель сама всё поймет и спросит.

Практический пример #1

Представим, что предприниматель хочет получить от LLM идеи для маркетинговой кампании нового продукта.

Стандартный (менее эффективный) промт:

codeПридумай идеи для маркетинговой кампании моего нового фитнес-приложения.

LLM, скорее всего, выдаст общие маркетинговые тактики, не учитывая специфику продукта, аудитории или бюджета.

Улучшенный промт с учетом выводов исследования:

markdown# Задача: Разработка концепции маркетинговой кампании для нового фитнес-приложения

Привет! Мне нужна твоя помощь в разработке идей для маркетинговой кампании нашего нового фитнес-приложения "[Название Приложения, если есть, или 'X-Fit']".

## Шаг 1: Анализ предоставленной информации и определение пробелов

Прежде чем генерировать конкретные идеи для кампании, пожалуйста, внимательно проанализируй информацию о продукте, которую я предоставлю ниже, и выполни следующие действия:

1.  **Определи, какая **критически важная информация** для разработки эффективной маркетинговой стратегии отсутствует в моем описании.** Подумай о целевой аудитории, уникальном торговом предложении (УТП), конкурентной среде, доступном бюджете, предыдущем опыте маркетинга (если был) и ключевых показателях эффективности (KPI), которые мы хотим достичь.
2.  **Сформулируй 3-5 наиболее важных уточняющих вопросов ко мне.** Эти вопросы должны помочь тебе заполнить пробелы и получить данные, необходимые для создания релевантных и действенных предложений.

**Пожалуйста, на этом этапе НЕ предлагай никаких маркетинговых идей или тактик. Твоя задача — только оценить полноту информации и задать мне точные вопросы для ее дополнения.**

### Информация о продукте:
*   **Название:** X-Fit (рабочее)
*   **Основная функция:** Персонализированные программы тренировок на основе ИИ и отслеживание прогресса.
*   **Ключевые особенности:** Адаптивные планы, интеграция с носимыми устройствами, геймификация, сообщество пользователей.
*   **Ценовая модель:** Подписка (базовая бесплатная версия с ограниченным функционалом, премиум-подписка с полным доступом).

## Шаг 2: Генерация идей для маркетинговой кампании (после моих ответов)

*Этот шаг мы выполним после того, как я предоставлю ответы на твои вопросы из Шага 1.*

---

**Ожидаемый результат от тебя сейчас (Шаг 1):**
Список из 3-5 уточняющих вопросов, направленных на сбор недостающей информации для планирования маркетинговой кампании.

Ожидаемый ответ от LLM (примерный):

markdownОтлично! Чтобы предложить вам наиболее эффективные идеи для маркетинговой кампании X-Fit, мне действительно нужно лучше понять несколько ключевых аспектов. Вот мои уточняющие вопросы:

1.  **Кто является вашей основной целевой аудиторией?** (например, возраст, пол, уровень физической подготовки, интересы, цели – похудение, набор массы, поддержание формы и т.д.)
2.  **В чем заключается уникальное торговое предложение (УТП) X-Fit по сравнению с уже существующими популярными фитнес-приложениями (например, MyFitnessPal, Nike Training Club, Strava)?** Какие именно преимущества выгодно отличают вас?
3.  **Какой ориентировочный бюджет вы готовы выделить на маркетинговую кампанию на первые 3-6 месяцев?** (Это поможет определить масштаб и доступные каналы).
4.  **На каких географических рынках вы планируете запускать приложение в первую очередь?**
5.  **Какие ключевые показатели эффективности (KPI) будут для вас основными при оценке успеха кампании?** (например, количество загрузок, число активных пользователей, конверсия в платную подписку, узнаваемость бренда).

Почему это работает (аналогично предыдущему примеру):

Предотвращение общих советов: Вместо того чтобы сразу выдавать стандартный набор маркетинговых приемов (SMM, инфлюенсеры, контент-маркетинг), LLM вынуждена сначала "подумать" о том, какие данные ей нужны для целевого совета.
Выявление ключевых драйверов стратегии: Вопросы LLM о целевой аудитории, УТП, бюджете и KPI — это фундаментальные элементы любой маркетинговой стратегии. Запрос этой информации сразу направляет дальнейшую работу в правильное русло.
Экономия времени пользователя: Пользователю не приходится перебирать кучу неподходящих идей. Он сразу предоставляет точечную информацию, на основе которой LLM сможет сгенерировать более качественные и применимые предложения.
Обучение пользователя (косвенно): Формулируя такие вопросы, LLM косвенно напоминает пользователю о важнейших аспектах, которые нужно учитывать при планировании маркетинга, даже если он сам о них не подумал.

Практически пример применения #2

Представим, что пользователь хочет получить от LLM совет по выбору подарка на день рождения.

Стандартный (менее эффективный) промт:

Посоветуй, что подарить подруге на день рождения.

LLM, скорее всего, выдаст общие или случайные идеи, так как отсутствует ключевая информация.

Улучшенный промт с учетом выводов исследования:

# Задача: Подобрать идеи для подарка на день рождения подруге

Привет! Мне нужна твоя помощь в выборе подарка для моей подруги [Имя Подруги, если хотите указать, или просто "подруги"].

## Шаг 1: Анализ информации и запрос уточнений

Прежде чем предлагать какие-либо конкретные идеи подарков, пожалуйста, выполни следующие действия:

1.  **Определи, какой информации тебе не хватает, чтобы дать действительно полезный и персонализированный совет.** Подумай, какие аспекты о моей подруге и ситуации важны для выбора хорошего подарка.
2.  **Сформулируй 3-4 четких вопроса ко мне**, которые помогут тебе получить эту недостающую информацию. Постарайся, чтобы вопросы были направлены на выяснение ее интересов, хобби, стиля жизни, предыдущих подарков, которые ей нравились или не нравились, а также моего бюджета на подарок.

**Пожалуйста, не предлагай никаких идей подарков на этом шаге. Твоя задача — только задать уточняющие вопросы.**

## Шаг 2: Предложение идей (после моих ответов)

*Этот шаг мы выполним позже, после того как я отвечу на твои вопросы из Шага 1.*

---

**Ожидаемый результат от тебя сейчас (Шаг 1):**
Список из 3-4 уточняющих вопросов.

Ожидаемый ответ от LLM (примерный):

markdownХорошо, я помогу вам с выбором подарка! Чтобы мои советы были максимально полезными, мне действительно нужна дополнительная информация. Вот мои уточняющие вопросы:

1.  **Каковы основные увлечения или хобби вашей подруги?** (Например, чтение, спорт, искусство, путешествия, кулинария, технологии и т.д.)
2.  **Есть ли у нее какие-то особые предпочтения или стиль, который ей нравится?** (Например, минимализм, яркие цвета, практичные вещи, предметы роскоши, хендмейд и т.п.)
3.  **Какой примерно бюджет вы планируете выделить на подарок?**
4.  **Были ли какие-то подарки в прошлом, которые ей особенно понравились или, наоборот, не подошли?** Это поможет понять ее ожидания.

После этого пользователь отвечает на вопросы, и уже на следующем шаге LLM, имея больше данных, сможет предложить более релевантные идеи.

Почему это работает:

Этот промпт работает эффективно благодаря использованию следующих практических механик, основанных на выводах исследования QuestBench:

Явное делегирование задачи анализа полноты информации (Механика: "Принудительная проверка на входе"): Вместо того чтобы полагаться на то, что LLM сама догадается о нехватке данных, промпт явно инструктирует: "Определи, какой информации тебе не хватает...". Это напрямую адресует слабость LLM в самостоятельном выявлении неполноты запроса, показанную в исследовании.
Инструкция на формулировку уточняющихвопросов (Механика: "Стимуляция активного запроса данных"): Команда "Сформулируй 3-4 четких вопроса ко мне..." заставляет LLM перейти к активному сбору информации. Исследование показало, что LLM плохо справляются с этим без явного указания, особенно в неструктурированных задачах.
Многошаговое взаимодействие (Механика: "Разделяй и властвуй"): Промпт разбивает процесс на два четких шага: сначала сбор информации, потом генерация идей. Фраза "Пожалуйста, не предлагай никаких идей подарков на этом шаге. Твоя задача — только задать уточняющие вопросы" предотвращает преждевременные и часто нерелевантные ответы, которые LLM склонны давать при нехватке данных (как показало исследование, модели избегают опции "не уверен").
Конкретизация ожидаемого результата для первого этапа (Механика: "Четкое задание"): Указание "Ожидаемый результат от тебя сейчас (Шаг 1): Список из 3-4 уточняющих вопросов" не оставляет LLM пространства для интерпретации и направляет ее на выполнение именно той задачи, которая поможет преодолеть проблему неполноты данных.
Контекстуализация запроса (Механика: "Структурирование проблемы"): Хотя задача о подарке кажется простой, даже здесь предоставление заголовка # Задача: Подобрать идеи для подарка на день рождения подруге и разделение на шаги помогает LLM лучше понять общую цель и структуру взаимодействия. Исследование намекает, что более структурированный ввод (как GSME-Q по сравнению с GSM-Q) улучшает способность LLM работать с информацией.

Таким образом, промпт не просто просит совета, а управляет процессом взаимодействия, заставляя LLM сначала выполнить те действия (анализ полноты, запрос уточнений), которые она обычно выполняет плохо или не выполняет вовсе по своей инициативе. Он превращает неявную потребность в информации в явную, первостепенную задачу для модели.

Практически пример применения #3

Промт для проактивного запроса информации в чат-боте поддержки

Ты — ассистент службы поддержки клиентов интернет-магазина электроники. Твоя задача — помочь решить проблему клиента. Следуй этим инструкциям:

1. Анализ проблемы
- Внимательно прочитай запрос пользователя
- Определи, достаточно ли информации для решения проблемы
- Если информации недостаточно, определи МИНИМАЛЬНЫЙ набор дополнительных данных, которые необходимы
2. Проактивный запрос информации
- Если выявлен недостаток информации, задай КОНКРЕТНЫЕ вопросы для уточнения
- Задавай вопросы четко и по одному
- Объясни пользователю, почему эта информация необходима для решения проблемы
3. Решение проблемы
- После получения всей необходимой информации, предложи решение
- Если решение невозможно, объясни почему
Важно:
- НЕ угадывай детали, которые не были предоставлены
- НЕ пытайся решить проблему при недостатке критической информации
- Если неуверен между двумя вариантами запроса информации, выбирай тот, что даст наибольшую определенность независимо от ответа
Помни: качественное решение проблемы важнее скорости ответа.

Почему это работает

Этот промт эффективно использует ключевые выводы исследования QuestBench для улучшения взаимодействия с пользователями:

Формализация проблемы недостатка информации: Промт явно требует от модели определить, достаточно ли информации для решения задачи, что соответствует концепции CSP из исследования.
Минимизация запрашиваемой информации: Инструкция найти "МИНИМАЛЬНЫЙ набор дополнительных данных" отражает концепцию "1-достаточных" задач из исследования, где нужно определить минимальный набор переменных для решения.
Структурированный подход к запросу информации: Промт предписывает задавать вопросы четко и по одному, что помогает модели избежать информационной перегрузки и сосредоточиться на критической информации.
Объяснение необходимости запроса: Требование объяснить, почему информация нужна, заставляет модель построить внутреннюю модель задачи и понять причинно-следственные связи.
Предотвращение гаданий: Исследование показало, что модели часто не признают свою неуверенность при недостатке информации. Явный запрет на угадывание деталей помогает избежать этой проблемы.
Критерий выбора вопроса: Инструкция выбирать вопрос, который "даст наибольшую определенность независимо от ответа", напрямую соответствует методологии QuestBench, где модель должна выбрать вопрос, который лучше всего поможет решить задачу.

Такой подход особенно эффективен для сложных задач с многими переменными, где исследование показало, что модели часто затрудняются определить, какой именно информации не хватает.

Анализ практической применимости:

Прямая применимость:

Осознанная полнота промтов: Зная, что LLM испытывают трудности с запросом дополнительной информации (особенно в логике и планировании), пользователи могут стремиться предоставлять максимально полные и однозначные данные в своих первоначальных запросах.
Явная инструкция на проверку: Можно включать в промт указание для LLM: "Прежде чем давать ответ, проанализируй, вся ли необходимая информация у тебя есть. Если нет, точно укажи, какие данные тебе нужно уточнить." Это помогает бороться со склонностью LLM "додумывать".
Структурирование информации: При постановке задач, особенно тех, что можно разбить на компоненты (например, математические, анализа данных, планирования), представление информации в структурированном виде (списки фактов, переменных, целей) может помочь LLM лучше «увидеть» недостающие элементы.

Концептуальная ценность:

Понимание ограничений LLM: Исследование дает ясное понимание, что текущие LLM, несмотря на их впечатляющие способности, имеют существенные ограничения в активном сборе недостающей информации. Это не "всезнающие оракулы", а инструменты, требующие правильного "пилотирования".
Разница между "решением" и "пониманием нехватки": Пользователь начинает лучше понимать, что способность LLM решить задачу с полными данными и способность определить, чего не хватает для решения – это два разных навыка, и второй развит слабее.
Важность "недоверия по умолчанию": Осознание, что LLM склонны давать ответ даже при нехватке данных, побуждает пользователя критичнее относиться к ответам и при необходимости проводить дополнительную верификацию или стимулировать LLM к запросу уточнений.

Потенциал для адаптации:

Разработка многошаговых промтов: Пользователь может проектировать взаимодействие с LLM в несколько этапов:

Этап 1: Предоставление имеющейся информации и запрос к LLM на анализ полноты и идентификацию недостающих данных.
Этап 2: Предоставление запрошенной LLM информации.
Этап 3: Запрос на решение основной задачи.

Создание шаблонов промтов с "блоком проверки": Можно разработать стандартные блоки для своих промтов, которые всегда включают фазу, где LLM сначала оценивает полноту данных и запрашивает уточнения, прежде чем перейти к выполнению основной части запроса. Это особенно полезно для повторяющихся типов задач.
Применение в LLM-агентах: Для тех, кто использует или разрабатывает LLM-агентов, выводы исследования указывают на необходимость встраивания в логику агента явных шагов по оценке информационной достаточности и генерации уточняющих вопросов перед выполнением действий в реальном мире или сложных вычислений.

Узнайте больше о научно-практических выводах в промпт-инжиниринге

Свободный доступ
1. Архив со статьями, построенных на исследованиях https://drive.google.com/file/d/1v2tDUwmqIVa4QT74Qie9vVrxLQX0trCE/view?usp=sharing

2. Книга с 1/4 исследований с краткими выводами по методам промпт-инижиниринга:
https://drive.google.com/file/d/1UdWJ3eb-cr2sp0EJP-q58o__KUlrlFf8/view?usp=sharing

3. Доступ к боту-консультанту по этой базе исследований:
https://t.me/NovaPromptResearch_bot
Задавайте боту вопросы, касающиеся исследований.
Бот находится в beta-фазе. Баги по боту отправляйте в эту ветку https://t.me/novasapiens_chat/296

Полный доступ ко всем практическим методам из свежих исследований https://t.me/novasapiens_bot?start=botgetreseach