Claude соглашается со всем: 4 промпта против ИИ-подхалима в Claude Code

Опубликовано 30.05.202613 мин чтенияСредний
Поток кода от Claude Code, угрожающий аутентификации, направляется четырьмя промптами в упорядоченный поток.
Что узнаешь
  • Готовый 4-шаговый цикл промптов, который блокирует поспешные решения Claude
  • Что именно изменилось в Opus 4.8 и почему модель сильнее «поддакивает» именно сейчас
  • Когда цикл нужен, а когда тратить на него 15 минут бессмысленно
  • Как связать Plan Mode, папку plans/ и команду /goal в одну рабочую систему
Применить за 30 мин
Сэкономит 4 ч
Средний
13просмотров
1поделились
Что понадобится

Каждый день в Telegram-канале - что нового в вайб-кодинге: инструменты, ловушки, готовые промпты. Подпишись, чтобы быть в курсе актуального.

Что такое ИИ-подхалим в Claude Code

В психологии для этого был давно термин - сикофантия. Подлиза, который говорит то, что хочется услышать, лишь бы не сорвать ритм разговора. С появлением больших языковых моделей слово перекочевало в ИИ-исследования, и Anthropic в одном из официальных разборов открыто признала: модель регулярно жертвует точностью ради быстрого согласия.

В кодинге это выглядит так. Ты пишешь Claude Code: «почини вот эту ошибку в authMiddleware, перестали проходить magic-link». Подхалим не задаёт уточняющих вопросов. Не просит лог. Не уточняет, какая версия библиотеки. Сразу даёт решение - потому что натренирован быть полезным быстро. И решение будет выглядеть правильно: импорты, обработка ошибок, комментарии. Но это будет решение чужой задачи, придуманной из контекста, который Claude собрал по обрывкам.

Причина не в Claude. Причина в формулировке запроса. Когда ты спрашиваешь «как починить?» - ты уже допустил, что починка возможна. Подхалим подхватит эту рамку и выдаст «починку», даже если на самом деле проблема в архитектуре, в версии библиотеки или в том, что описанный симптом - всего лишь следствие совершенно другой корневой ошибки.

Простой тест на подхалимский запрос. Если на вопрос «что именно сломано?» я не могу ответить в три предложения - я не дозрел до решения. Мне нужен диагноз. Починка - следующий шаг. И именно с этого места начинается 4-шаговый цикл.

Из моей практики: 8 коммитов отката за час

Конкретный случай из апреля 2026. Работал над магик-линк авторизацией в src/lib/auth/. Симптом: токены валидируются, но сессия не сохраняется. Юзер кликает по ссылке из письма, попадает на сайт, через пять секунд опять выкидывает на /login.

Открыл Claude Code, набрал: «не сохраняется сессия после magic-link, посмотри в src/lib/auth/ и почини». Claude задал три уточняющих вопроса, потом сразу выдал план. В плане было: «обновлю обработчик callback, перепишу сериализатор JWT, добавлю явное сохранение в Redis, исправлю race condition в middleware». Звучало правдоподобно. Я подтвердил план.

Через 18 минут получил дифф на 14 файлов. Магик-линк по-прежнему не работал. Зато перестал работать рефреш-токен, развалился логин через пароль, и появился странный 500 на роуте оплаты. Тесты падали. Я начал откатывать.

Откатил 8 коммитов через git reset --hard origin/main. Час работы в трубу. Если хочется понять, как корректно откатываться, не теряя ничего полезного, я разобрал это отдельно в гайде про откат изменений в Claude Code.

Сел разбираться по-человечески. Открыл src/lib/auth/magic-link.ts:42, прочитал руками, открыл логи, проверил Redis. Через 20 минут нашёл. Проблема была в одной строке - в set-cookie отсутствовал атрибут SameSite=lax, и Safari резал куку при редиректе с домена письма обратно на сайт. Никакого JWT, никакого Redis, никакого middleware. Одна строчка.

Claude, когда я попросил его починить, никогда не заглядывал в логи браузера. У него не было контекста про Safari. Он построил гипотезу из паттерна «не сохраняется сессия = проблема с сериализацией», потому что это самый частый ответ в обучающих данных. Подхалим выдал решение, которое статистически правдоподобно, но к моей задаче не имело отношения.

Вывод я выписал себе в правила: никогда не задавать вопрос «как починить?», всегда «установи факты». Дальше осталось формализовать это в рабочий цикл.

Откуда берётся подхалим: Opus 4.8 при launch и май 2026

29 мая 2026 отраслевое издание про вайб-кодинг выпустило отдельную сводку про релиз Claude Opus 4.8.

Пользователи r/ClaudeAI зафиксировали, что Opus 4.8 открывает большинство ответов сигналами согласия в течение часов после публичного релиза.

aiweekly.co, https://aiweekly.co/alerts/claude-opus-48-flagged-for-sycophancy-at-launch

Зафиксированные паттерны: модель начинает ответ с фразы «ты прав, что...»; формулировки несогласия упакованы в комплименты; исправления подаются как «дополнения», а не как «возражения». Это означает буквально следующее: даже когда вы говорите Claude «эта идея плохая», новая модель прежде, чем согласиться, найдёт повод вас похвалить за саму постановку вопроса.

Тренд шире одного релиза. В мае 2026 Nature опубликовал исследование, где показал прямую связь: чем сикофантнее чатбот, тем больше ошибок в ответах. Сам по себе вывод не сенсационный, но впервые он отыгран в академическом издании со ссылкой на конкретные модели.

В апреле Anthropic в инженерном постмортеме отдельно разбирали, как баг кеширования в Claude Code заставил модель «забывать» рассуждения между ходами.

Этот баг находился на пересечении управления контекстом Claude Code, Anthropic API и расширенного мышления.

Anthropic Engineering, https://www.anthropic.com/engineering/april-23-postmortem
Когда модель забывает свою цепочку рассуждений, ей легче «угадать» ответ из паттерна - то есть включить подхалима ещё сильнее.

Что делать в свете релиза 4.8. Не выбирать модель «попроще». Не возвращаться на 4.7. Адаптировать промпты под факт: модель сильнее настроена соглашаться, значит, давить на «установи факты» нужно громче. Если вы пока не разобрались, что именно меняется внутри Opus 4.8, я подробно сравнивал это в обзоре Opus 4.8 в Claude Code.

Когда 4 шага нужны, а когда тратить на них время лишнее

ОтветЧто делать
Да, могу перечислить файлы и измененияДелай напрямую, без Plan Mode
Нет, не уверен в файлах, но знаю что менятьPlan Mode без 4-шагового цикла
Не уверен ни в файлах, ни в подходе4-шаговый цикл обязателен
Симптом непонятный, не воспроизводится локально4-шаговый цикл + нулевой шаг с минимальным воспроизводимым примером

Конкретные примеры. Поправить копи в письме приветствия - делай напрямую. Добавить новую кнопку CTA на сайт - Plan Mode без цикла. Перевести проект с MySQL на Postgres - 4-шаговый цикл обязателен. Странный 500 на проде, который не воспроизводится локально - 4-шаговый цикл с дополнительным «нулевым» шагом «давай сначала соберём минимальный воспроизводимый пример».

Главная ошибка, которую я наблюдаю в чате практикума, - применять цикл к мелочам. Это убивает скорость и быстро отбивает желание пользоваться методологией. Цикл нужен ровно там, где стоимость ошибки выше стоимости 15 минут планирования.

Прежде чем разворачивать сам цикл, держи в голове, что все четыре промпта работают внутри одной сессии Plan Mode. Если ты не пользовался этим режимом раньше - сначала прочитай гайд про Plan Mode в Claude Code, а потом возвращайся.

Хочешь блокировать подхалима и параллельно собирать связку, которая делает Claude стабильным? 4-шаговый цикл - один кирпичик. На практикуме за 3 эфира собираешь три кита: ИИ-клон + Второй мозг + Контекст-инжиниринг - и эта связка превращает Claude из «помощника с галлюцинациями» в рабочий инструмент.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 9–11 июня  ·  2 000 ₽
Записаться →

Шаг 1. Запрет решений - заставить Claude установить факты

Самый важный шаг. Здесь блокируется первый порыв - «вот решение». Промпт:

Я столкнулся со следующим: [симптом].

Сейчас твоя задача - установить факты. Запрещены любые
решения, идеи, советы. Только:
- что я наблюдаю (точная формулировка симптома)
- воспроизводимые шаги (минимальный сценарий)
- какие данные есть (логи, версии, окружение)
- какие данные отсутствуют (что нужно собрать дополнительно)

Жёсткое стоп-условие: не предлагать решений, только
фиксировать диагноз. Если хочешь предложить - вместо
этого сформулируй вопрос ко мне.

Что это даёт. Claude, получив явный запрет на решения, не может срезать угол. Он вынужден заполнить четыре поля: что вижу, как повторить, что знаю, чего не знаю. Последнее поле - самое ценное. Часто там оказывается: «не знаю версию библиотеки, не знаю что в логах, не знаю работает ли симптом в проде». Это рычаг для следующего шага.

Подводный камень шага 1. Если симптом сформулирован слишком расплывчато («не работает авторизация»), Claude всё равно скатится в догадки. Лекарство - в самом промпте: явно описать точный симптом одним предложением и минимальный сценарий из трёх шагов. Если этого не получается - значит, ты пока не понял, что именно сломано, и ответ Claude бесполезен в принципе.

Шаг 2. Прецеденты из интернета вместо галлюцинаций из памяти

Здесь блокируется второй порыв - «выдумать решение из головы». Промпт:

Теперь когда диагноз установлен, найди в интернете
прецеденты решения подобных проблем.

Минимум 3 разных подхода. Для каждого:
- ссылка на первоисточник (issue, статья, документация)
- краткое описание подхода
- плюсы и минусы для нашей ситуации
- известные подводные камни

Запрещены ссылки на собственные знания без подтверждения
ссылкой. Если не находишь прецедента - явно скажи об этом.

Эффект на практике. Claude уходит во внешний мир и приносит верифицируемые подходы. Появляются ссылки на GitHub issues, Stack Overflow, документацию. Если Claude не находит прецедентов - это сигнал, что задача редкая или симптом сформулирован неправильно. Возвращаешься к Шагу 1.

Где это ломается. Claude может процитировать ссылку, которой не существует. Это галлюцинация в стиле «вот issue номер 4291 в репозитории X», а issue 4291 на самом деле про что-то другое. Лечится явным правилом в CLAUDE.md: «всегда открывай ссылку через WebFetch перед тем, как процитировать». Подробнее - в гайде про настройку CLAUDE.md правильно.

Шаг 3. Детальный план в файле plans/ с рисками вперёд

Здесь Plan Mode уже работает как задумано. Промпт:

Возьми лучший вариант из Шага 2 и распиши детальный
план в файл plans/YYYY-MM-DD-fix-[название].md:

- какие конкретные файлы трогаем (полные пути и номера строк)
- что добавляем, что удаляем
- какие тесты пишем, какие существующие должны пройти
- риски на 2-3 шага вперёд (что может сломаться у пользователей)
- план отката если что-то пошло не так

Каждый шаг - чек-бокс [ ]. Файл должен помещаться на экран.
Если план длиннее 200 строк - разбей на фазы.

Результат на выходе. План становится артефактом вместо временной заметки в чате. Его можно прочитать через две недели, передать другому агенту, использовать в качестве условия для команды /goal. План в файле живёт дольше, чем диалог в Claude Code.

Ключевая часть - риски на 2-3 шага вперёд. Это блокирует ещё один паттерн подхалима - оптимистичный план без побочных эффектов. Когда заставляешь Claude явно перечислить риски, он находит вещи, которые молча проглотил бы в обычном плане.

Шаг 4. Самопроверка плана - поймать подхалимские допущения

Финальный фильтр. Промпт:

Теперь обязательная самопроверка. Перечитай свой план честно.

В нём есть места, которые ты взял с потолка и не подтвердил:
- кодом, который ты прочитал;
- документацией, на которую сослался в Шаге 2;
- прецедентом из Шага 2?

Если есть - отметь их явно, переделай или удали.

Дополнительно проверь:
- упоминаются ли библиотеки, которые ещё не установлены
  в package.json;
- упоминаются ли переменные окружения, которые я не задавал;
- есть ли в плане шаги, которые ты описал общими словами
  вместо конкретики.

Что это даёт. Claude вынужден перепроверить собственное мышление. На моей выборке из примерно 50 циклов минимум 2-3 пункта плана правятся именно на Шаге 4. Это места, где подхалим в Шаге 3 пытался проскочить, и Шаг 4 его ловит.

После четырёх шагов план готов к одобрению. На реализацию переходишь без напряга «а вдруг откатывать 8 коммитов».

Почему ровно 4 шага, а не 2 и не 7

Объяснение в логике, которой Anthropic ведёт Claude в своей официальной документации.

Если позволить Claude сразу перейти к коду, можно получить решение не той проблемы. Используйте Plan Mode, чтобы отделить исследование от исполнения.

Claude Code Docs, https://code.claude.com/docs/en/best-practices
Рекомендуемый workflow в документации - четыре фазы: Explore, Plan, Implement, Commit.

Мой 4-шаговый цикл - это специализация фазы Plan для борьбы с подхалимом. Из четырёх фаз Anthropic я разворачиваю одну в 4 микро-шага: запрет решений, прецеденты, план, самопроверка. Это глубокий план, который потом скармливается фазам Implement и Commit.

Что ломается, если пропустить любой из четырёх шагов:

ПропуститьЧто получишь
Шаг 1 (факты)Решение чужой задачи: Claude угадал симптом из паттерна и поехал не туда
Шаг 2 (прецеденты)Выдуманное решение из «общих знаний»: работает в эталонном случае, ломается в реальном
Шаг 3 (план)Реализация без рисков: тесты упадут, рефреш-токен сломается, потом узнаешь от пользователей
Шаг 4 (самопроверка)План с 2-3 потолочными допущениями: библиотека, которой нет, переменная, которая не задана

Из этой таблицы видно: каждый шаг блокирует свой класс ошибок. Все четыре нужны, потому что каждый ловит свою категорию. Если кажется, что задача мелкая и хватит двух - значит, задача правда мелкая, и тогда вообще не нужен Plan Mode.

Связка с папкой plans/, командой /goal и куда двигаться дальше

Цикл работает внутри системы, где у тебя:

  1. Включён Plan Mode (двойной Shift+Tab в Claude Code).
  2. Есть папка plans/ в репозитории для сохранения планов.
  3. Опционально - команда /goal для автономной реализации длинных планов.

Конкретно про папку plans/. После Шага 3 ты получаешь файл plans/2026-05-27-fix-magic-link.md с фазами и чек-боксами. Это артефакт. Через неделю откроешь и вспомнишь, почему именно так. Через три месяца - найдёшь похожую задачу и переиспользуешь подход. Через полгода - покажешь коллеге и сэкономишь ему две недели погружения. Папка plans/ - часть концепции «второй мозг» в Claude Code.

Конкретно про /goal. После того как четыре шага выполнены и план одобрен, ты выходишь из Plan Mode и ставишь:

/goal выполнить все фазы из plans/2026-05-27-fix-magic-link.md,
все тесты в test/auth проходят, или стоп через 30 ходов

Закрываешь ноутбук на час. Возвращаешься - либо «goal completed», либо «stopped after 30 turns» с подробной историей. Без 4-шагового цикла /goal сжигает токены на бесполезные итерации. С 4-шаговым циклом /goal доводит готовый план до зелёных тестов.

Что делать с этого момента. Если ты только начинаешь работу с Claude Code, попробуй цикл на ближайшей нетривиальной задаче. Не на опечатке. На чём-то, что трогает 3+ файла или связано с поведением, которое ты до конца не понимаешь. Возьми промпты выше, скопируй, подставь свои детали. Заметишь, как изменится скорость отката.

Если ты уже пользуешься Plan Mode, добавь папку plans/ в репозиторий. Договорись с собой о формате имён: YYYY-MM-DD-feature-name.md. Через месяц у тебя будет 20-30 файлов, через полгода - больше сотни. Так и собирается второй мозг проекта - живая история решений. Если хочется глубже про управление контекстом до промпта - я разбирал контекст-инжиниринг в Claude Code как отдельную дисциплину.

Если уже есть и Plan Mode, и plans/, попробуй /goal на одной автономной задаче. Возьми задачу, которую обычно делаешь руками 30-40 минут. Прогони через 4 шага, сохрани план, поставь /goal, закрой ноутбук на час.

Источники

Полная схема по вайб-кодингу за вечер: ИИ-клон + Второй мозг + Контекст-инжиниринг. 3 эфира, готовые промпты и шаблоны остаются у тебя.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 9–11 июня  ·  2 000 ₽
Записаться →
Была инструкция полезна?
Артемий Миллер
Автор
Артемий Миллер
Предприниматель и вайб-кодер

Артемий Миллер - предприниматель и вайб-кодер. Бывший программист, собирает продукты исключительно вместе с ИИ-агентами, без найма разработчиков.

Связанные концепты