Контекст-инжиниринг в 2026: что это, чем отличается от промпт-инжиниринга и как применять в Claude Code

Опубликовано 21.05.2026Обновлено 30.05.202620 мин чтенияСредний
Сложная кодинг-среда Claude Code, где превалируют системные промпты, а пользовательский ввод вторичен.
Что узнаешь
  • Что такое контекст-инжиниринг и почему Karpathy с Anthropic заменили им промпт-инжиниринг в 2026
  • Главную ошибку - почему «больше контекста» работает против тебя (с цифрами Chroma и Stanford)
  • 5 принципов работы с контекстом по канону Anthropic
  • 7 типичных ошибок, которые сжигают токены и ломают Claude Code, и как их закрыть
  • Минимальную рабочую связку за вечер - CLAUDE.md на 80-120 строк, examples, memory, subagents
  • Связку «3 китов» методологии - почему контекст-инжиниринг это одна из трёх дисциплин рядом с ИИ-клоном и Вторым мозгом
Применить за 90 мин
Сэкономит 8 ч
Средний
907просмотров
8поделились
Карта темы

Я веду эти разборы публично. Каждый день в канале - инструменты, рабочие промпты и провалы вайб-кодинга, на которые я налетел сам. Подпишись там, где удобнее:

Что такое контекст-инжиниринг - в одной строке?

Самое короткое определение дал Andrej Karpathy в твите 25 июня 2025 года:

+1 за 'context engineering' вместо 'prompt engineering'. Prompts у людей ассоциируются с короткими описаниями задач, которые они кидают LLM в повседневной работе. А в любом серьёзном промышленном LLM-приложении context engineering - это тонкое искусство и наука: заполнить context window именно той информацией, которая нужна на следующем шаге.

- Andrej Karpathy, https://x.com/karpathy/status/1937902205765607626

По-русски: «деликатное искусство и наука заполнить контекстное окно ровно той информацией, которая нужна на следующем шаге».

Термин ввёл в оборот за неделю до Karpathy - 18 июня 2025 года - Tobi Lütke, CEO Shopify:

Мне очень нравится термин 'context engineering' вместо prompt engineering. Он точнее описывает ключевой навык: искусство дать весь нужный контекст так, чтобы LLM могла реально решить задачу.

- Tobi Lütke, https://x.com/tobi/status/1935533422589399127

Anthropic закрепили термин в инженерном блоге 29 сентября 2025 года:

Context engineering - это набор стратегий по подбору и поддержанию оптимального набора tokens (информации) во время inference LLM, включая всё, что туда попадает помимо самих prompts.

- Anthropic Applied AI team, https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents

Та же статья даёт самую важную фразу для смены оптики:

Разработка с языковыми моделями всё меньше про подбор правильных слов и фраз в prompts и всё больше про ответ на вопрос пошире: 'какая конфигурация контекста с большей вероятностью даст нужное поведение модели?'

- Anthropic Applied AI team, https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents

Главная мысль: контекст это не сообщение, которое ты пишешь. Контекст это весь набор информации, который ИИ видит до твоего сообщения - системный промпт, описания инструментов, история диалога, файлы из памяти, данные, подгруженные через MCP. Промпт - финальный шаг. Контекст-инжиниринг - архитектура всего, что подаётся в окно.

Я налетел на эту разницу на собственных проектах. Piratix AI собрал за 3-4 часа в декабре 2024 года - получилось, потому что заранее накидал в контекст всю продуктовую логику, а не пытался уговорить модель «понять задачу». Smyslokod.ru за апрель 2026 года вышел в 600 тысяч строк кода без регрессий - потому что весь контекст бизнеса разложен по папкам, и Claude по ним ходит точечно, а не съедает репозиторий целиком.

Почему промпт-инжиниринг устарел в 2026?

Сдвиг произошёл за лето 2025 года. Хронология:

  1. 18 июня 2025: Lütke вводит термин в твите.
  2. 25 июня 2025: Karpathy усиливает его - пост лёг в основу 13.4k★ GitHub-template context-engineering-intro.
  3. 27 июня 2025: Simon Willison фиксирует момент в эссе:

    Мне нравится. Думаю, этот термин приживётся.

    - Simon Willison, https://simonwillison.net/2025/Jun/27/context-engineering/
  4. Июль 2025: Chroma Research публикует исследование Context Rot - доказательство, что модели деградируют на длинном контексте.
  5. 29 сентября 2025: Anthropic закрепляет дисциплину инженерным блогом, дают канон из 4 принципов.
  6. Март 2026: опрос DataHub среди 250 IT-лидеров показывает, что 95% считают контекст-инжиниринг критичным для ИИ-агентов на масштабе.

    Context management - это про то, чтобы у AI-агентов был доступ к релевантному, надёжному и проверенному контексту.

    - Shirshanka Das, https://datahub.com/news/datahub-releases-state-of-context-management-report/
  7. Май 2026: Andrej Karpathy переходит в Anthropic. YouTube-каналы фиксируют 6 из 10 топовых видео в нише «вайб-кодинг» с темой «vibe coding is dead» - и термин «context engineering» окончательно вытесняет «prompt engineering» в массовом дискурсе.

Дополнительные цифры из того же DataHub-отчёта подтверждают, что речь не про моду:

  • 91% видят управление контекстом приоритетом уровня C-level в горизонте 1-3 года.
  • 89% уже выделили бюджет на инфраструктуру контекста в ближайшие 12 месяцев.
  • 87% признают, что готовность данных - главный затык для ИИ в проде.

Промпт-инжиниринг при этом не «умер». Он стал базовой грамотностью, как уметь печатать на клавиатуре. А поверх неё выросла дисциплина, без которой ИИ-агент на длинных задачах ломается - контекст-инжиниринг.

Чем контекст-инжиниринг отличается от промпт-инжиниринга: 5 различий

АспектПромпт-инжинирингКонтекст-инжиниринг
Что оптимизируемФормулировку одного запросаВесь набор токенов: системный промпт + инструменты + история + retrieved данные
ГоризонтОдин turnМногие turn-ы плюс переходы между сессиями
Главный рискМодель не поняла запросМодель утонула в шуме (context rot)
Главный навыкКопирайтинг плюс понимание моделиАрхитектура информации и точечное извлечение
Источник в проектеТвой шаблон промптаCLAUDE.md, файлы памяти, retrieval, субагенты, compaction
Метафора«Как написать запрос»«Что ИИ знает в момент запроса»

Karpathy в том же твите 25 июня 2025 года объяснил баланс:

Слишком мало или не в той форме - и у LLM нет нужного контекста для оптимальной работы. Слишком много или нерелевантного - и стоимость LLM растёт, а качество падает.

- Andrej Karpathy, https://x.com/karpathy/status/1937902205765607626

Контекст-инжиниринг это не «лей больше». Это точная дозировка. Слишком мало - ИИ не знает контекста и галлюцинирует. Слишком много - ИИ тонет в шуме, теряется в середине, и стоит это дороже.

Промпт-инжиниринг отвечал за финальный шаг. Контекст-инжиниринг отвечает за всё, что было до него.

Хочешь не просто понять разницу, а собрать рабочую связку, которая делает Claude стабильным на длинных задачах? Контекст-инжиниринг - один из трёх китов методологии, по которой я собирал smyslokod.ru и Piratix AI. На практикуме за 3 эфира разбираем всю связку: ИИ-клон + Второй мозг + Контекст-инжиниринг. Это 3 кита, без которых ИИ галлюцинирует.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 14–16 июля  ·  2 000 ₽
Записаться →

Почему 1М токенов не значит «лей всё»?

Текущие лимиты по моделям Claude:

МодельКонтекстное окноНа каких планах
Claude Haiku 4.5200 000 токеноввсе планы
Claude Sonnet 4.61 000 000 токеновPro+ с usage credits
Claude Opus 4.71 000 000 токеновPro, Max, Team, Enterprise

1M токенов это примерно 2500 страниц текста. Кажется, что можно загрузить всю документацию проекта, всю переписку, все спецификации - и пусть ИИ разбирается. Но Anthropic в своём инженерном блоге пишут прямо:

К контексту нужно относиться как к конечному ресурсу с убывающей отдачей.

- Anthropic Applied AI team, https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents

Расшифровка: контекст это конечный ресурс с убывающей отдачей. Каждый дополнительный токен не приносит пользы линейно. Чем длиннее окно, тем хуже модель работает с тем, что в нём лежит.

Boris Cherny, head of Claude Code, в интервью Pragmatic Engineer описывает, как сам работает с контекстом:

Дело даже не в deep work, а в том, насколько хорошо я переключаюсь и быстро прыгаю между разными контекстами.

- Boris Cherny, https://newsletter.pragmaticengineer.com/p/building-claude-code-with-boris-cherny

Главный навык на 2026 - не держать всё открытым. Главный навык - быстро переключать узкие контексты, один на одну задачу.

Главная ошибка: больше контекста = хуже результат?

Chroma Research в июле 2025 года протестировали 18 топовых моделей - Claude Opus 4, Sonnet 4, Haiku 3.5, GPT-4.1, GPT-4 Turbo, Gemini 2.5 Pro, Qwen3-235B и другие. Главный вывод:

Модели не используют свой контекст равномерно. Их качество становится всё менее надёжным по мере роста длины входа.

- Kelly Hong, Anton Troynikov, Jeff Huber, https://www.trychroma.com/research/context-rot

Конкретные цифры из исследования:

  • На задаче Repeated Words проблемы у Gemini-моделей стартуют уже на 500-750 словах.
  • GPT-4 Turbo показывает локальный пик качества на 500 словах, после этого качество падает.
  • Один отвлекающий фрагмент (distractor) снижает качество. Четыре отвлекающих фрагмента обрушивают качество в разы.

Параллельно работает второй эффект - lost in the middle. Его задокументировали в Stanford в 2024 году (Nelson Liu и коллеги, опубликовано в TACL):

Качество обычно выше всего, когда важная информация лежит в начале или конце входного контекста, и заметно падает, когда модели приходится доставать её из середины длинного контекста - даже у моделей, заявленных как long-context.

- Nelson Liu et al., https://arxiv.org/abs/2307.03172

На практике это значит: если важное правило стоит в середине файла CLAUDE.md - модель его пропустит.

Anthropic в документации по CLAUDE.md рекомендуют ограничение длины:

Цельтесь держать CLAUDE.md в пределах 200 строк - более длинные файлы сжирают больше контекста и снижают соблюдение инструкций.

- Anthropic, https://code.claude.com/docs/en/memory

200 строк это потолок, после которого модель начинает игнорировать правила. Практический рабочий диапазон, который я обкатал на десятках своих проектов - 80-120 строк. Каждая строка свыше начинает конкурировать с теми, которые реально важны. Подробнее про настройку CLAUDE.md под этот предел - в гайде «Как настроить CLAUDE.md в 2026».

5 принципов контекст-инжиниринга по Anthropic

Принцип 1. Контекст - конечный ресурс

Базовая установка, без неё остальные четыре принципа не работают. Anthropic пишут:

Общий совет по всем компонентам контекста (system prompts, tools, примеры, история сообщений и т.д.) - продумывать их и держать контекст информативным, но плотным.

- Anthropic Applied AI team, https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents

Tight - значит «плотно, без воды». Каждый токен в окне должен материально менять решение модели. Если строка в CLAUDE.md звучит как «мы стараемся писать чистый код» - её можно удалять, она не несёт сигнала.

Принцип 2. Just-in-time retrieval

ИИ-агент тянет данные через инструменты на лету, а не пред-загружает всё в окно заранее. Это и есть архитектура Claude Code: вместо векторной базы или индекса - агент использует glob и grep, как живой инженер ищет в коде вручную. Boris Cherny рассказывал, что это открытие пришло из наблюдения за тем, как инженеры искали в коде, когда у них падал IDE.

Когда применять: ты не знаешь заранее, какие фрагменты понадобятся для задачи.

Принцип 3. Structured note-taking

Агент пишет заметки во внешнее хранилище и подгружает их по нужде. В Claude Code это реализовано через memory tool. Anthropic в своём cookbook описывают это так:

Memory - это структурированные заметки: агент пишет в постоянное внешнее хранилище, чтобы отслеживать прогресс по задачам и сессиям, не держа всё в активном контексте.

- Anthropic Cookbook, https://platform.claude.com/cookbook/tool-use-context-engineering-context-engineering-tools

Когда применять: долгие сессии, переходы между сессиями, накопление знаний о проекте.

Принцип 4. Compaction

Сжатие истории сообщений в саммари при приближении к лимиту. В Claude Code это команда /compact, плюс автоматическая компакция при достижении ~80% от окна. Anthropic пишут:

Compaction сжимает всё окно, когда оно становится слишком большим.

- Anthropic Cookbook, https://platform.claude.com/cookbook/tool-use-context-engineering-context-engineering-tools

Когда применять: длинные аналитические диалоги, где история переписки превратилась в балласт и забивает окно вместо того чтобы помогать.

Принцип 5. Sub-agent architectures

Специализированные субагенты работают параллельно в своих контекстных окнах и возвращают сжатые сводки в lead-агента. Anthropic пишут:

Subagents помогают сжатию: работают параллельно со своими context windows и одновременно копают разные аспекты вопроса.

- Anthropic Engineering, https://www.anthropic.com/engineering/multi-agent-research-system

Цифры из их собственного internal-теста: lead-агент Claude Opus 4 + субагенты Claude Sonnet 4 дают +90.2% качества против single Claude Opus 4 на research-задачах. Цена: ~15× больше токенов. Вывод: оправдано там, где исход дорогой.

Подробнее про настройку субагентов на Claude Code - в гайде «Subagents для Claude Code».

7 ошибок, которые сжигают токены и ломают Claude Code

#Анти-паттернЧто происходитКак чинить
1Залил весь README плюс 5 файлов кода в один промптОкно забивается на 50% за один turn, дальше быстро упирается в лимитMemory tool для long-term фактов плюс just-in-time retrieval - пусть Claude сам читает файлы через read_file/glob
2CLAUDE.md на 500 строкМодель пропускает середину файла (lost in the middle), правила не работают80-120 строк, императивы, разделы по командам и стилю. Самое важное - в начало и конец
3Не запускаю /compact на длинных сессияхСессия на 180k токенов, Claude забывает первые сообщения, ты повторяешь контекст руками/compact руками или авто-компакция по trigger. Признак стресса - индикатор context usage в десктопном Claude
4Один Claude на всёОдин агент делает планирование плюс поиск плюс код плюс ревью плюс тесты - окно растёт лавинообразноСубагенты: каждый в своём контексте, lead собирает сводки. Anthropic дают +90.2% качества на research-задачах
5Файлы памяти растут от tool-result-овАгент перечитывает один и тот же файл 5 раз, забивая 96% контекста результатами вызовов инструментовTool-result clearing: оставляешь 4-6 свежих результатов, остальное чистится. Сам факт вызова сохраняется
6Залил весь репозиторий в examples/ папкуИИ ищет паттерн среди 200 примеров, теряется3-7 канонических паттернов в examples/, каждый под конкретный тип задачи
7Markdown-список на 200 строк как «план фичи»После 50-й строки агент перестаёт держать структуру в головеHTML-артефакт или нумерованный план в отдельном файле. Thariq Shihipar из Anthropic: «HTML - новый markdown» (полная цитата ниже)

Anthropic в Cookbook описывают конкретный замер для ошибки №5: в их baseline-сессии первый документ из контекста (про C. elegans) формально лежал в окне, но был погребён под 335k токенами. Технически доступен. Фактически модель его не вспомнила. С memory tool ситуация чинится так: файл с заметками aging_model_organisms_comparison.md весит ~3000 токенов вместо повторной загрузки исходного корпуса.

Бытовая аналогия: контекстное окно это рабочий стол. Если на нём лежит 200 документов, ты не найдёшь нужный, даже если он там есть. Контекст-инжиниринг - дисциплина «держи на столе только то, что нужно сейчас, остальное в архиве, и подгружай по запросу».

Как собрать рабочую связку за вечер?

Семь шагов в порядке выполнения:

  1. CLAUDE.md на 80-120 строк. В корне проекта. Императивы, не описания. Anthropic в официальной документации рекомендуют принцип Specificity: правила должны быть конкретными и однозначными, не общими установками. На практике это значит «никогда не используй inline mocks в тестах» работает лучше, чем «мы стараемся писать чистый код». Подробный шаблон - в гайде «Как настроить CLAUDE.md».

  2. Папка examples/ с 3-7 проверенными паттернами. Один пример на типовой паттерн: вызов API, написание теста, миграция, обработка ошибки. Когда Claude видит паттерн в examples/ - он его повторяет точно. Без примеров - угадывает на ходу.

  3. PRP-документы под крупные фичи. PRP = Product Requirements Prompt. Один файл на одну фичу: контекст плюс план плюс валидация плюс примеры. Boris Cherny говорит про это коротко:

Как только есть хороший план, реализация почти всегда выходит с одного захода.

- Boris Cherny, https://newsletter.pragmaticengineer.com/p/building-claude-code-with-boris-cherny
  1. Memory tool для long-term фактов вне сессии. Claude в Anthropic Cookbook реализовали memory tool как структурированное хранилище заметок. Когда агент в новой сессии возвращается к задаче - он сначала читает заметки, не перечитывает весь корпус.

  2. /compact плюс авто-компакция на 80% от лимита. Не дожидайся, пока окно упрётся в потолок. Включи авто-компакцию через настройки или вызывай /compact сам, когда чувствуешь, что сессия пошла по второму кругу.

  3. Субагенты для research / review / planning. Каждый субагент - в своём контексте, со своим узким промптом. Lead-Claude получает только сводку, не сырьё. Подробнее - «Subagents для Claude Code» и «Skills для Claude Code» (Skills это способ упаковать узкую экспертизу в навык, который Claude применяет автоматически).

  4. Just-in-time retrieval вместо предзагрузки. Не заливай весь репозиторий в окно. Пусть Claude сам ищет через glob и grep. Это и есть архитектура самого Claude Code - по словам Cherny, открытие пришло из наблюдения, как инженеры искали в коде, когда у них падал IDE.

Дополнительные практические правила, которые я обкатал на своих проектах:

  • Одна задача - одно окно. Закончил - закрой, открой новое. Не накапливай историю на нескольких задачах подряд.
  • Шаблон первой команды нового окна. Один и тот же текст: «Прочитай в порядке ai-clone/INDEX.md, business/INDEX.md, CLAUDE.md, зону задачи. Подтверди в одну строку. Не начинай задачу, жди следующего сообщения.» Этот шаблон лежит у меня в snippet-редакторе под одну горячую клавишу.
  • Контекст-окно заполнено >60% - переходи в новое. Промежуточный приём: попроси Claude «напиши промпт, в котором соседний чат продолжит твою задачу, не потеряв смысл», скопируй, открой новое окно.
  • Каждая ошибка ИИ - повод дописать правило. Не пиши правила в файлы памяти руками. Скажи Claude «не так, потому что...» в момент ошибки - он сам оформит правило в файл по канону «Rule → Why → How».

Контекст-инжиниринг как 3-й кит методологии

В моей методологии смысло-кодинга это называется «три кита»:

  1. ИИ-клон - папка ai-clone/ рядом с кодом проекта. Цифровая проекция твоего мышления: ценности, принципы, тон, стиль, правила, выученные через ошибки. ИИ читает её и работает как ты, а не «в общем по индустрии».

  2. Второй мозг - папка business/ рядом с кодом. Структура знаний о бизнесе: аудитория, продукты, цели, экономика, маркетинг. ИИ читает её при каждом запросе и работает с контекстом, а не в вакууме. Подробный разбор - в гайде «Второй мозг в Claude Code».

  3. Контекст-инжиниринг - дисциплина, которая делает первые два кита работающими. Без неё ai-clone/ и business/ превращаются в свалку файлов, которые ИИ не может прочитать целиком. Контекст-инжиниринг отвечает за то, как эти папки структурированы (CLAUDE.md как карта, wiki-ссылки между файлами), как ИИ по ним ходит (just-in-time retrieval), как сжимает прошлые сессии (compaction), как разделяет задачи между субагентами.

Связка трёх китов это и есть «Я-компания» - один человек плюс ИИ работают как команда из 10-100 человек. Без одного кита система рассыпается:

  • Без ИИ-клона - ИИ пишет в стиле «как все», твой голос теряется.
  • Без Второго мозга - ИИ пишет без контекста бизнеса, решения абстрактные.
  • Без контекст-инжиниринга - ИИ тонет в шуме на длинных задачах, теряет контекст, галлюцинирует.

Поэтому ставить только CLAUDE.md или только Skills - это полдела. Связка трёх китов работает в production. Один кит без двух других быстро упирается в потолок. Контекст-инжиниринг здесь - архитектурный слой, без которого первые два кита не масштабируются. Это каркас под всю систему.

Что дальше: как развивать дисциплину контекст-инжиниринга?

Три направления, в которых дисциплина движется прямо сейчас:

1. HTML вместо Markdown для планирования. Thariq Shihipar, engineer из команды Claude Code в Anthropic, в подкасте Lenny от 18 мая 2026 года описал переход:

HTML - это новый markdown.

- Thariq Shihipar, https://www.lennysnewsletter.com/p/html-is-the-new-markdown-how-anthropic

Идея: вместо плоского списка на 200 строк дать агенту визуальный mockup, который он может править кусками. «Throwaway micro-UIs» - одноразовые интерфейсы для редактирования конкретной части плана. Compute уходит на коммуникацию контекста, а написание кода становится побочной задачей.

2. Dreaming - ночное переосмысление сессий. На Code w/ Claude SF 6 мая 2026 года Anthropic показали фичу: агент ночью пере-смотрит прошлые сессии и обновляет свои собственные заметки. Структурированные файлы памяти теперь растут не только когда ты их пишешь, но и когда агент сам делает выводы из накопленного опыта.

3. Persistent memory между сессиями. Open-source проект claude-mem набрал свою аудиторию на GitHub, Mem0 показал высокую точность на LoCoMo-benchmark. Эти инструменты подсказывают, что слой памяти ИИ перестаёт быть привязан к одной сессии. Память теперь самостоятельный слой системы, как база данных.

Тренд один: контекст-инжиниринг превращается из «как написать CLAUDE.md» в полную дисциплину архитектуры информации для ИИ-агентов. Промпт-инжиниринг был одним из первых уровней этой дисциплины. Контекст-инжиниринг - следующий.

Минимум, который имеет смысл собрать в первый вечер: настрой CLAUDE.md на 80-120 строк (гайд - тут), заведи папку business/ со структурой знаний о бизнесе («Второй мозг»), научись пользоваться /compact и не сжигать лимиты.

Дальше - субагенты (гайд) и Skills, чтобы вынести узкую экспертизу из общего контекста в специализированные навыки.

Источники

Полная схема по вайб-кодингу за вечер: ИИ-клон + Второй мозг + Контекст-инжиниринг. 3 эфира, 2 000 ₽. Записи остаются у тебя.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 14–16 июля  ·  2 000 ₽
Записаться →

Новые материалы - дайджестом, без спама

Гайды выходят регулярно. Подпишись, чтобы не пропускать: пришлю подборку в Telegram или на email. Раз в неделю или каждый день - выбираешь сам.

Была инструкция полезна?
Артемий Миллер
Автор
Артемий Миллер
Предприниматель и вайб-кодер

Артемий Миллер - предприниматель и вайб-кодер. Бывший программист, собирает продукты исключительно вместе с ИИ-агентами, без найма разработчиков.

Связанные инструкции

Связанные концепты