Как не сжечь лимиты Claude Code за день: 8 правил экономии токенов в 2026

Опубликовано 20.05.202623 мин чтенияСредний
Быстрое переполнение лимита токенов и его экономная подача через контролируемые каналы.
Что узнаешь
  • Какие реально тарифы Claude Code (Pro / Max 5x / Max 20x) и на сколько часов работы их хватает
  • 8 правил экономии токенов, которые применяю сам - от «одна задача - один диалог» до выбора модели
  • Почему передача промта в соседний чат у меня работает лучше, чем /compact
  • Какие действия ломают 90%-ную скидку кэша - и как этого избежать
  • Что меняется с 15 июня 2026 (programmatic credit pool) и кого это касается
Применить за 25 мин
Сэкономит 6 ч
Средний
56просмотров
Что понадобится

Веду эти разборы публично. В канале регулярно показываю свой вайб-кодинг в Claude Code, рабочие промпты и провалы, на которые сам налетел. Подпишись там, где удобнее:

Как устроены лимиты Claude Code в 2026 и почему ты упираешься в них?

На 20 мая 2026 платные планы Claude Code устроены так:

ПланЦена5-часовое окно (примерно)Что особенного
Pro$20 / мес~45 сообщений или 44K токеновБазовый, для проб
Max 5x$100 / мес~225 сообщенийПриоритетный доступ
Max 20x$200 / мес~900 сообщенийРанний доступ к новым моделям
Team Premium$100 / seat (годовая)Max 5x на сиденьеSSO, общие проекты
Enterpriseдоговоркастом + complianceRBAC, data residency

Источник цифр - findskill.ai и официальная страница Anthropic. Кроме 5-часового окна есть ещё недельный лимит, который начинает резать опытных юзеров примерно с пятницы.

Удвоение 6 мая и manual reset 15 мая - что это было

На конференции Code with Claude SF 6 мая 2026 Anthropic объявил сделку со SpaceX Colossus 1: 220 000 видеокарт NVIDIA, 300 МВт мощности, онлайн в течение месяца. Сразу же:

  • 5-часовые лимиты удвоены для всех платных тарифов.
  • Снят дневной peak-hours throttle, который раньше резал квоту в часы пик.
  • На API: max input tokens/minute для Opus поднялись с 30K до 500K (+1500%), max output - с 8K до 80K.

Через неделю, 15 мая, аккаунт @ClaudeDevs написал: «We've reset everyone's 5-hour and weekly rate limits». Anthropic вручную обнулил оба счётчика всем платным подписчикам - кто сжёг квоту к утру, к обеду снова на 100%. API-юзеров не затронуло (там pay-as-you-go).

С 13 мая до 13 июля действует ещё одно временное промо: +50% к недельным лимитам Pro / Max / Team. После 13 июля недельные квоты вернутся к прежним.

Сколько реально тратит вайб-кодер

Anthropic в официальных docs даёт референсные цифры:

  • В среднем разработчик тратит $13 / день, $150-250 / месяц.
  • 90% юзеров укладываются в $30 / день.
  • Agent teams в Plan Mode жгут примерно в 7 раз больше токенов, чем стандартная сессия.

Контекстное окно у всех планов одно - 200K токенов, включая Max 20x за $200. Auto-compact срабатывает примерно на 83.5% заполнения (буфер около 33K). Когда заталкиваешь в один чат полдня работы, контекст переполняется, Claude теряет нить, начинает повторно читать те же файлы и токены жгутся в полтора-два раза быстрее.

Контекст рот, да, больше 50-60%, если заполнение идёт, то качество падает, лимиты улетают очень сильно, быстро токены жрутся, агент начинает тупить, а тупеть тупеет и терять контекст, начинает путаться, начинает делать то, что его не просили. Это самая большая проблема.

Артемий Миллер, Эфир Дня 2, Практикум #1 - Апрель 2026

Подписки $200 мне хватает, потому что я держу 8 правил, разобранных дальше. Без них и Max 20x кончится к обеду.

Правило 1. Почему «одна задача - один диалог» экономит больше всего токенов?

Это правило я повторяю на каждом эфире практикума. Не «открой 5 чатов параллельно» (хотя и так делаю), а именно «не доскрёбывай предыдущий чат под следующую задачу».

Одна задача - одно окно. Один чат - одна задача. Запомните, не грузите туда следующую ещё, ещё. Это всё в контексте у него в голове держится. Это потом у него всё в перемешку, он начинает галлюцинировать и выдавать.

Артемий Миллер, Эфир Дня 2, Практикум #1 - Апрель 2026

У меня это работает так. На каждом сообщении Claude видит не только новый запрос, но и весь предыдущий разговор. Если ты с утра обсуждал посадочную страницу, потом перешёл на email-рассылку, а потом попросил поправить инструкцию практикума - в момент третьего запроса в контекст попадает вся история. Токены тратятся на «помнить посадочную страницу», хотя ты про неё уже забыл.

Почему «обнуление головы» работает

Я закрываю чат сразу, как закрыл задачу. Здесь дело даже не в токенах - это скорее про мою голову.

Для меня закрытие какого-то чата - это обнуление головы. То есть когда я заканчиваю одну задачу, потому что один чат - это одна задача… когда вы закрываете чат, вы себе в голове берёте и освобождаете свою оперативную, что всё, больше об этом не думать.

Артемий Миллер, Эфир Дня 2, Практикум #1 - Апрель 2026

Если задача правда закрылась - не держи чат на всякий случай «вдруг вернусь». Открой новый. Старый можно найти через claude --resume или /resume по любому индикатору (имя ветки, ID PR, тег).

Что делать, если задача растянулась на два дня

Если задача правда требует продолжения, не оставляй чат «зависшим». Перед закрытием попроси Claude написать промт для соседнего чата (см. Правило 7). Это сжимает 50K токенов истории в 500 токенов промта - и завтра новый чат подхватывает контекст без переписывания всего.

Правило 2: CLAUDE.md в 200 строк, не в 500

CLAUDE.md - это первый файл, который Claude читает при старте новой сессии. У меня свой канон, в практикуме разбираю его подробно, а здесь - конкретно про экономию токенов.

Когда мы открываем новое окно в нашем VS Code или Claude Desktop, всегда читается CLAUDE.md. Это некий такой файл, по сути, такой системный промт, который при старте каждой задачи всегда подгружается в контекстное окно. Поэтому это стартовый файл с информацией, в котором мы должны заложить о проекте - где что брать.

Артемий Миллер, Эфир Дня 2, Практикум #3 - Май 2026

Сколько строк - норма

ПодходСтрокГде работает
Karpathy CLAUDE.md (4 правила)65Универсально, любой проект
Официальная рекомендация Anthropicдо 200Среднестатистический репозиторий
Bijit Ghosh «behavioral contract»до 100 строк, остальное в docs/Большие продукты
Auto-сгенерённая через /initразнаяЧаще ухудшает результат, чем улучшает

Цифры по Karpathy - из репозитория forrestchang/andrej-karpathy-skills, который за 3 месяца собрал более 130 000 звёзд и 28 дней подряд держался в weekly trending GitHub. Внутри - 4 правила: Think Before Coding, Simplicity First, Surgical Changes, Goal-Driven Execution. И всё.

Почему длинный CLAUDE.md делает агента глупее

Исследование AGENTbench прогнало 138 реальных задач из 12 Python-репозиториев через Claude Sonnet 4.5, GPT-5.2 и Qwen Code. Главный вывод: CLAUDE.md, сгенерированный командой /init, снижает success rate. Лучше работает либо вручную написанный короткий файл, либо вообще никакого CLAUDE.md.

Объяснение простое: /init описывает репо «обратно модели», добавляя в контекст то, что модель уже знает или может узнать сама за один взгляд на структуру. Это дублирование съедает токены и размывает фокус.

CLAUDE.md is not documentation - it is a behavioral contract between your team and your AI agent. Every word should change how the agent acts - if it does not, delete it.

Bijit Ghosh, https://medium.com/@bijit211987/the-complete-guide-to-claude-md-memory-rules-loading-and-cross-tool-compression-97cc12ed037b

Правило плотности: каждое слово меняет поведение

Если я могу удалить строку из CLAUDE.md и поведение Claude не изменится - значит, эта строка лишняя. Это работает как тест:

  1. Открой CLAUDE.md и пройдись по каждому абзацу.
  2. Спроси себя: «если я это удалю, Claude начнёт ошибаться?»
  3. Если нет - удаляй или выноси в Skill.

В скилы (.claude/skills/<имя>/SKILL.md) уходят все правила, которые срабатывают только в определённых ситуациях. CLAUDE.md - только то, что нужно всегда.

Правило 3. Зачем хранить план Claude Code в отдельном файле?

Plan Mode - режим Claude Code, который включается через Shift+Tab. В нём Claude изучает кодбазу, читает файлы, задаёт вопросы - но не пишет ничего на диск. Только когда план подтверждён, переходит в режим правок.

I start 80% of tasks with Plan Mode - that's basically «please don't write code yet». Once the plan is confirmed, I go straight to auto accept. AI now writes 100% of my code.

Boris Cherny, https://www.lennysnewsletter.com/p/head-of-claude-code-what-happens

Почему план в файле сильнее, чем план в голове Claude

У меня в каждом проекте есть папка plans/. Когда я начинаю задачу:

  1. Прошу Claude в Plan Mode разобраться и предложить подход.
  2. Прошу его сохранить план в файл plans/YYYY-MM-DD-название-задачи.md.
  3. Закрываю чат.
  4. В новом чате говорю: «прочитай plans/YYYY-MM-DD-...md и реализуй фаза 1».

Что я выигрываю:

  • План фиксированный - Claude не «забывает», что мы решили час назад.
  • План можно править руками - я вижу 5 шагов, понимаю, что шаг 3 лишний, удаляю и иду дальше.
  • План переживает рестарт - завтра вернулся, открыл файл, продолжил.
  • План можно передавать агентам последовательно - один чат пишет план, второй реализует, третий проверяет.

Plan Mode не ломает кэш

Важная деталь: Plan Mode инвалидирует только conversation cache (сообщения), а system prompt и project context (CLAUDE.md) остаются прогретыми. Это значит, что переключение в Plan Mode и обратно стоит почти ничего по токенам - в отличие от смены модели через /model, которая ломает кэш на 90% input-цены и заставляет пересчитать весь префикс.

Контекст-инжиниринг - это в том числе про то, чтобы хранить план там, где он будет долго лежать, не в чате, который умрёт через 5 часов.

Правило 4: Skills грузятся по триггеру, не на старте сессии

Skills устроены трёхуровневой подгрузкой:

  1. Metadata всегда - при старте сессии Claude видит только name и description каждого skill. Бюджет: ~100 токенов на skill.
  2. Instructions по триггеру - когда юзер сказал что-то релевантное, Claude грузит тело SKILL.md. Бюджет: до 5000 токенов.
  3. Resources по запросу - бандлированные файлы (примеры, шаблоны) подтягиваются только когда модель сама лезет за ними.

The full instructions only load when Claude determines the skill is relevant (under 5k tokens). Supporting scripts and files load only when explicitly needed. This means you can have dozens of skills installed without impacting performance on unrelated tasks.

Anthropic Skills Documentation, https://code.claude.com/docs/en/skills

Как это меняет экономику токенов

Раньше я пихал в CLAUDE.md и канон написания инструкций для практикума, и регламент рассылок, и правила проверки кода. Файл рос до 500 строк, и при каждом старте сессии я платил за все 500 строк, даже если разговор был про посадочную страницу.

Сейчас у меня в CLAUDE.md - 200 строк навигации и базовых принципов. А 4 регламента живут в скилах:

.claude/skills/
├── write-tutorial/SKILL.md         # триггер: «напиши гайд»
├── deploy-checklist/SKILL.md       # триггер: «проверь перед публикацией»
├── send-broadcast/SKILL.md         # триггер: «отправь рассылку»
└── debug-payment-webhook/SKILL.md  # триггер: «проверь оплату»

Claude видит при старте только заголовки - 400 токенов. А когда я говорю «напиши гайд» - подгружает соответствующий SKILL.md и идёт по нему. Когда говорю «отправь рассылку» - подгружает другой.

Mattpocock/skills - открытый набор скилов от Matt Pocock (более 90 000 звёзд), который держит правило плотности:

Цитата из правил написания скилов в официальных docs Anthropic - именно её Matt Pocock положил в основу своего набора:

Once a skill loads, its content stays in context across turns, so every line is a recurring token cost. State what to do rather than narrating how or why.

Anthropic Skills Documentation, https://code.claude.com/docs/en/skills

Когда скил под подозрением - не ставь

Всё подряд качать нельзя, очень часто умельцы в скилы зашивают неприятные вызовы - берут ключи из папочки и отправляют на вредоносный сайт.

Артемий Миллер, Эфир Дня 2, Практикум #3 - Май 2026

Скилы - это исполняемые инструкции с прямым доступом к твоим файлам и API-ключам. Перед установкой чужого набора я открываю каждый SKILL.md и читаю сам. Если внутри bash:-блоки со ссылками на внешние URL - это тревожный знак, я такое не ставлю.

Правило 5. Когда отдавать задачу sub-agent'у вместо основной сессии?

Из официальных docs:

Delegate verbose operations to subagents so the verbose output stays in the subagent's context while only a summary returns to your main conversation.

Claude Code Documentation, https://code.claude.com/docs/en/costs

Какие задачи я делегирую sub-agent'ам

  • Поиск по большой кодбазе. Sub-agent читает 30 файлов, возвращает «нужная функция в src/lib/payment/cloudpayments.ts:142». Я не вижу содержимое 30 файлов в основном контексте.
  • Прогон тестов и парсинг логов. Sub-agent запускает npm test, ловит 200 строк вывода, возвращает «3 теста упали в X, Y, Z из-за такой-то причины».
  • Multi-file refactor. Один sub-agent на один файл - параллельно.
  • Проверка ссылок в гайде. Sub-agent ходит по 30 URL через WebFetch, возвращает «5 ссылок отдают 404».

В мае 2026 Anthropic официально анонсировал Multi-Agent Orchestration как первоклассную фичу. Раньше sub-agent'ы запускались только в коде через SDK, теперь - прямо в Claude Code через slash-команды.

Где sub-agent ломается

Многоагентная архитектура - это хорошо, ускоряет процесс, но он очень часто может сгаллюцинировать, сломать код, поудалять всё лишнее. Условно весь день он работает, приходишь - а там ни хрена ничего нету толком.

Артемий Миллер, Эфир Дня 1, Практикум #3 - Май 2026

Поэтому я никогда не оставляю sub-agent'ов на полдня без проверки. Правило: чем больше делегируешь параллельно, тем чаще приходи проверять промежуточный результат. На крупных задачах включаю Plan Mode для каждого sub-agent'а отдельно.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 26–28 мая  ·  2 000 ₽
Записаться →

Правило 6. Как выбрать модель Claude (Opus / Sonnet / Haiku) под задачу?

Цены на API (за миллион токенов):

МодельInputOutputCached input
Opus 4.7$5$25$0.50
Sonnet 4.6$3$15$0.30
Haiku 4.5$1$5$0.10

Источник - официальная страница Anthropic. На подписке цены не светятся, но соотношение то же. У Opus 4.7 есть нюанс: новый токенизатор по сравнению с Opus 4.6 может тратить до +35% токенов на тот же текст. Цена за токен не выросла, но эффективная стоимость запроса - да. Если бездумно гонять всё через Opus, лимит закончится в 5 раз быстрее, чем если бы под половину задач взял Sonnet или Haiku.

Учётка за 200 баксов - это, грубо говоря, токенов где-то на 2000 долларов на текущий момент. То есть почему есть смысл использовать учётку, особенно на максималках, потому что сильнейшая экономия.

Артемий Миллер, Эфир Дня 1, Тренинг #1 - Апрель 2026

Как я выбираю модель

ЗадачаМодельПочему
Архитектурное решение, новый раздел продуктаOpus 4.7Нужна глубина
Написать компонент по понятной спецификацииSonnet 4.6Дефолт
Поправить опечатку, переименовать переменнуюSonnet 4.6 или Haiku 4.5Простая правка
Поиск файла по описанию, file routingHaiku 4.5Дешёво
Перевод текста, классификация, summarizationHaiku 4.5Простая модель справится
Code review своего же кодаSonnet 4.6Дефолт
Сложный bug hunt с многошаговым reasoningOpus 4.7Нужны цепочки

Переключение - команда /model. Но - смена модели инвалидирует кэш. Если ты в середине сессии переключился с Sonnet на Opus, следующий запрос пересчитает весь префикс с нуля по полной input-цене (не cached). Поэтому модель лучше выбирать на старте, а не дёргать туда-сюда.

/effort - менее агрессивная настройка

В апреле 2026 Anthropic выкатил /effort - 5 уровней глубины reasoning: minimal / low / medium / high / xhigh. Claude Code на Opus 4.7 по дефолту работает на xhigh.

Что я делаю:

  • Для классификации, извлечения данных, коротких summary - /effort low. Экономия 30-70% на типах задач, где глубокое reasoning не нужен.
  • Для простой работы с кодом - /effort medium.
  • Для сложной архитектуры - оставляю xhigh.

/effort не меняет модель, только глубину её мышления. Кэш не ломается.

Правило 7: передача промта в новый чат вместо /compact

/compact - официальная команда Claude Code, которая заменяет историю summary. Если запустить сразу после последнего сообщения, пока кэш горячий (TTL на подписке - 1 час), суммаризация попадает в кэш и читается за 10% стандартной цены. Если запустить через час - кэш холодный, платишь полностью.

У /compact есть кастомизация:

bash
/compact Focus on code samples and API usage

Или в CLAUDE.md можно прописать дефолтный фокус суммаризации:

markdown
# Compact instructions
When you are using compact, please focus on test output and code changes

Но я чаще делаю по-другому.

Передача промта в соседний чат - как у меня

Я всегда обычно говорю: «Слушай, я хочу продолжить в соседнем чате. Напиши мне промт полностью, в котором соседний чат продолжит твою задачу, не потеряв смысл». И он пишет промт, ты его копируешь в новом чате, запускаешь - и вот там вот было у тебя огромное контекстное окно, а сейчас он это всё сжал. Можно, конечно, включить там компакт или клир. Если честно, я больше использую «напиши мне промт, копирую промт и иду в соседний чат».

Артемий Миллер, Эфир Дня 2, Практикум #3 - Май 2026

Шаги:

  1. В текущем чате на момент, когда вижу что контекст перевалил за 50%, говорю: «Напиши мне промт для соседнего чата, который продолжит работу не теряя смысл. Включи: что мы решали, что уже сделано, что осталось, ключевые файлы и константы».
  2. Claude отдаёт мне промт на 300-800 токенов.
  3. Закрываю текущий чат через /clear или просто открываю новый.
  4. Вставляю промт - и стартую с прогретой CLAUDE.md и project context, но с чистой conversation memory.

Что я выигрываю по сравнению с /compact:

  • Контроль над тем, что попало в новый чат. /compact сжимает по своему пониманию, я могу руками отредактировать промт перед стартом.
  • Промт можно сохранить в файл plans/ - и завтра вернуться.
  • Новый чат стартует с чистой conversation cache - дальше работаешь по cached-цене на input.

Когда /compact лучше

  • Когда ты в Plan Mode и не хочешь терять текущий план.
  • Когда задача однотонная и контекст однотипный (например, перевод длинного документа).
  • Когда /compact запускается сразу после ответа Claude - тогда суммаризация попадает в горячий кэш и стоит 10%.

/clear - крайний случай

/clear стирает всё, включая project context. Использую только когда переключаюсь на абсолютно несвязанную тему и не хочу держать в памяти ничего из предыдущей. После /clear следующий запрос платит полную цену за загрузку CLAUDE.md заново.

Правило 8. Что инвалидирует кэш Claude Code и почему за это платишь?

На подписке cache TTL - 1 час (продлевается при каждом обращении). На API по умолчанию - 5 минут. Это значит: если ты вернулся к работе через 40 минут, кэш ещё жив и следующий запрос стоит копейки на input. Через 1 час - всё, кэш протух, платишь полную цену.

Most of compaction's time goes to generating the summary, not to a cache miss.

Claude Code Documentation, https://code.claude.com/docs/en/prompt-caching

Что ломает кэш (избегай в середине задачи)

  1. /model - смена модели в середине сессии. Каждая модель имеет свой кэш. После /model opus следующий запрос пересчитывает весь префикс на Opus с нуля.
  2. Включение Plan Mode при настройке opusplan. В этом режиме Plan Mode = Opus, обычный = Sonnet. Каждый Shift+Tab = смена модели = invalid cache.
  3. MCP server connect / disconnect. Включая авто-reconnect после transient failure. Если у тебя нестабильный MCP-сервер, ты платишь дважды.
  4. Bare-name deny rules (Bash, WebFetch) - изменяют tool definitions в system prompt.
  5. /compact - инвалидирует conversation layer (by design).
  6. Upgrade Claude Code на новую версию - новая версия = новый system prompt = новый кэш.

Что НЕ ломает кэш

  • Правка файлов в репо (читаются on-demand).
  • Правка CLAUDE.md в середине сессии (но не применяется до рестарта - читай Правило 2).
  • Smena output style.
  • Permission mode change (если не задействован opusplan).
  • Skills / commands invocation (добавляются в conversation layer).
  • /recap (новая команда, summary без инвалидации кэша).
  • /rewind (возврат на уже прогретый prefix).
  • Spawn sub-agent (parent's cache не затрагивается).

Как использовать кэш в свою пользу

  • Не дёргай /model без надобности. Выбирай модель на старте задачи.
  • Не включай 10 MCP-серверов «на всякий случай». Каждый добавляет к system prompt и ломает кэш при reconnect.
  • Не правь CLAUDE.md между задачами - все правки делай в один заход и после рестарта.
  • Используй /recap вместо /compact, когда надо просто посмотреть summary, а не освободить контекст.

Что меняется 15 июня 2026 с programmatic credit pool?

Анонс полностью разделяет работу с Claude на два типа:

ТипЧто входитБиллинг
ИнтерактивныйClaude Code TUI, Cowork, Claude.ai с человеческими промптамиПодписка как раньше
ProgrammaticClaude Agent SDK, claude -p (headless), GitHub Actions, T3 Code, Zed, OpenClaw, любой агент без человека в петлеОтдельный месячный пул, не roll-over, по API-rates

Размер programmatic пула:

  • Pro $20 → $20 в programmatic credits / мес
  • Max 5x → $100
  • Max 20x → $200

После исчерпания пула - либо стоп, либо доплачиваешь по API-ценам.

Реакция сообщества

I have never before experienced from any developer tool such a frustrating lack of clarity over the basic terms of usage.

Matt Pocock, https://finance.biggo.com/news/382b1ef1c37acfb3

Theo Browne, автор T3 Code, написал что эффективное удорожание для third-party tools - «25-40 раз». Подписку отменил. Matthew Berman выпустил видео «The Anthropic Situation is INSANE» (596K подписчиков). Anthropic в ответ удвоил лимиты 6 мая и сбросил счётчики 15 мая - но programmatic credits остались.

Касается ли это тебя как вайб-кодера

Если ты работаешь в Claude Code так:

  • Открываешь VS Code, сидишь в Claude Code, пишешь промпты руками.
  • Plan Mode, auto-accept, sub-agents через slash-команды.
  • Без CI, без GitHub Actions, без сторонних обёрток.

Тогда ты в интерактивном пуле, ничего не меняется. У меня лично эта новость прошла мимо, потому что я не пускаю Claude в CI.

Если ты при этом:

  • Запускаешь claude -p "..." из bash-скриптов.
  • Используешь Claude Code GitHub Action для авто-ревью PR.
  • Сидишь в Zed или T3 Code.
  • Пишешь собственные агенты на Anthropic SDK.

Тогда с 15 июня тебе нужен второй счёт: подписка для интерактивной работы + API-budget для programmatic. Или Enterprise-тариф.

Один день вайб-кодера в Claude Code

Типичный мой день в Claude Code устроен так:

  1. 9:00. Открываю задачу №1 - правка email-шаблона. Открываю новый чат, Plan Mode, прошу Claude разобраться. Через 3 минуты план готов, переключаюсь в auto-accept, правка занимает 10 минут. Закрываю чат.
  2. 9:30. Задача №2 - написать инструкцию практикума. Открываю новый чат, в нём срабатывает мой skill для написания инструкций. Подгружаются 4000 токенов методологии. Работаю по нему, через 40 минут инструкция готова. Готово.
  3. 11:00. Задача №3 - сложная архитектурная штука. /model opus, Plan Mode, обсуждение. Прошу сохранить план в plans/2026-05-20-...md. Закрываю чат.
  4. 12:00. Новый чат: «прочитай plans/2026-05-20-...md и реализуй фазу 1». 6 sub-agent'ов параллельно - по одному на файл. Через 45 минут фаза 1 готова. Закрываю.
  5. 14:00. Задача №4 - правка посадочной страницы. /model sonnet. Новый чат. План + реализация - 30 минут. Закрываю.
  6. 15:00. Задача №5 - debug продакшена. /model opus, Plan Mode, нужна глубина. После часа обсуждения прошу написать промт для соседнего чата с найденной причиной + предлагаемым фиксом. Копирую в новый чат, реализую за 20 минут.

К концу дня - 6 задач, 8 закрытых чатов, ни одного /compact. Лимит съеден на 40-60%. Этого хватает с запасом.

Мне мои подписки за 200 баксов, учитывая количество проектов, которые я имею, учитывая, что я как-коде по 8 часов, прогоняю огромные тексты - мне хватает. Я лимит ещё никогда не заканчивал. То есть бывало, упёрся, но не заканчивал.

Артемий Миллер, Эфир Дня 2, Практикум #3 - Май 2026

Лимит кончается у тех, кто:

  • Заталкивает всю задачу в один чат, в котором уже 50% контекста.
  • Держит CLAUDE.md на 600 строк, потому что «вдруг пригодится».
  • Дёргает /model opus для каждой простой правки.
  • Включил 8 MCP-серверов на всякий случай.
  • Никогда не использовал sub-agent'ов и тащит всё в основной диалог.

Лимит не кончается у тех, кто строит второй мозг в файлах проекта и работает с Claude как с инженером в команде - даёт чёткие задачи, не сваливает всё в один разговор, использует разные инструменты под разные задачи.

Источники

Если 8 правил из этой статьи стали понятны - дальше в практикуме собираем полную связку: ИИ-клон + Второй мозг + контекст-инжиниринг за 3 эфира. Три кита, без которых лимит будет кончаться даже на Max 20x.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 26–28 мая  ·  2 000 ₽
Записаться →
Была инструкция полезна?
Артемий Миллер
Автор
Артемий Миллер
Предприниматель и вайб-кодер

Артемий Миллер - предприниматель и вайб-кодер. Бывший программист, собирает продукты исключительно вместе с ИИ-агентами, без найма разработчиков.

Тема
Как настроить CLAUDE.md в 2026: готовый шаблон и 6 правил
Главная статья темы
Соседние статьи

Связанные инструкции

Как настроить CLAUDE.md в 2026: готовый шаблон и 6 правил

Готовый шаблон CLAUDE.md, 6 правил живого файла и разбор боевого примера действующего бизнеса. Скопировал, вставил, Claude перестал забывать твой проект между сессиями.

26 мин

Claude Code Subagents в 2026: пошаговая инструкция и 5 готовых примеров

Subagents Claude Code - специалисты с собственным контекстом и инструментами, к которым главный чат делегирует узкие задачи. Структура файла, формула description, 5 готовых ролей, антипаттерны и связка с Multi-agent v2 Anthropic.

21 мин

Claude Code Skills в 2026: как собрать библиотеку навыков под себя

Claude Code Skills - упакованная методология повторяющегося действия. Структура SKILL.md, формула description, 5 готовых наборов от Anthropic, Matt Pocock и Corey Haines. Пошаговая сборка первого skill за 30 минут.

22 мин

Второй мозг в Claude Code: как настроить, чтобы он помнил проект

Иерархия памяти Claude Code, структура второго мозга из 5 частей и git как машина времени. Чтобы агент перестал забывать твой проект каждую сессию и работал на свежем контексте.

21 мин