Лимиты Claude Code 2026: 8 правил, чтобы не сжечь токены

Каждый день в Telegram-канале - что нового в вайб-кодинге: инструменты, кейсы, ошибки. Подпишись, чтобы быть в курсе.

Как устроены лимиты Claude Code в 2026 и почему ты упираешься в них?

На 20 мая 2026 платные планы Claude Code устроены так:

План	Цена	5-часовое окно (примерно)	Что особенного
Pro	$20 / мес	~45 сообщений или 44K токенов	Базовый, для проб
Max 5x	$100 / мес	~225 сообщений	Приоритетный доступ
Max 20x	$200 / мес	~900 сообщений	Ранний доступ к новым моделям
Team Premium	$100 / seat (годовая)	Max 5x на сиденье	SSO, общие проекты
Enterprise	договор	кастом + compliance	RBAC, data residency

Источник цифр - findskill.ai и официальная страница Anthropic. Кроме 5-часового окна есть ещё недельный лимит, который начинает резать опытных юзеров примерно с пятницы.

Удвоение 6 мая и manual reset 15 мая - что это было

На конференции Code with Claude SF 6 мая 2026 Anthropic объявил сделку со SpaceX Colossus 1: 220 000 видеокарт NVIDIA, 300 МВт мощности, онлайн в течение месяца. Сразу же:

5-часовые лимиты удвоены для всех платных тарифов.
Снят дневной peak-hours throttle, который раньше резал квоту в часы пик.
На API: max input tokens/minute для Opus поднялись с 30K до 500K (+1500%), max output - с 8K до 80K.

Через неделю, 15 мая, аккаунт @ClaudeDevs написал: «We've reset everyone's 5-hour and weekly rate limits». Anthropic вручную обнулил оба счётчика всем платным подписчикам - кто сжёг квоту к утру, к обеду снова на 100%. API-юзеров не затронуло (там pay-as-you-go).

С 13 мая до 13 июля действует ещё одно временное промо: +50% к недельным лимитам Pro / Max / Team. После 13 июля недельные квоты вернутся к прежним.

Сколько реально тратит вайб-кодер

Anthropic в официальных docs даёт референсные цифры:

В среднем разработчик тратит $13 / день, $150-250 / месяц.
90% юзеров укладываются в $30 / день.
Agent teams в Plan Mode жгут примерно в 7 раз больше токенов, чем стандартная сессия.

Контекстное окно у всех планов одно - 200K токенов, включая Max 20x за $200. Auto-compact срабатывает примерно на 83.5% заполнения (буфер около 33K). Когда заталкиваешь в один чат полдня работы, контекст переполняется, Claude теряет нить, начинает повторно читать те же файлы и токены жгутся в полтора-два раза быстрее.

Контекст рот, да, больше 50-60%, если заполнение идёт, то качество падает, лимиты улетают очень сильно, быстро токены жрутся, агент начинает тупить, а тупеть тупеет и терять контекст, начинает путаться, начинает делать то, что его не просили. Это самая большая проблема.

- Артемий Миллер, Эфир Дня 2, Практикум #1 - Апрель 2026

Подписки $200 мне хватает, потому что я держу 8 правил, разобранных дальше. Без них и Max 20x кончится к обеду.

Правило 1. Почему «одна задача - один диалог» экономит больше всего токенов?

Это правило я повторяю на каждом эфире практикума. Не «открой 5 чатов параллельно» (хотя и так делаю), а именно «не доскрёбывай предыдущий чат под следующую задачу».

Одна задача - одно окно. Один чат - одна задача. Запомните, не грузите туда следующую ещё, ещё. Это всё в контексте у него в голове держится. Это потом у него всё в перемешку, он начинает галлюцинировать и выдавать.

- Артемий Миллер, Эфир Дня 2, Практикум #1 - Апрель 2026

У меня это работает так. На каждом сообщении Claude видит не только новый запрос, но и весь предыдущий разговор. Если ты с утра обсуждал посадочную страницу, потом перешёл на email-рассылку, а потом попросил поправить инструкцию практикума - в момент третьего запроса в контекст попадает вся история. Токены тратятся на «помнить посадочную страницу», хотя ты про неё уже забыл.

Почему «обнуление головы» работает

Я закрываю чат сразу, как закрыл задачу. Здесь дело даже не в токенах - это скорее про мою голову.

Для меня закрытие какого-то чата - это обнуление головы. То есть когда я заканчиваю одну задачу, потому что один чат - это одна задача… когда вы закрываете чат, вы себе в голове берёте и освобождаете свою оперативную, что всё, больше об этом не думать.

- Артемий Миллер, Эфир Дня 2, Практикум #1 - Апрель 2026

Если задача правда закрылась - не держи чат на всякий случай «вдруг вернусь». Открой новый. Старый можно найти через claude --resume или /resume по любому индикатору (имя ветки, ID PR, тег).

Что делать, если задача растянулась на два дня

Если задача правда требует продолжения, не оставляй чат «зависшим». Перед закрытием попроси Claude написать промт для соседнего чата (см. Правило 7). Это сжимает 50K токенов истории в 500 токенов промта - и завтра новый чат подхватывает контекст без переписывания всего.

Правило 2: CLAUDE.md в 200 строк, не в 500

CLAUDE.md - это первый файл, который Claude читает при старте новой сессии. У меня свой канон, в практикуме разбираю его подробно, а здесь - конкретно про экономию токенов.

Когда мы открываем новое окно в нашем VS Code или Claude Desktop, всегда читается CLAUDE.md. Это некий такой файл, по сути, такой системный промт, который при старте каждой задачи всегда подгружается в контекстное окно. Поэтому это стартовый файл с информацией, в котором мы должны заложить о проекте - где что брать.

- Артемий Миллер, Эфир Дня 2, Практикум #3 - Май 2026

Сколько строк - норма

Подход	Строк	Где работает
Karpathy CLAUDE.md (4 правила)	65	Универсально, любой проект
Официальная рекомендация Anthropic	до 200	Среднестатистический репозиторий
Bijit Ghosh «behavioral contract»	до 100 строк, остальное в `docs/`	Большие продукты
Auto-сгенерённая через `/init`	разная	Чаще ухудшает результат, чем улучшает

Цифры по Karpathy - из репозитория forrestchang/andrej-karpathy-skills, который за 3 месяца собрал более 130 000 звёзд и 28 дней подряд держался в weekly trending GitHub. Внутри - 4 правила: Think Before Coding, Simplicity First, Surgical Changes, Goal-Driven Execution. И всё.

Почему длинный CLAUDE.md делает агента глупее

Исследование AGENTbench прогнало 138 реальных задач из 12 Python-репозиториев через Claude Sonnet 4.5, GPT-5.2 и Qwen Code. Главный вывод: CLAUDE.md, сгенерированный командой /init, снижает success rate. Лучше работает либо вручную написанный короткий файл, либо вообще никакого CLAUDE.md.

Объяснение простое: /init описывает репо «обратно модели», добавляя в контекст то, что модель уже знает или может узнать сама за один взгляд на структуру. Это дублирование съедает токены и размывает фокус.

CLAUDE.md - не документация. Это поведенческий контракт между твоей командой и AI-агентом. Каждое слово должно менять поведение агента. Если не меняет - удаляй.

- Bijit Ghosh, https://medium.com/@bijit211987/the-complete-guide-to-claude-md-memory-rules-loading-and-cross-tool-compression-97cc12ed037b

Правило плотности: каждое слово меняет поведение

Если я могу удалить строку из CLAUDE.md и поведение Claude не изменится - значит, эта строка лишняя. Это работает как тест:

Открой CLAUDE.md и пройдись по каждому абзацу.
Спроси себя: «если я это удалю, Claude начнёт ошибаться?»
Если нет - удаляй или выноси в Skill.

В скилы (.claude/skills/<имя>/SKILL.md) уходят все правила, которые срабатывают только в определённых ситуациях. CLAUDE.md - только то, что нужно всегда.

Правило 3. Зачем хранить план Claude Code в отдельном файле?

Plan Mode - режим Claude Code, который включается через Shift+Tab. В нём Claude изучает кодбазу, читает файлы, задаёт вопросы - но не пишет ничего на диск. Только когда план подтверждён, переходит в режим правок.

80% задач я начинаю с Plan Mode - это по сути 'пожалуйста, пока не пиши код'. Как только план подтверждён, сразу перехожу в auto accept. AI сейчас пишет 100% моего кода.

- Boris Cherny, https://www.lennysnewsletter.com/p/head-of-claude-code-what-happens

Почему план в файле сильнее, чем план в голове Claude

У меня в каждом проекте есть папка plans/. Когда я начинаю задачу:

Прошу Claude в Plan Mode разобраться и предложить подход.
Прошу его сохранить план в файл plans/YYYY-MM-DD-название-задачи.md.
Закрываю чат.
В новом чате говорю: «прочитай plans/YYYY-MM-DD-...md и реализуй фаза 1».

Что я выигрываю:

План фиксированный - Claude не «забывает», что мы решили час назад.
План можно править руками - я вижу 5 шагов, понимаю, что шаг 3 лишний, удаляю и иду дальше.
План переживает рестарт - завтра вернулся, открыл файл, продолжил.
План можно передавать агентам последовательно - один чат пишет план, второй реализует, третий проверяет.

Plan Mode не ломает кэш

Важная деталь: Plan Mode инвалидирует только conversation cache (сообщения), а system prompt и project context (CLAUDE.md) остаются прогретыми. Это значит, что переключение в Plan Mode и обратно стоит почти ничего по токенам - в отличие от смены модели через /model, которая ломает кэш на 90% input-цены и заставляет пересчитать весь префикс.

Контекст-инжиниринг - это в том числе про то, чтобы хранить план там, где он будет долго лежать, не в чате, который умрёт через 5 часов.

Правило 4: Skills грузятся по триггеру, не на старте сессии

Skills устроены трёхуровневой подгрузкой:

Metadata всегда - при старте сессии Claude видит только name и description каждого skill. Бюджет: ~100 токенов на skill.
Instructions по триггеру - когда юзер сказал что-то релевантное, Claude грузит тело SKILL.md. Бюджет: до 5000 токенов.
Resources по запросу - бандлированные файлы (примеры, шаблоны) подтягиваются только когда модель сама лезет за ними.

Полные инструкции грузятся только когда Claude решает, что skill релевантен (меньше 5k tokens). Вспомогательные скрипты и файлы подгружаются только когда явно нужны. Значит, у тебя могут стоять десятки skills, не влияя на качество работы по несвязанным задачам.

- Anthropic Skills Documentation, https://code.claude.com/docs/en/skills

Как это меняет экономику токенов

Раньше я пихал в CLAUDE.md и канон написания инструкций для практикума, и регламент рассылок, и правила проверки кода. Файл рос до 500 строк, и при каждом старте сессии я платил за все 500 строк, даже если разговор был про посадочную страницу.

Сейчас у меня в CLAUDE.md - 200 строк навигации и базовых принципов. А 4 регламента живут в скилах:

.claude/skills/
├── write-tutorial/SKILL.md         # триггер: «напиши гайд»
├── deploy-checklist/SKILL.md       # триггер: «проверь перед публикацией»
├── send-broadcast/SKILL.md         # триггер: «отправь рассылку»
└── debug-payment-webhook/SKILL.md  # триггер: «проверь оплату»

Claude видит при старте только заголовки - 400 токенов. А когда я говорю «напиши гайд» - подгружает соответствующий SKILL.md и идёт по нему. Когда говорю «отправь рассылку» - подгружает другой.

Mattpocock/skills - открытый набор скилов от Matt Pocock (более 90 000 звёзд), который держит правило плотности:

Цитата из правил написания скилов в официальных docs Anthropic - именно её Matt Pocock положил в основу своего набора:

Когда skill загрузился, его содержимое остаётся в контексте на следующих turns, поэтому каждая строка - повторяющаяся цена в tokens. Пиши, что делать, а не пересказывай как и почему.

- Anthropic Skills Documentation, https://code.claude.com/docs/en/skills

Когда скил под подозрением - не ставь

Всё подряд качать нельзя, очень часто умельцы в скилы зашивают неприятные вызовы - берут ключи из папочки и отправляют на вредоносный сайт.

- Артемий Миллер, Эфир Дня 2, Практикум #3 - Май 2026

Скилы - это исполняемые инструкции с прямым доступом к твоим файлам и API-ключам. Перед установкой чужого набора я открываю каждый SKILL.md и читаю сам. Если внутри bash:-блоки со ссылками на внешние URL - это тревожный знак, я такое не ставлю.

Правило 5. Когда отдавать задачу sub-agent'у вместо основной сессии?

Из официальных docs:

Делегируй болтливые операции на subagents, чтобы многословный вывод оставался в их контексте, а в основной разговор возвращался только итог.

- Claude Code Documentation, https://code.claude.com/docs/en/costs

Какие задачи я делегирую sub-agent'ам

Поиск по большой кодбазе. Sub-agent читает 30 файлов, возвращает «нужная функция в src/lib/payment/cloudpayments.ts:142». Я не вижу содержимое 30 файлов в основном контексте.
Прогон тестов и парсинг логов. Sub-agent запускает npm test, ловит 200 строк вывода, возвращает «3 теста упали в X, Y, Z из-за такой-то причины».
Multi-file refactor. Один sub-agent на один файл - параллельно.
Проверка ссылок в гайде. Sub-agent ходит по 30 URL через WebFetch, возвращает «5 ссылок отдают 404».

В мае 2026 Anthropic официально анонсировал Multi-Agent Orchestration как первоклассную фичу. Раньше sub-agent'ы запускались только в коде через SDK, теперь - прямо в Claude Code через slash-команды.

Где sub-agent ломается

Многоагентная архитектура - это хорошо, ускоряет процесс, но он очень часто может сгаллюцинировать, сломать код, поудалять всё лишнее. Условно весь день он работает, приходишь - а там ни хрена ничего нету толком.

- Артемий Миллер, Эфир Дня 1, Практикум #3 - Май 2026

Поэтому я никогда не оставляю sub-agent'ов на полдня без проверки. Правило: чем больше делегируешь параллельно, тем чаще приходи проверять промежуточный результат. На крупных задачах включаю Plan Mode для каждого sub-agent'а отдельно.

Практикум по вайб-кодингу

+Твой второй мозг

3 вечера - стек, метод, первый проект

Старт 14–16 июля · 2 000 ₽

Записаться →

Правило 6. Как выбрать модель Claude (Opus / Sonnet / Haiku) под задачу?

Цены на API (за миллион токенов):

Модель	Input	Output	Cached input
Opus 4.7	$5	$25	$0.50
Sonnet 4.6	$3	$15	$0.30
Haiku 4.5	$1	$5	$0.10

Источник - официальная страница Anthropic. На подписке цены не светятся, но соотношение то же. У Opus 4.7 есть нюанс: новый токенизатор по сравнению с Opus 4.6 может тратить до +35% токенов на тот же текст. Цена за токен не выросла, но эффективная стоимость запроса - да. Если бездумно гонять всё через Opus, лимит закончится в 5 раз быстрее, чем если бы под половину задач взял Sonnet или Haiku.

Учётка за 200 баксов - это, грубо говоря, токенов где-то на 2000 долларов на текущий момент. То есть почему есть смысл использовать учётку, особенно на максималках, потому что сильнейшая экономия.

- Артемий Миллер, Эфир Дня 1, Тренинг #1 - Апрель 2026

Как я выбираю модель

Задача	Модель	Почему
Архитектурное решение, новый раздел продукта	Opus 4.7	Нужна глубина
Написать компонент по понятной спецификации	Sonnet 4.6	Дефолт
Поправить опечатку, переименовать переменную	Sonnet 4.6 или Haiku 4.5	Простая правка
Поиск файла по описанию, file routing	Haiku 4.5	Дешёво
Перевод текста, классификация, summarization	Haiku 4.5	Простая модель справится
Code review своего же кода	Sonnet 4.6	Дефолт
Сложный bug hunt с многошаговым reasoning	Opus 4.7	Нужны цепочки

Переключение - команда /model. Но - смена модели инвалидирует кэш. Если ты в середине сессии переключился с Sonnet на Opus, следующий запрос пересчитает весь префикс с нуля по полной input-цене (не cached). Поэтому модель лучше выбирать на старте, а не дёргать туда-сюда.

/effort - менее агрессивная настройка

В апреле 2026 Anthropic выкатил /effort - 5 уровней глубины reasoning: minimal / low / medium / high / xhigh. Claude Code на Opus 4.7 по дефолту работает на xhigh.

Что я делаю:

Для классификации, извлечения данных, коротких summary - /effort low. Экономия 30-70% на типах задач, где глубокое reasoning не нужен.
Для простой работы с кодом - /effort medium.
Для сложной архитектуры - оставляю xhigh.

/effort не меняет модель, только глубину её мышления. Кэш не ломается.

Правило 7: передача промта в новый чат вместо `/compact`

/compact - официальная команда Claude Code, которая заменяет историю summary. Если запустить сразу после последнего сообщения, пока кэш горячий (TTL на подписке - 1 час), суммаризация попадает в кэш и читается за 10% стандартной цены. Если запустить через час - кэш холодный, платишь полностью.

У /compact есть кастомизация:

bash

/compact Focus on code samples and API usage

Или в CLAUDE.md можно прописать дефолтный фокус суммаризации:

markdown

# Compact instructions
When you are using compact, please focus on test output and code changes

Но я чаще делаю по-другому.

Передача промта в соседний чат - как у меня

Я всегда обычно говорю: «Слушай, я хочу продолжить в соседнем чате. Напиши мне промт полностью, в котором соседний чат продолжит твою задачу, не потеряв смысл». И он пишет промт, ты его копируешь в новом чате, запускаешь - и вот там вот было у тебя огромное контекстное окно, а сейчас он это всё сжал. Можно, конечно, включить там компакт или клир. Если честно, я больше использую «напиши мне промт, копирую промт и иду в соседний чат».

- Артемий Миллер, Эфир Дня 2, Практикум #3 - Май 2026

Шаги:

В текущем чате на момент, когда вижу что контекст перевалил за 50%, говорю: «Напиши мне промт для соседнего чата, который продолжит работу не теряя смысл. Включи: что мы решали, что уже сделано, что осталось, ключевые файлы и константы».
Claude отдаёт мне промт на 300-800 токенов.
Закрываю текущий чат через /clear или просто открываю новый.
Вставляю промт - и стартую с прогретой CLAUDE.md и project context, но с чистой conversation memory.

Что я выигрываю по сравнению с /compact:

Контроль над тем, что попало в новый чат. /compact сжимает по своему пониманию, я могу руками отредактировать промт перед стартом.
Промт можно сохранить в файл plans/ - и завтра вернуться.
Новый чат стартует с чистой conversation cache - дальше работаешь по cached-цене на input.

Когда `/compact` лучше

Когда ты в Plan Mode и не хочешь терять текущий план.
Когда задача однотонная и контекст однотипный (например, перевод длинного документа).
Когда /compact запускается сразу после ответа Claude - тогда суммаризация попадает в горячий кэш и стоит 10%.

`/clear` - крайний случай

/clear стирает всё, включая project context. Использую только когда переключаюсь на абсолютно несвязанную тему и не хочу держать в памяти ничего из предыдущей. После /clear следующий запрос платит полную цену за загрузку CLAUDE.md заново.

Правило 8. Что инвалидирует кэш Claude Code и почему за это платишь?

На подписке cache TTL - 1 час (продлевается при каждом обращении). На API по умолчанию - 5 минут. Это значит: если ты вернулся к работе через 40 минут, кэш ещё жив и следующий запрос стоит копейки на input. Через 1 час - всё, кэш протух, платишь полную цену.

Большая часть времени compaction уходит на генерацию итога, а не на cache miss.

- Claude Code Documentation, https://code.claude.com/docs/en/prompt-caching

Что ломает кэш (избегай в середине задачи)

/model - смена модели в середине сессии. Каждая модель имеет свой кэш. После /model opus следующий запрос пересчитывает весь префикс на Opus с нуля.
Включение Plan Mode при настройке opusplan. В этом режиме Plan Mode = Opus, обычный = Sonnet. Каждый Shift+Tab = смена модели = invalid cache.
MCP server connect / disconnect. Включая авто-reconnect после transient failure. Если у тебя нестабильный MCP-сервер, ты платишь дважды.
Bare-name deny rules (Bash, WebFetch) - изменяют tool definitions в system prompt.
/compact - инвалидирует conversation layer (by design).
Upgrade Claude Code на новую версию - новая версия = новый system prompt = новый кэш.

Что НЕ ломает кэш

Правка файлов в репо (читаются on-demand).
Правка CLAUDE.md в середине сессии (но не применяется до рестарта - читай Правило 2).
Smena output style.
Permission mode change (если не задействован opusplan).
Skills / commands invocation (добавляются в conversation layer).
/recap (новая команда, summary без инвалидации кэша).
/rewind (возврат на уже прогретый prefix).
Spawn sub-agent (parent's cache не затрагивается).

Как использовать кэш в свою пользу

Не дёргай /model без надобности. Выбирай модель на старте задачи.
Не включай 10 MCP-серверов «на всякий случай». Каждый добавляет к system prompt и ломает кэш при reconnect.
Не правь CLAUDE.md между задачами - все правки делай в один заход и после рестарта.
Используй /recap вместо /compact, когда надо просто посмотреть summary, а не освободить контекст.

Что меняется 15 июня 2026 с programmatic credit pool?

Анонс полностью разделяет работу с Claude на два типа:

Тип	Что входит	Биллинг
Интерактивный	Claude Code TUI, Cowork, Claude.ai с человеческими промптами	Подписка как раньше
Programmatic	Claude Agent SDK, `claude -p` (headless), GitHub Actions, T3 Code, Zed, OpenClaw, любой агент без человека в петле	Отдельный месячный пул, не roll-over, по API-rates

Размер programmatic пула:

Pro $20 → $20 в programmatic credits / мес
Max 5x → $100
Max 20x → $200

После исчерпания пула - либо стоп, либо доплачиваешь по API-ценам.

Реакция сообщества

Никогда раньше не сталкивался ни с одним developer-инструментом с такой бесящей непрозрачностью базовых условий использования.

- Matt Pocock, https://finance.biggo.com/news/382b1ef1c37acfb3

Theo Browne, автор T3 Code, написал что эффективное удорожание для third-party tools - «25-40 раз». Подписку отменил. Matthew Berman выпустил видео «The Anthropic Situation is INSANE» (596K подписчиков). Anthropic в ответ удвоил лимиты 6 мая и сбросил счётчики 15 мая - но programmatic credits остались.

Касается ли это тебя как вайб-кодера

Если ты работаешь в Claude Code так:

Открываешь VS Code, сидишь в Claude Code, пишешь промпты руками.
Plan Mode, auto-accept, sub-agents через slash-команды.
Без CI, без GitHub Actions, без сторонних обёрток.

Тогда ты в интерактивном пуле, ничего не меняется. У меня лично эта новость прошла мимо, потому что я не пускаю Claude в CI.

Если ты при этом:

Запускаешь claude -p "..." из bash-скриптов.
Используешь Claude Code GitHub Action для авто-ревью PR.
Сидишь в Zed или T3 Code.
Пишешь собственные агенты на Anthropic SDK.

Тогда с 15 июня тебе нужен второй счёт: подписка для интерактивной работы + API-budget для programmatic. Или Enterprise-тариф.

Один день вайб-кодера в Claude Code

Типичный мой день в Claude Code устроен так:

9:00. Открываю задачу №1 - правка email-шаблона. Открываю новый чат, Plan Mode, прошу Claude разобраться. Через 3 минуты план готов, переключаюсь в auto-accept, правка занимает 10 минут. Закрываю чат.
9:30. Задача №2 - написать инструкцию практикума. Открываю новый чат, в нём срабатывает мой skill для написания инструкций. Подгружаются 4000 токенов методологии. Работаю по нему, через 40 минут инструкция готова. Готово.
11:00. Задача №3 - сложная архитектурная штука. /model opus, Plan Mode, обсуждение. Прошу сохранить план в plans/2026-05-20-...md. Закрываю чат.
12:00. Новый чат: «прочитай plans/2026-05-20-...md и реализуй фазу 1». 6 sub-agent'ов параллельно - по одному на файл. Через 45 минут фаза 1 готова. Закрываю.
14:00. Задача №4 - правка посадочной страницы. /model sonnet. Новый чат. План + реализация - 30 минут. Закрываю.
15:00. Задача №5 - debug продакшена. /model opus, Plan Mode, нужна глубина. После часа обсуждения прошу написать промт для соседнего чата с найденной причиной + предлагаемым фиксом. Копирую в новый чат, реализую за 20 минут.

К концу дня - 6 задач, 8 закрытых чатов, ни одного /compact. Лимит съеден на 40-60%. Этого хватает с запасом.

Мне мои подписки за 200 баксов, учитывая количество проектов, которые я имею, учитывая, что я как-коде по 8 часов, прогоняю огромные тексты - мне хватает. Я лимит ещё никогда не заканчивал. То есть бывало, упёрся, но не заканчивал.

- Артемий Миллер, Эфир Дня 2, Практикум #3 - Май 2026

Лимит кончается у тех, кто:

Заталкивает всю задачу в один чат, в котором уже 50% контекста.
Держит CLAUDE.md на 600 строк, потому что «вдруг пригодится».
Дёргает /model opus для каждой простой правки.
Включил 8 MCP-серверов на всякий случай.
Никогда не использовал sub-agent'ов и тащит всё в основной диалог.

Лимит не кончается у тех, кто строит второй мозг в файлах проекта и работает с Claude как с инженером в команде - даёт чёткие задачи, не сваливает всё в один разговор, использует разные инструменты под разные задачи.

Источники

Anthropic - Higher limits and SpaceX deal (6 мая 2026)
Claude Code Documentation - Cost optimization
Claude Code Documentation - Prompt caching
Claude Code Documentation - Skills
Claude Code Documentation - Changelog
Anthropic API Pricing
Anthropic Code with Claude SF 2026 - keynote summary
Boris Cherny on Lenny's Podcast - Head of Claude Code
Cat Wu TechCrunch interview (13 мая 2026)
forrestchang/andrej-karpathy-skills - вирусный CLAUDE.md, более 130K stars
mattpocock/skills - более 90K stars
Bijit Ghosh - The Complete Guide to CLAUDE.md
Your CLAUDE.md Is Making Your Agent Dumber - AGENTbench исследование на 138 репо
Programmatic credit pool announcement - SiliconANGLE
Theo Browne reaction - BigGo Finance
Manual reset rate limits 15 мая 2026
Show HN: Semble - 98% меньше токенов чем grep
FindSkill - Claude Code Subscription Pricing Guide
Личные эфиры Артемия: Практикум #1 Апрель 2026, Практикум #3 Май 2026, Тренинг #1 Апрель 2026

Если 8 правил из этой статьи стали понятны - дальше в практикуме собираем полную связку: ИИ-клон + Второй мозг + контекст-инжиниринг за 3 эфира. Три кита, без которых лимит будет кончаться даже на Max 20x.

Практикум по вайб-кодингу

+Твой второй мозг

3 вечера - стек, метод, первый проект

Старт 14–16 июля · 2 000 ₽

Записаться →

Новые материалы - дайджестом, без спама

Гайды выходят регулярно. Подпишись, чтобы не пропускать: пришлю подборку в Telegram или на email. Раз в неделю или каждый день - выбираешь сам.

Подписаться в Telegram

Как устроены лимиты Claude Code в 2026 и почему ты упираешься в них?

Удвоение 6 мая и manual reset 15 мая - что это было

Сколько реально тратит вайб-кодер

Правило 1. Почему «одна задача - один диалог» экономит больше всего токенов?

Почему «обнуление головы» работает

Что делать, если задача растянулась на два дня

Правило 2: CLAUDE.md в 200 строк, не в 500

Сколько строк - норма

Почему длинный CLAUDE.md делает агента глупее

Правило плотности: каждое слово меняет поведение

Правило 3. Зачем хранить план Claude Code в отдельном файле?

Почему план в файле сильнее, чем план в голове Claude

Plan Mode не ломает кэш

Правило 4: Skills грузятся по триггеру, не на старте сессии

Как это меняет экономику токенов

Когда скил под подозрением - не ставь

Правило 5. Когда отдавать задачу sub-agent'у вместо основной сессии?

Какие задачи я делегирую sub-agent'ам

Где sub-agent ломается

Правило 6. Как выбрать модель Claude (Opus / Sonnet / Haiku) под задачу?

Как я выбираю модель

/effort - менее агрессивная настройка

Правило 7: передача промта в новый чат вместо /compact

Передача промта в соседний чат - как у меня

Когда /compact лучше

/clear - крайний случай

Правило 8. Что инвалидирует кэш Claude Code и почему за это платишь?

Что ломает кэш (избегай в середине задачи)

Что НЕ ломает кэш

Как использовать кэш в свою пользу

Что меняется 15 июня 2026 с programmatic credit pool?

Реакция сообщества

Касается ли это тебя как вайб-кодера

Один день вайб-кодера в Claude Code

Источники

Новые материалы - дайджестом, без спама

Связанные инструкции

Как настроить CLAUDE.md в 2026: готовый шаблон и 6 правил

Второй мозг в Claude Code: как настроить, чтобы он помнил проект

Claude Code Skills в 2026: как собрать библиотеку навыков под себя

Claude Code Subagents в 2026: пошаговая инструкция и 5 готовых примеров

Связанные концепты

Вайб-кодинг

Второй мозг

ИИ-клон

Правило 7: передача промта в новый чат вместо `/compact`

Когда `/compact` лучше

`/clear` - крайний случай