Каждый день в Telegram-канале - что нового в вайб-кодинге: инструменты, разборы, ошибки. Подпишись, чтобы быть в курсе.
Зачем отслеживать токены, если у меня подписка Pro/Max?
Подписка Claude Code на Pro или Max выглядит как «безлимит» только до первого крупного проекта. Лимиты есть: 5-часовое окно и недельный квот, оба rolling. Anthropic 13 мая 2026 временно поднял недельные лимиты на 50% до июля - и сразу стало понятно, что до этого многие в эти лимиты упирались каждую неделю (Anthropic News).
Главная разница - между подпиской и API. По расчётам практиков, подписка Max за $200 в месяц даёт примерно столько же реальных токенов, сколько $2000 на API напрямую. Та же логика что у фитнес-клуба: одни ходят каждый день, другие почти не ходят, экономика подписки выгодна тем, кто реально живёт в инструменте. Если вайб-кодишь несколько часов в день, подписка в 10-15 раз дешевле чистого API. Если только пробуешь - честнее остаться на $20 Pro.
Без трекера расхода ты не видишь главное:
- Какая модель жрёт больше всего (Opus 4.7 даёт х5 к стоимости относительно Sonnet 4.6).
- Какая команда вытаскивает половину дневного лимита за один прогон (обычно это
read_fileна большой файл). - Когда тёплый кеш сбрасывается и следующий запрос идёт по full price.
- Что подписка течёт даже в idle - background-задачи Claude Code тратят обычно меньше $0.04 за сессию (Claude Code Docs - Manage costs).
Прочитай дополнительно как не сжечь лимиты Claude Code за день - там 8 правил экономии, на которые трекер ложится сверху.
Что показывает Claude Code сам: /usage, /cost и Web-консоль?
Минимум, что доступно без установки чего-либо:
/usageКоманда покажет на экране:
Total cost: $0.55
Total duration (API): 6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes: 0 lines added, 0 lines removedНа Pro и Max планах долларовая цифра - локальная оценка. Реальный счёт от Anthropic может отличаться, потому что вычисляется на их стороне. Параллельно /usage показывает прогресс-бары лимитов плана за 5 часов и за 7 дней - это то, на что реально стоит смотреть. По наблюдениям активных пользователей Max-плана за 7 дней хардкорного использования реально расходуется около 34% недельного лимита - то есть запаса хватает на 2-3 таких недели.
Команда /context отдельная и показывает другое - сколько осталось в контекстном окне (hard-limit 200K токенов). Когда поле начинает желтеть, время делать /compact или /clear. Полная карта алиасов в официальной документации.
Веб-консоль на claude.com → Settings → Usage показывает то же самое в браузере, плюс позволяет смотреть данные по другим устройствам. Для API-юзеров есть отдельный раздел platform.claude.com/usage с фильтрами по модели, ключу, окну и экспортом в CSV. Данные приходят с задержкой до 5 минут - это нормально, не баг.
Чего не показывают встроенные средства:
- Историю расхода по дням / неделям / месяцам с графиками.
- Разбивку по проектам (если у тебя несколько активных).
- Burn rate - сколько токенов в минуту прямо сейчас и через сколько кончится окно.
- Cache read / cache creation отдельно (а это критично, у них цены различаются в 20 раз).
За этим уже идём в сторонние трекеры.
ccusage: чем стал стандарт и как поставить за 30 секунд?
Установка одной командой:
npx ccusage@latestИли, если ты уже на Bun:
bunx ccusageПосле первого запуска покажет таблицу за сегодня:
ccusage daily --breakdown--breakdown разбивает по моделям - видно, сколько съел Opus 4.7, сколько Sonnet 4.6, сколько Haiku. Эта одна команда чаще всего открывает глаза: половина расходов на Opus, хотя 70% задач можно было сделать на Sonnet за треть цены.
Полезные команды:
ccusage daily # за сегодня
ccusage weekly # за неделю
ccusage monthly # за месяц
ccusage session # за текущую сессию
ccusage blocks # 5-часовые биллинг-окна (важно для Max)
ccusage --since 2026-05-01 # с конкретной датыОпции:
--breakdown- разбивка по моделям.--json- выгрузка в JSON для своих дашбордов.--offline- работает без интернета, с кешированными ценами Anthropic.
Поддерживает не только Claude Code: ещё Codex, OpenCode, Amp, Goose, Kilo, Kimi, Qwen, GitHub Copilot CLI, Gemini CLI - всё, что пишет логи в локальный JSONL. Если совмещаешь Claude с Codex или Qwen для рутины, ccusage покажет картину в одном месте.
Главная фишка для Max-плана - команда blocks. Она показывает 5-часовые окна биллинга: сколько уже истратил в текущем окне, когда оно сбрасывается, и какая средняя нагрузка. Без этого ты не знаешь, можно ли запустить тяжёлый рефакторинг сейчас или лучше подождать ресета.
Полный код и документация - github.com/ryoppippi/ccusage. Свежая версия v20.0.5 от 25 мая 2026, проект активный, 1322 коммита.
Видеть расход - это первый шаг. Второй - управлять контекстом так, чтобы он не распухал и не съедал лимит впустую. Контекст-инжиниринг - управление тем, что попадает в окно Claude до того, как ты нажал Enter. На практикуме за 3 эфира собираешь полную связку: ИИ-клон + Второй мозг + Контекст-инжиниринг - именно она превращает Claude из «помощника с галлюцинациями» в стабильный инструмент.
Claude Code Usage Monitor: нужен ли TUI с прогресс-барами?
Установка:
pip install claude-monitorИли, если есть uv:
uv tool install claude-monitorЗапуск:
claude-monitorПосле запуска занимает терминал, показывает экран с цветными прогресс-барами:
- Текущее использование 5-часового окна (с раскраской: зелёный, жёлтый, красный).
- Burn rate - токенов в минуту прямо сейчас.
- ML P90-прогноз - когда лимит закончится при текущей скорости.
- Refresh rate настраивается от 0.1 до 20 Гц.
В инструменте зашиты лимиты планов:
| План | Токены в 5-часовом окне | Эквивалент в долларах |
|---|---|---|
| Pro | 19 000 | $18 |
| Max5 | 88 000 | $35 |
| Max20 | 220 000 | $140 |
| Custom | по ML P90 | $50 по умолчанию |
Если у тебя свои лимиты (Team или Enterprise), монитор подстроится сам, наблюдая твою историю.
Когда брать: ccusage показывает «что было», claude-monitor показывает «что происходит сейчас». Если делаешь долгую автономную задачу в Plan Mode или с несколькими субагентами, монитор на втором экране даёт раннее предупреждение - «через 12 минут упрёшься в потолок, переключай модель». На обычной задаче 30-60 минут он избыточен, хватит ccusage в конце.
Репозиторий: github.com/Maciek-roboblog/Claude-Code-Usage-Monitor. PyPI: claude-monitor.
tokscale: чем интересна свежая утилита на Rust?
Установка:
bunx tokscale@latestЗапуск открывает интерактивный TUI с навигацией по 6 вьюхам:
- Overview - сводка за день / неделю / месяц.
- Models - разбивка по моделям с input / output / cache / reasoning отдельно.
- Daily - календарный график расхода.
- Stats - детальная статистика по типам токенов.
- Wrapped - твой год в обзоре (как Spotify Wrapped, но для токенов).
- Leaderboard - сравнение с другими (опционально, через социальный профиль).
Главные отличия от ccusage:
- Скорость. SIMD JSON-парсинг даёт ~8-10x ускорение на больших историях (миллионы запросов).
- Reasoning tokens отдельной категорией - для моделей с extended thinking (Opus 4.7 с
/effort high). - Pricing через LiteLLM в реальном времени с OpenRouter как fallback. Если Anthropic поменяет цены, tokscale покажет актуальные через час.
- 2D и 3D contribution graphs - визуально показывает, в какие дни и часы вайб-кодишь.
Если у тебя нет огромной истории и не нужны фичи вроде leaderboard, tokscale избыточен. Если пользуешься Claude Code больше полугода и хочешь увидеть свой рабочий ритм в графиках - стоит попробовать. Проект свежий, кодовая база Rust + Node, активный maintainer.
Репозиторий: github.com/junhoyeo/tokscale.
Какие ещё бесплатные альтернативы есть в 2026?
ccmonitor
Watch-режим в одном экране. Цвет-кодированные прогресс-бары для 5-часового окна (зелёный до 50%, жёлтый до 80%, красный после). По умолчанию настроен на лимит $10 за окно для Pro. Запуск через npx ccmonitor. Полезен, если хочешь оставить его открытым в фоновом терминале и иногда поглядывать.
Репо: github.com/shinagaki/ccmonitor.
Claude Usage Tracker
Local-first дашборд на Chart.js, агрегирует 10+ инструментов: Claude Code, Claude Desktop, Cursor, Windsurf, Cline, Roo Code, Aider, Continue.dev, OpenClaw. Если совмещаешь Claude Code на основную работу и Cursor для UI-набросков, увидишь общий расход в одном окне. Daily costs, model breakdowns, heatmaps, monthly projections.
Репо: github.com/658jjh/claude-usage-tracker.
claude-code-otel
Для тех, кто уже работает с Grafana и Prometheus в проде. Полный observability-стек на OpenTelemetry: метрики Claude Code попадают в Prometheus, логи в Loki, дашборды в Grafana. Включается переменной окружения:
export CLAUDE_CODE_ENABLE_TELEMETRY=1Имеет смысл только в команде или если у тебя уже стоит свой Grafana - просто чтобы попробовать овчинка не стоит выделки.
Репо: github.com/ColeMurray/claude-code-otel.
Statusline-варианты
Через встроенную команду /statusline в Claude Code настраивается нижняя панель прямо в интерфейсе. Несколько готовых вариантов трекера в статус-баре:
ccstatusline- 30+ виджетов, можно собирать как конструктор.daniel3303/ClaudeCodeStatusLine- показывает модель, токены, rate limits, git-инфо в реальном времени.- У самого ccusage есть beta-команда
ccusage statuslineдля интеграции с нативной панелью Claude Code.
Statusline не заменяет полноценный трекер, но даёт постоянное boundary-awareness - видишь свежий расход прямо в Claude Code, не переключаясь в другой терминал.
Что значат 4 типа input-токенов и почему один в 10 раз дешевле?
В каждом ответе Anthropic возвращает usage-объект с 4 счётчиками:
{
"usage": {
"input_tokens": 248,
"output_tokens": 503,
"cache_creation_input_tokens": 5120,
"cache_read_input_tokens": 1800
}
}Их математика:
| Метрика | Множитель к base input | Что значит |
|---|---|---|
input_tokens | 1.0x | Чистый ввод. Полная цена. |
cache_creation_input_tokens (5 мин) | 1.25x | Создание кеша на 5 минут. На 25% дороже. |
cache_creation_input_tokens (1 час) | 2.0x | Создание кеша на час. В 2 раза дороже. |
cache_read_input_tokens | 0.1x | Чтение из тёплого кеша. В 10 раз дешевле. |
Цены за миллион токенов на май 2026:
| Модель | Base input | Cache write (5м) | Cache read | Output |
|---|---|---|---|---|
| Opus 4.7 | $5 | $6.25 | $0.50 | $25 |
| Sonnet 4.6 | $3 | $3.75 | $0.30 | $15 |
| Haiku 4.5 | $1 | $1.25 | $0.10 | $5 |
Минимальная длина для кеширования: 4096 токенов для Opus и Haiku, 1024 для Sonnet 4.6 (Anthropic Prompt Caching).
Поэтому когда ты не закрываешь сессию, Claude Code держит твой CLAUDE.md, прочитанные файлы и историю в тёплом кеше. Каждое следующее сообщение тянет их по цене 0.1x вместо 1x. «Закрою сессию и открою новую, чтобы сэкономить» - антипаттерн: свежая сессия начинается с full price, и первый ход дороже в 10 раз.
И ещё: твой собственный текст - 100-200 токенов из 100 000+ в активной сессии. «Я буду писать короче» влияет на output, но почти не влияет на расход input.
Какие скрытые ловушки жгут токены незаметно?
Phantom-токены в v2.1.100+
В мае 2026 разработчики Claude Code документально подтвердили: версии Claude Code 2.1.100 и выше отправляют на сервер в среднем на 20 000 токенов больше cache creation, чем v2.1.98 - при том, что байтов в payload меньше. Это server-side инфляция, скорее всего через User-Agent routing на стороне Anthropic.
Цифры из публичных бенчмарков (Awesome Agents):
| Версия | Content-Length | cache_creation_tokens | Дельта |
|---|---|---|---|
| 2.1.98 | 169 514 байт | 49 726 | baseline |
| 2.1.100 | 168 536 байт | 69 922 | +20 196 токенов |
| 2.1.101 | 171 903 байт | ~72 000 | +22 274 токенов |
Реальный эффект - около 40% overhead на каждый turn на проекте средней сложности. На Max за $100 теряешь примерно $40 эффективной стоимости в месяц. Anthropic подтвердил баг в issue #46917, на май 2026 не запатчил.
Workaround:
npx claude-code@2.1.98Проверить, что версия установилась:
ls ~/.local/share/claude/versions/Внимание: автообновления могут перезаписать. Если используешь Max и для тебя $40 в месяц - заметная сумма, отключи auto-update или держи pin на конкретной версии.
Tokenizer Opus 4.7 +35%
В Opus 4.7 Anthropic поменял токенизатор. На том же тексте новая модель теперь даёт в 1.0-1.35 раза больше токенов, чем Opus 4.6. Цены не изменились ($5/$25 за миллион), но фактический счёт за тот же объём работы вырос.
По публичному анализу byteiota - до +45% для code-heavy промптов (byteiota). Для других типов контента (JSON, не-английский) публичных бенчмарков пока нет, Anthropic в docs ограничивается формулировкой «varies by content».
Что делать:
- Если задача рутинная - Sonnet 4.6 на 40% дешевле и по input, и по output. Большая часть production-нагрузок там и должна жить.
- Если задача требует Opus - оставь его на архитектуру и сложный анализ, реализацию отдай Sonnet или Haiku.
- Сравни старый и новый счёт через ccusage
--breakdown- увидишь конкретный эффект.
Если интересна разница между Sonnet и Opus, я разбирал её подробно в Sonnet или Opus 4.7 в Claude Code: выбор модели и /effort.
Скрытые расходы фоновых задач
Claude Code тратит небольшие суммы даже в idle. Background-задачи (суммаризация для --resume, проверка статуса) обычно укладываются в $0.04 за сессию. Не главная статья, но если десятки фоновых сессий - складывается в несколько долларов в месяц.
Как настроить рабочий ритуал за 5 минут?
Из практики людей, которые реально живут в Claude Code, складывается семь правил. Они работают вместе - убери одно, и эффект падает.
- Каждая задача - новое окно. Не «доделать ещё одну мелочь в открытом чате». Контекст пухнет нелинейно: на 50-м сообщении в окне модель уже начинает повторять прочитанное, путать решения и съедать токены вхолостую. Хорошее правило - до закрытия окна сохранить план или ретроспективу в файл, а потом открыть свежее.
CLAUDE.md≤ 200 строк. Claude перечитывает проектный файл перед каждым шагом. Если он раздулся до 1000 строк, каждый промпт стоит в несколько раз дороже. Всё лишнее выноси вbusiness/,ai-clone/,skills/- Claude берёт оттуда по ссылке, а не таскает всё в контекст. Подробнее в Как настроить CLAUDE.md правильно.- Маршрутизация моделей. Архитектура и сложный анализ - Opus 4.7. Рутинная реализация, типовые правки, шаблонный код - Sonnet 4.6, Haiku или внешние модели (Qwen, DeepSeek) через Qwen Code как альтернативу Claude Code. Один практик однажды сжёг свою Max-подписку за день и собрал гибридную связку: Opus в Claude Code на план, всё остальное на Qwen и DeepSeek. Это даёт 50-70% экономии без потери качества на типовых задачах.
/compactи/clearпо делу./compact- посреди задачи, когда хочешь сохранить направление, но сжать историю до сути (например, 70K токенов до 4K)./clear- когда переключаешься на новую задачу. Не путай:/clearубивает контекст и тёплый кеш, после него первый ход будет в 10 раз дороже.- Субагенты на разных моделях. Если используешь субагенты Claude Code, оркестратор может быть Opus, но конкретные задачи (поиск, переименование, генерация типов) делают агенты на Sonnet или Haiku. Это переносит маршрутизацию моделей внутрь одной задачи. Учти: agent teams используют примерно в 7 раз больше токенов, чем стандартные сессии - убедись, что они того стоят (Claude Code Docs - Manage costs).
- План разбивай на фазы. Каждая фаза - в новое окно. Между фазами -
/compactили/clear. Если делаешь это правильно, длинный проект в Claude Code обычно стоит как 2-3 средние сессии, а не как одна гигантская. - Открой
/usageкаждое утро. 30 секунд: посмотри, сколько ушло за вчера, остаток 5-часового и недельного окна. Это базовая дисциплина, после которой ccusage и claude-monitor добавляют второй и третий уровень обзора.
Если хочешь увидеть полную картину «куда уходят токены в принципе» (9 типовых паттернов потери), почитай Куда уходят токены в Claude Code - там разобраны конкретные сценарии, а этот гайд про инструменты, которые их видят.
Источники
- Manage costs effectively - Claude Code Docs
- Monitoring Claude Code usage - Claude Code Docs
- Customize your status line - Claude Code Docs
- Prompt caching - Claude API Docs
- What's new in Claude Opus 4.7 - Anthropic
- Cost and Usage Reporting in the Claude Console
- Use Claude Code with your Pro or Max plan - Anthropic Support
- Higher rate limits with SpaceX partnership - Anthropic News
- ryoppippi/ccusage - GitHub
- Maciek-roboblog/Claude-Code-Usage-Monitor - GitHub
- junhoyeo/tokscale - GitHub
- shinagaki/ccmonitor - GitHub
- 658jjh/claude-usage-tracker - GitHub
- ColeMurray/claude-code-otel - GitHub
- Phantom tokens v2.1.100+ - GitHub Issue #46917
- Claude Code Silently Burns 40% More Tokens - Awesome Agents
- Claude Opus 4.7 Tokenizer: 35% Cost Inflation - byteiota
- Open-source tools to monitor Claude Code usage - apidog
- ccusage.com - официальный сайт
- pypi.org/project/claude-monitor
- claudelog.com - What is ccusage?
Трекер показывает, куда уходит счёт - это полдела. Дальше нужна дисциплина: ИИ-клон + Второй мозг + Контекст-инжиниринг. На практикуме за 3 эфира собираешь всю связку - 2 000 ₽, записи остаются у тебя.

