Как отслеживать расход токенов в Claude Code в 2026: 5 инструментов

Опубликовано 27.05.202616 мин чтенияБазовый
Экран разработчика с кодом Python, с подсветкой расхода токенов и стоимости в реальном времени.
Что узнаешь
  • 5 бесплатных трекеров расхода токенов Claude Code: ccusage, claude-monitor, tokscale, ccmonitor, claude-usage-tracker
  • Что встроено в Claude Code (`/usage`, `/cost`, `/context`) и где этого не хватает
  • Как читать 4 типа input-токенов и почему один в 10 раз дешевле другого
  • Какие скрытые ловушки жгут токены незаметно: phantom-токены v2.1.100+ и новый токенизатор Opus 4.7
  • 7 дисциплин рабочего ритуала, которые превращают подписку Max за $200 в реальные $2000 токенов
Применить за 5 мин
Сэкономит 80 ч
Базовый
2просмотров

Каждый день в Telegram-канале - что нового в вайб-кодинге: инструменты, разборы, ошибки. Подпишись, чтобы быть в курсе.

Зачем отслеживать токены, если у меня подписка Pro/Max?

Подписка Claude Code на Pro или Max выглядит как «безлимит» только до первого крупного проекта. Лимиты есть: 5-часовое окно и недельный квот, оба rolling. Anthropic 13 мая 2026 временно поднял недельные лимиты на 50% до июля - и сразу стало понятно, что до этого многие в эти лимиты упирались каждую неделю (Anthropic News).

Главная разница - между подпиской и API. По расчётам практиков, подписка Max за $200 в месяц даёт примерно столько же реальных токенов, сколько $2000 на API напрямую. Та же логика что у фитнес-клуба: одни ходят каждый день, другие почти не ходят, экономика подписки выгодна тем, кто реально живёт в инструменте. Если вайб-кодишь несколько часов в день, подписка в 10-15 раз дешевле чистого API. Если только пробуешь - честнее остаться на $20 Pro.

Без трекера расхода ты не видишь главное:

  • Какая модель жрёт больше всего (Opus 4.7 даёт х5 к стоимости относительно Sonnet 4.6).
  • Какая команда вытаскивает половину дневного лимита за один прогон (обычно это read_file на большой файл).
  • Когда тёплый кеш сбрасывается и следующий запрос идёт по full price.
  • Что подписка течёт даже в idle - background-задачи Claude Code тратят обычно меньше $0.04 за сессию (Claude Code Docs - Manage costs).

Прочитай дополнительно как не сжечь лимиты Claude Code за день - там 8 правил экономии, на которые трекер ложится сверху.

Что показывает Claude Code сам: /usage, /cost и Web-консоль?

Минимум, что доступно без установки чего-либо:

bash
/usage

Команда покажет на экране:

Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

На Pro и Max планах долларовая цифра - локальная оценка. Реальный счёт от Anthropic может отличаться, потому что вычисляется на их стороне. Параллельно /usage показывает прогресс-бары лимитов плана за 5 часов и за 7 дней - это то, на что реально стоит смотреть. По наблюдениям активных пользователей Max-плана за 7 дней хардкорного использования реально расходуется около 34% недельного лимита - то есть запаса хватает на 2-3 таких недели.

Команда /context отдельная и показывает другое - сколько осталось в контекстном окне (hard-limit 200K токенов). Когда поле начинает желтеть, время делать /compact или /clear. Полная карта алиасов в официальной документации.

Веб-консоль на claude.com → Settings → Usage показывает то же самое в браузере, плюс позволяет смотреть данные по другим устройствам. Для API-юзеров есть отдельный раздел platform.claude.com/usage с фильтрами по модели, ключу, окну и экспортом в CSV. Данные приходят с задержкой до 5 минут - это нормально, не баг.

Чего не показывают встроенные средства:

  • Историю расхода по дням / неделям / месяцам с графиками.
  • Разбивку по проектам (если у тебя несколько активных).
  • Burn rate - сколько токенов в минуту прямо сейчас и через сколько кончится окно.
  • Cache read / cache creation отдельно (а это критично, у них цены различаются в 20 раз).

За этим уже идём в сторонние трекеры.

ccusage: чем стал стандарт и как поставить за 30 секунд?

Установка одной командой:

bash
npx ccusage@latest

Или, если ты уже на Bun:

bash
bunx ccusage

После первого запуска покажет таблицу за сегодня:

bash
ccusage daily --breakdown

--breakdown разбивает по моделям - видно, сколько съел Opus 4.7, сколько Sonnet 4.6, сколько Haiku. Эта одна команда чаще всего открывает глаза: половина расходов на Opus, хотя 70% задач можно было сделать на Sonnet за треть цены.

Полезные команды:

bash
ccusage daily              # за сегодня
ccusage weekly             # за неделю
ccusage monthly            # за месяц
ccusage session            # за текущую сессию
ccusage blocks             # 5-часовые биллинг-окна (важно для Max)
ccusage --since 2026-05-01 # с конкретной даты

Опции:

  • --breakdown - разбивка по моделям.
  • --json - выгрузка в JSON для своих дашбордов.
  • --offline - работает без интернета, с кешированными ценами Anthropic.

Поддерживает не только Claude Code: ещё Codex, OpenCode, Amp, Goose, Kilo, Kimi, Qwen, GitHub Copilot CLI, Gemini CLI - всё, что пишет логи в локальный JSONL. Если совмещаешь Claude с Codex или Qwen для рутины, ccusage покажет картину в одном месте.

Главная фишка для Max-плана - команда blocks. Она показывает 5-часовые окна биллинга: сколько уже истратил в текущем окне, когда оно сбрасывается, и какая средняя нагрузка. Без этого ты не знаешь, можно ли запустить тяжёлый рефакторинг сейчас или лучше подождать ресета.

Полный код и документация - github.com/ryoppippi/ccusage. Свежая версия v20.0.5 от 25 мая 2026, проект активный, 1322 коммита.

Видеть расход - это первый шаг. Второй - управлять контекстом так, чтобы он не распухал и не съедал лимит впустую. Контекст-инжиниринг - управление тем, что попадает в окно Claude до того, как ты нажал Enter. На практикуме за 3 эфира собираешь полную связку: ИИ-клон + Второй мозг + Контекст-инжиниринг - именно она превращает Claude из «помощника с галлюцинациями» в стабильный инструмент.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 9–11 июня  ·  2 000 ₽
Записаться →

Claude Code Usage Monitor: нужен ли TUI с прогресс-барами?

Установка:

bash
pip install claude-monitor

Или, если есть uv:

bash
uv tool install claude-monitor

Запуск:

bash
claude-monitor

После запуска занимает терминал, показывает экран с цветными прогресс-барами:

  • Текущее использование 5-часового окна (с раскраской: зелёный, жёлтый, красный).
  • Burn rate - токенов в минуту прямо сейчас.
  • ML P90-прогноз - когда лимит закончится при текущей скорости.
  • Refresh rate настраивается от 0.1 до 20 Гц.

В инструменте зашиты лимиты планов:

ПланТокены в 5-часовом окнеЭквивалент в долларах
Pro19 000$18
Max588 000$35
Max20220 000$140
Customпо ML P90$50 по умолчанию

Если у тебя свои лимиты (Team или Enterprise), монитор подстроится сам, наблюдая твою историю.

Когда брать: ccusage показывает «что было», claude-monitor показывает «что происходит сейчас». Если делаешь долгую автономную задачу в Plan Mode или с несколькими субагентами, монитор на втором экране даёт раннее предупреждение - «через 12 минут упрёшься в потолок, переключай модель». На обычной задаче 30-60 минут он избыточен, хватит ccusage в конце.

Репозиторий: github.com/Maciek-roboblog/Claude-Code-Usage-Monitor. PyPI: claude-monitor.

tokscale: чем интересна свежая утилита на Rust?

Установка:

bash
bunx tokscale@latest

Запуск открывает интерактивный TUI с навигацией по 6 вьюхам:

  • Overview - сводка за день / неделю / месяц.
  • Models - разбивка по моделям с input / output / cache / reasoning отдельно.
  • Daily - календарный график расхода.
  • Stats - детальная статистика по типам токенов.
  • Wrapped - твой год в обзоре (как Spotify Wrapped, но для токенов).
  • Leaderboard - сравнение с другими (опционально, через социальный профиль).

Главные отличия от ccusage:

  • Скорость. SIMD JSON-парсинг даёт ~8-10x ускорение на больших историях (миллионы запросов).
  • Reasoning tokens отдельной категорией - для моделей с extended thinking (Opus 4.7 с /effort high).
  • Pricing через LiteLLM в реальном времени с OpenRouter как fallback. Если Anthropic поменяет цены, tokscale покажет актуальные через час.
  • 2D и 3D contribution graphs - визуально показывает, в какие дни и часы вайб-кодишь.

Если у тебя нет огромной истории и не нужны фичи вроде leaderboard, tokscale избыточен. Если пользуешься Claude Code больше полугода и хочешь увидеть свой рабочий ритм в графиках - стоит попробовать. Проект свежий, кодовая база Rust + Node, активный maintainer.

Репозиторий: github.com/junhoyeo/tokscale.

Какие ещё бесплатные альтернативы есть в 2026?

ccmonitor

Watch-режим в одном экране. Цвет-кодированные прогресс-бары для 5-часового окна (зелёный до 50%, жёлтый до 80%, красный после). По умолчанию настроен на лимит $10 за окно для Pro. Запуск через npx ccmonitor. Полезен, если хочешь оставить его открытым в фоновом терминале и иногда поглядывать.

Репо: github.com/shinagaki/ccmonitor.

Claude Usage Tracker

Local-first дашборд на Chart.js, агрегирует 10+ инструментов: Claude Code, Claude Desktop, Cursor, Windsurf, Cline, Roo Code, Aider, Continue.dev, OpenClaw. Если совмещаешь Claude Code на основную работу и Cursor для UI-набросков, увидишь общий расход в одном окне. Daily costs, model breakdowns, heatmaps, monthly projections.

Репо: github.com/658jjh/claude-usage-tracker.

claude-code-otel

Для тех, кто уже работает с Grafana и Prometheus в проде. Полный observability-стек на OpenTelemetry: метрики Claude Code попадают в Prometheus, логи в Loki, дашборды в Grafana. Включается переменной окружения:

bash
export CLAUDE_CODE_ENABLE_TELEMETRY=1

Имеет смысл только в команде или если у тебя уже стоит свой Grafana - просто чтобы попробовать овчинка не стоит выделки.

Репо: github.com/ColeMurray/claude-code-otel.

Statusline-варианты

Через встроенную команду /statusline в Claude Code настраивается нижняя панель прямо в интерфейсе. Несколько готовых вариантов трекера в статус-баре:

  • ccstatusline - 30+ виджетов, можно собирать как конструктор.
  • daniel3303/ClaudeCodeStatusLine - показывает модель, токены, rate limits, git-инфо в реальном времени.
  • У самого ccusage есть beta-команда ccusage statusline для интеграции с нативной панелью Claude Code.

Statusline не заменяет полноценный трекер, но даёт постоянное boundary-awareness - видишь свежий расход прямо в Claude Code, не переключаясь в другой терминал.

Что значат 4 типа input-токенов и почему один в 10 раз дешевле?

В каждом ответе Anthropic возвращает usage-объект с 4 счётчиками:

json
{
  "usage": {
    "input_tokens": 248,
    "output_tokens": 503,
    "cache_creation_input_tokens": 5120,
    "cache_read_input_tokens": 1800
  }
}

Их математика:

МетрикаМножитель к base inputЧто значит
input_tokens1.0xЧистый ввод. Полная цена.
cache_creation_input_tokens (5 мин)1.25xСоздание кеша на 5 минут. На 25% дороже.
cache_creation_input_tokens (1 час)2.0xСоздание кеша на час. В 2 раза дороже.
cache_read_input_tokens0.1xЧтение из тёплого кеша. В 10 раз дешевле.

Цены за миллион токенов на май 2026:

МодельBase inputCache write (5м)Cache readOutput
Opus 4.7$5$6.25$0.50$25
Sonnet 4.6$3$3.75$0.30$15
Haiku 4.5$1$1.25$0.10$5

Минимальная длина для кеширования: 4096 токенов для Opus и Haiku, 1024 для Sonnet 4.6 (Anthropic Prompt Caching).

Поэтому когда ты не закрываешь сессию, Claude Code держит твой CLAUDE.md, прочитанные файлы и историю в тёплом кеше. Каждое следующее сообщение тянет их по цене 0.1x вместо 1x. «Закрою сессию и открою новую, чтобы сэкономить» - антипаттерн: свежая сессия начинается с full price, и первый ход дороже в 10 раз.

И ещё: твой собственный текст - 100-200 токенов из 100 000+ в активной сессии. «Я буду писать короче» влияет на output, но почти не влияет на расход input.

Какие скрытые ловушки жгут токены незаметно?

Phantom-токены в v2.1.100+

В мае 2026 разработчики Claude Code документально подтвердили: версии Claude Code 2.1.100 и выше отправляют на сервер в среднем на 20 000 токенов больше cache creation, чем v2.1.98 - при том, что байтов в payload меньше. Это server-side инфляция, скорее всего через User-Agent routing на стороне Anthropic.

Цифры из публичных бенчмарков (Awesome Agents):

ВерсияContent-Lengthcache_creation_tokensДельта
2.1.98169 514 байт49 726baseline
2.1.100168 536 байт69 922+20 196 токенов
2.1.101171 903 байт~72 000+22 274 токенов

Реальный эффект - около 40% overhead на каждый turn на проекте средней сложности. На Max за $100 теряешь примерно $40 эффективной стоимости в месяц. Anthropic подтвердил баг в issue #46917, на май 2026 не запатчил.

Workaround:

bash
npx claude-code@2.1.98

Проверить, что версия установилась:

bash
ls ~/.local/share/claude/versions/

Внимание: автообновления могут перезаписать. Если используешь Max и для тебя $40 в месяц - заметная сумма, отключи auto-update или держи pin на конкретной версии.

Tokenizer Opus 4.7 +35%

В Opus 4.7 Anthropic поменял токенизатор. На том же тексте новая модель теперь даёт в 1.0-1.35 раза больше токенов, чем Opus 4.6. Цены не изменились ($5/$25 за миллион), но фактический счёт за тот же объём работы вырос.

По публичному анализу byteiota - до +45% для code-heavy промптов (byteiota). Для других типов контента (JSON, не-английский) публичных бенчмарков пока нет, Anthropic в docs ограничивается формулировкой «varies by content».

Что делать:

  1. Если задача рутинная - Sonnet 4.6 на 40% дешевле и по input, и по output. Большая часть production-нагрузок там и должна жить.
  2. Если задача требует Opus - оставь его на архитектуру и сложный анализ, реализацию отдай Sonnet или Haiku.
  3. Сравни старый и новый счёт через ccusage --breakdown - увидишь конкретный эффект.

Если интересна разница между Sonnet и Opus, я разбирал её подробно в Sonnet или Opus 4.7 в Claude Code: выбор модели и /effort.

Скрытые расходы фоновых задач

Claude Code тратит небольшие суммы даже в idle. Background-задачи (суммаризация для --resume, проверка статуса) обычно укладываются в $0.04 за сессию. Не главная статья, но если десятки фоновых сессий - складывается в несколько долларов в месяц.

Как настроить рабочий ритуал за 5 минут?

Из практики людей, которые реально живут в Claude Code, складывается семь правил. Они работают вместе - убери одно, и эффект падает.

  1. Каждая задача - новое окно. Не «доделать ещё одну мелочь в открытом чате». Контекст пухнет нелинейно: на 50-м сообщении в окне модель уже начинает повторять прочитанное, путать решения и съедать токены вхолостую. Хорошее правило - до закрытия окна сохранить план или ретроспективу в файл, а потом открыть свежее.
  2. CLAUDE.md ≤ 200 строк. Claude перечитывает проектный файл перед каждым шагом. Если он раздулся до 1000 строк, каждый промпт стоит в несколько раз дороже. Всё лишнее выноси в business/, ai-clone/, skills/ - Claude берёт оттуда по ссылке, а не таскает всё в контекст. Подробнее в Как настроить CLAUDE.md правильно.
  3. Маршрутизация моделей. Архитектура и сложный анализ - Opus 4.7. Рутинная реализация, типовые правки, шаблонный код - Sonnet 4.6, Haiku или внешние модели (Qwen, DeepSeek) через Qwen Code как альтернативу Claude Code. Один практик однажды сжёг свою Max-подписку за день и собрал гибридную связку: Opus в Claude Code на план, всё остальное на Qwen и DeepSeek. Это даёт 50-70% экономии без потери качества на типовых задачах.
  4. /compact и /clear по делу. /compact - посреди задачи, когда хочешь сохранить направление, но сжать историю до сути (например, 70K токенов до 4K). /clear - когда переключаешься на новую задачу. Не путай: /clear убивает контекст и тёплый кеш, после него первый ход будет в 10 раз дороже.
  5. Субагенты на разных моделях. Если используешь субагенты Claude Code, оркестратор может быть Opus, но конкретные задачи (поиск, переименование, генерация типов) делают агенты на Sonnet или Haiku. Это переносит маршрутизацию моделей внутрь одной задачи. Учти: agent teams используют примерно в 7 раз больше токенов, чем стандартные сессии - убедись, что они того стоят (Claude Code Docs - Manage costs).
  6. План разбивай на фазы. Каждая фаза - в новое окно. Между фазами - /compact или /clear. Если делаешь это правильно, длинный проект в Claude Code обычно стоит как 2-3 средние сессии, а не как одна гигантская.
  7. Открой /usage каждое утро. 30 секунд: посмотри, сколько ушло за вчера, остаток 5-часового и недельного окна. Это базовая дисциплина, после которой ccusage и claude-monitor добавляют второй и третий уровень обзора.

Если хочешь увидеть полную картину «куда уходят токены в принципе» (9 типовых паттернов потери), почитай Куда уходят токены в Claude Code - там разобраны конкретные сценарии, а этот гайд про инструменты, которые их видят.

Источники

Трекер показывает, куда уходит счёт - это полдела. Дальше нужна дисциплина: ИИ-клон + Второй мозг + Контекст-инжиниринг. На практикуме за 3 эфира собираешь всю связку - 2 000 ₽, записи остаются у тебя.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 9–11 июня  ·  2 000 ₽
Записаться →
Была инструкция полезна?
Артемий Миллер
Автор
Артемий Миллер
Предприниматель и вайб-кодер

Артемий Миллер - предприниматель и вайб-кодер. Бывший программист, собирает продукты исключительно вместе с ИИ-агентами, без найма разработчиков.

Связанные инструкции

Связанные концепты