GLM-5.2 догнала Claude Opus 4.8: открытая модель дешевле в 5 раз

Опубликовано 27.06.202614 мин чтенияСредний
Два терминала показывают идентичный код: слева PREMIUM с высокой ценой, справа OPEN SOURCE с копеечной стоимостью.
Что узнаешь
  • Чем GLM-5.2 реально догнала Opus 4.8, а где всё ещё отстаёт
  • Как подключить GLM в Claude Code за 5 минут (Z.ai и OpenRouter)
  • Когда брать дешёвую модель, а когда оставить Opus
  • Как платить и пользоваться из России без карты
Применить за 10 мин
Сэкономит 5 ч
Средний
8просмотров
Что понадобится

Каждый день в Telegram-канале - что нового в вайб-кодинге: инструменты, примеры, ошибки. Подпишись, чтобы быть в курсе.

Что такое GLM-5.2 и почему о ней говорят все?

Две недели назад в кодинг-сообществе случилась редкая вещь: открытая модель из Китая встала вровень с самым дорогим Claude. GLM-5.2 за пару дней собрала тысячи обсуждений на Reddit и Hacker News, а независимые тесты подтвердили - это не маркетинг.

Вот суть. GLM-5.2 - огромная модель: 753 миллиарда параметров, но под каждый запрос включается только малая часть (около 40 миллиардов), поэтому она быстрая и дешёвая, хоть и большая. Контекст - 1 миллион токенов, это примерно книга на 700 страниц за один заход. Сделала её Z.ai, компания из Пекина, выросшая из университета Цинхуа. Главное: модель выложена в открытый доступ под свободной лицензией MIT - бери и пользуйся, без региональных блокировок, в отличие от Claude.

Тайминг сыграл на руку. За день до выхода правительство США директивой заставило Anthropic экстренно отрубить две топовые модели.

Мы получили директиву от правительства сегодня в 17:21 по восточному времени. Чтобы соблюсти требования, мы вынуждены резко отключить Fable 5 и Mythos 5 для всех наших клиентов.

- Anthropic, https://www.anthropic.com/news/fable-mythos-access

На следующий день вышла GLM-5.2 - открытая, без локов, дешёвая. Аналитики Artificial Analysis поставили её на первое место среди открытых моделей.

GLM-5.2 - ведущая открытая модель в индексе Intelligence Index v4.1. С результатом 51 она лидирует.

- Artificial Analysis, https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index

В общем зачёте она четвёртая - позади Fable 5, Opus 4.8 и GPT-5.5. Но среди тех, что можно скачать и крутить без разрешения разработчика, она лучшая. Для предпринимателя это значит одно: появился сильный конкурент Claude, который стоит как чашка кофе.

Догнала ли GLM-5.2 Claude по коду на самом деле?

Тут легко обмануться красивыми цифрами, поэтому смотрим на конкретные тесты. Где GLM-5.2 реально близка к Opus, а где между ними пропасть.

ТестGLM-5.2Opus 4.8Кто лидер
FrontierSWE (средние задачи)74.475.1почти ничья
MCP-Atlas (работа с инструментами)76.877.8почти ничья
Terminal-Bench 2.181.085.0Opus, но GLM первой из открытых перешла 80%
SWE-bench Pro62.169.2Opus, отрыв ~7 пунктов
NL2Repo (правки в большом проекте)48.969.7Opus, отрыв 20+ пунктов
SWE-Marathon (многочасовые задачи)13.026.0Opus вдвое лучше
AIME 2026 (математика)99.295.7GLM
Выдуманные ответы (чем меньше, тем лучше)28%36%GLM

Картина такая: на коротких и средних правках GLM почти не отстаёт. Чем длиннее и сложнее задача, тем заметнее отрыв Opus. На самых тяжёлых вещах - переписать кусок большого проекта целиком, держать многочасовую задачу без потери нити - Opus впереди в полтора-два раза.

Самое показательное - тест от команды Cline, которая дала обеим моделям починить реальный баг из своего проекта.

Обе модели починили баг, но GLM выиграл по цене и качеству кода: GLM потратил вдвое больше токенов, но обошёлся вдвое дешевле. А Opus оставил ошибки типов, которые прошли тесты, но сломали сборку в проде.

- Cline, https://x.com/cline/status/2069171146994729078

Любопытно, что на узких задачах GLM иногда обгоняет Claude. Компания по безопасности Semgrep (не разработчик GLM, незаинтересованная сторона) гоняла модели на поиске уязвимостей и нашла, что голая GLM-5.2 обходит агента на Opus. Но у них же есть отрезвляющая оговорка, которую стоит запомнить.

Это один прогон на одном датасете. Оснастка вокруг модели важнее самой модели.

- Semgrep, https://semgrep.dev/blog/2026/we-have-mythos-at-home-glm-52-beats-claude-in-our-cyber-benchmarks/

Запомни эту оговорку - оснастка важнее модели. Вывод по тестам: GLM-5.2 догнала Opus на повседневном коде и отстаёт на самом сложном. Для большинства задач предпринимателя этого с запасом хватает.

Насколько GLM-5.2 дешевле Claude?

Вот ради чего вся история. Сравним цены за миллион токенов.

МодельВход ($/1M)Выход ($/1M)
GLM-5.2 (Z.ai напрямую)$1.40$4.40
GLM-5.2 (через OpenRouter)$0.95$3.00
Claude Opus 4.8$5.00$25.00

По цене разница огромная: выход у GLM дешевле в 6-8 раз. На реальном месячном счёте, по оценке агрегатора EdenAI, при нагрузке около 50 миллионов токенов в месяц выходит примерно $145 у GLM против $750 у Opus.

GLM-5.2 стоит $1.40 за миллион токенов на входе и $4.40 на выходе. Для сравнения, Claude Opus 4.5-4.8 - $5 и $25.

- Simon Willison, https://simonwillison.net/2026/Jun/17/glm-52/

Но честно про подвох. GLM настроена перепроверять себя перед сдачей, поэтому тратит заметно больше токенов на ту же задачу. В тесте Cline она сожгла 1.1 миллиона токенов против 660 тысяч у Opus - и всё равно вышла вдвое дешевле ($0.41 против $0.81). А вот разработчик Michael Tefula на своей задаче получил разницу в 7.5 раза.

GLM оказался в 7.5 раза дешевле Opus 4.8 ($0.31 против $2.33). Opus был чуть более отполированным. Но GLM шёл очень близко. Обе модели отличные, я бы спокойно начал с любой.

- Michael Tefula, https://www.michaeltefula.com/blog/glm-5-2-vs-opus-4-8/

Итого реальная экономия на конкретной задаче - где-то от 2 до 7 раз, в зависимости от того, насколько GLM придётся себя перепроверять. Меньше «в 5 раз», обещанных ценой, но всё равно деньги, которые остаются у тебя в кармане. GLM - один из способов платить меньше: про DeepSeek и другие дешёвые модели для кода у меня есть отдельные разборы.

Сэкономить на одной модели - это только начало. Куда важнее собрать систему, где Claude перестаёт галлюцинировать на любой модели. Выбор модели - движок. Машину делает то, что ты кладёшь в контекст.

На практикуме за 3 эфира собираешь полную связку: Контекст-инжиниринг + Второй мозг + ИИ-клон. Это 3 кита, без которых ИИ галлюцинирует хоть на дорогом Opus, хоть на дешёвой GLM.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 14–16 июля  ·  2 000 ₽
Записаться →

Как подключить GLM-5.2 в Claude Code за 5 минут?

Самое приятное: ты не меняешь инструмент. Claude Code остаётся, меняется только то, какая модель отвечает под капотом. Подключение - это пара строк в настройках.

Путь 1 - подписка Z.ai (для ежедневной работы)

У Z.ai есть специальная подписка GLM Coding Plan, заточенная под кодинг-инструменты. Цена фиксированная, а сам адрес API говорит на родном для Claude Code языке.

  1. Оформи подписку

    Зайди на z.ai/subscribe, выбери тариф. Lite - от $18 в месяц (хватает на день плотной работы), есть тарифы дороже для тех, кто кодит целыми днями.
  2. Создай ключ

    На z.ai в разделе API Keys нажми «Create a new API key» и скопируй его.
  3. Пропиши настройки

    Открой файл ~/.claude/settings.json и вставь блок ниже, подставив свой ключ.
  4. Перезапусти терминал

    Открой новый терминал, запусти claude, введи /status для проверки.
json
{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "твой_ключ_z_ai",
    "ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
    "API_TIMEOUT_MS": "3000000",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]"
  }
}

После этого Claude Code будет показывать названия «Opus» и «Sonnet», но под капотом крутить GLM - Z.ai подменяет модель на своей стороне.

Путь 2 - через OpenRouter (удобно для оплаты из России)

OpenRouter умеет говорить с Claude Code напрямую, локальный посредник не нужен.

  1. Заведи ключ

    Зайди на openrouter.ai через Google или GitHub, создай ключ вида sk-or-v1-... на странице openrouter.ai/keys.
  2. Пополни баланс

    На openrouter.ai/credits закинь денег. Из России - криптой в USDC, карта не нужна (подробнее в разделе про оплату).
  3. Пропиши настройки

    В ~/.claude/settings.json вставь блок ниже - в нём модель GLM уже задана.
  4. Запусти Claude Code

    Открой новый терминал и запусти claude. Переключиться на лету можно командой /model.
json
{
  "env": {
    "ANTHROPIC_BASE_URL": "https://openrouter.ai/api",
    "ANTHROPIC_AUTH_TOKEN": "sk-or-v1-ТВОЙ-КЛЮЧ",
    "ANTHROPIC_API_KEY": "",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "z-ai/glm-5.2",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "z-ai/glm-5.2"
  }
}
Заметка

Точный адрес модели в OpenRouter - z-ai/glm-5.2 (префикс z-ai). Базовый адрес - https://openrouter.ai/api без /v1 на конце. И поле ANTHROPIC_API_KEY оставь пустой строкой - иначе будет конфликт.

Важная оговорка: сам OpenRouter предупреждает, что идеальную работу Claude Code обещает только с моделями Anthropic. С GLM вызовы инструментов в основном работают, но иногда могут сбоить. Если упрётся - есть запасной вариант через локальный посредник claude-code-router. Для большинства задач этого не понадобится.

Запустить локально дома - честно, нереально

Раз веса открытые, напрашивается вопрос: а можно скачать и крутить бесплатно у себя? Для предпринимателя без своего сервера - нет.

GLM-5.2 на 753 миллиарда параметров требует сервер уровня восьми видеокарт H200 (это больше терабайта видеопамяти и сотни тысяч долларов железа). Даже на топовом ноутбуке она просто не запустится. Открытая лицензия тут про другое: ценовая конкуренция и отсутствие блокировок. А пользоваться всё равно через API.

Когда брать GLM-5.2, а когда оставить Claude Opus?

Не нужно выбирать одну модель навсегда. Умные вайб-кодеры держат обе и переключаются по задаче. Вот рабочее правило, собранное из отзывов практиков.

Бери GLM, когда:

  1. Черновая работа и итерации - накидать, посмотреть, переделать.
  2. Фронтенд, вёрстка, типовой код для базы данных.
  3. Большой объём дешёвой рутины, где не жалко переделать.
  4. Нужен большой контекст за копейки.
  5. Просто хочется платить меньше за те 80% задач, что попроще.

Оставляй Opus, когда:

  1. Финальный сложный архитектурный код.
  2. Длинная многошаговая задача, где агент не должен залипнуть.
  3. Критичная логика, где цена ошибки высокая.
  4. Нужно с первого раза - Opus требует вдвое меньше правок.

У GLM есть документированная слабость: на длинных многошаговых задачах она иногда зацикливается, повторяя одни и те же действия. Разработчики прямо отмечают, что у Claude такого нет. Поэтому для долгой автономной работы Opus надёжнее.

И тут ловушка: самый дешёвый инструмент не всегда даёт самую дешёвую работу. Если GLM трижды сделала криво и пришлось доделывать руками, дешёвая модель вышла дороже Opus, который сделал бы сразу. Считай не цену за токен, а цену за готовый результат. А если остаёшься на Claude - какую модель брать под задачу, Sonnet или Opus, я разбираю отдельно.

Можно ли пользоваться GLM-5.2 из России?

Это важный плюс для нашей аудитории. Claude Anthropic официально не поддерживает Россию и банит тех, кто заходит через VPN. С GLM ситуация мягче.

Через OpenRouter - самый низкий порог: он принимает крипту в USDC, и это ключевое. Карта не нужна, VPN не нужен. Криптовалюту покупаешь за рубли через P2P, пополняешь баланс. Есть и рублёвый посредник через систему быстрых платежей, если с криптой возиться не хочется.

Через подписку Z.ai - дешевле, но оплата сложнее: российские карты не проходят. Реальные пути - иностранная виртуальная карта (Казахстан, Армения, Грузия) или рублёвый посредник, который оплатит за тебя за комиссию. Сам сайт и API при этом открываются из России без VPN.

Совет

Если ты уже знаком с криптой - начни с OpenRouter, там меньше всего возни. Если нужна самая дешёвая фиксированная подписка под Claude Code и есть иностранная карта - бери Z.ai Coding Plan.

Какие риски и подводные камни?

Дешевизна не бывает совсем бесплатной. Что нужно знать заранее.

Приватность. Международный сервис Z.ai оформлен на сингапурскую компанию, и по API-доступу политика приличная: заявлено, что материалы не хранятся и не используются для тренировки моделей без твоего явного согласия. Но это обещания политики, а не аудированные гарантии - публичного сертификата безопасности у них нет. Материнская компания китайская, и теоретически китайское право может требовать доступ к данным. Плюс в январе 2025 Zhipu внесли в экспортный список США - это ограничивает, что компания может покупать у США, а не запрет пользоваться её моделями, но как сигнал стоит держать в голове.

Стабильность - самый ощутимый минус. В середине июня API GLM-5.2 лежал пару дней из-за жёстких ограничений на нагрузку: в пиковые часы доходило до того, что отклонялась половина запросов. Для боевой работы это значит: держи Claude как запасной вариант, не завязывайся на одну модель целиком.

Общий совет по безопасности. Он касается любого стороннего ИИ, а китайского - с двойным вниманием. Никогда не отправляй в промпт секреты и личные данные: ключи API, содержимое файла с паролями, реальные почты и телефоны клиентов, дампы боевой базы. Политики - это обещания, а не криптозамок. Подробнее про защиту проекта я разбираю в гайде про безопасность вайб-кодинга.

Стоит ли переходить на GLM-5.2?

GLM-5.2 - это сдвиг. Впервые открытая модель встала так близко к самому дорогому Claude и при этом стоит в разы дешевле и доступна из России. Для предпринимателя, который боится сжечь весь бюджет на лимитах Claude, это прямой ответ.

Но я бы предостерёг от иллюзии, что дело только в выборе модели. Вспомни оговорку Semgrep - оснастка важнее модели. Та же мысль звучит у всех практиков: вайб-кодинг ломается чаще всего по одной причине: модели не дали контекст. Я видел, как люди берут дешёвую GLM, не настраивают контекст-инжиниринг и получают мусор - а потом винят модель.

GLM-5.2 - первая открытая модель, которая ощущается уместной в кодинг-инструментах как агент общего назначения.

- Interconnects (Nathan Lambert), https://www.interconnects.ai/p/glm-52-is-the-step-change-for-open

Так что мой совет простой. Подключи GLM сегодня, погоняй на своих задачах неделю, оставь Opus для сложного. И параллельно займись тем, что реально решает - управлением контекстом. Тогда даже дешёвая модель будет давать стабильный результат.

Источники

Дешёвая модель экономит деньги. Стабильный результат даёт связка: Контекст-инжиниринг + Второй мозг + ИИ-клон. Полная схема по вайб-кодингу за вечер - 3 эфира, 2 000 ₽. Записи остаются у тебя.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 14–16 июля  ·  2 000 ₽
Записаться →

Новые материалы - дайджестом, без спама

Гайды выходят регулярно. Подпишись, чтобы не пропускать: пришлю подборку в Telegram или на email. Раз в неделю или каждый день - выбираешь сам.

Была инструкция полезна?
Артемий Миллер
Автор
Артемий Миллер
Предприниматель и вайб-кодер

Артемий Миллер - предприниматель и вайб-кодер. Бывший программист, собирает продукты исключительно вместе с ИИ-агентами, без найма разработчиков.

Связанные концепты