Каждый день в Telegram-канале - что нового в вайб-кодинге: инструменты, примеры, ошибки. Подпишись, чтобы быть в курсе.
Что такое GLM-5.2 и почему о ней говорят все?
Две недели назад в кодинг-сообществе случилась редкая вещь: открытая модель из Китая встала вровень с самым дорогим Claude. GLM-5.2 за пару дней собрала тысячи обсуждений на Reddit и Hacker News, а независимые тесты подтвердили - это не маркетинг.
Вот суть. GLM-5.2 - огромная модель: 753 миллиарда параметров, но под каждый запрос включается только малая часть (около 40 миллиардов), поэтому она быстрая и дешёвая, хоть и большая. Контекст - 1 миллион токенов, это примерно книга на 700 страниц за один заход. Сделала её Z.ai, компания из Пекина, выросшая из университета Цинхуа. Главное: модель выложена в открытый доступ под свободной лицензией MIT - бери и пользуйся, без региональных блокировок, в отличие от Claude.
Тайминг сыграл на руку. За день до выхода правительство США директивой заставило Anthropic экстренно отрубить две топовые модели.
Мы получили директиву от правительства сегодня в 17:21 по восточному времени. Чтобы соблюсти требования, мы вынуждены резко отключить Fable 5 и Mythos 5 для всех наших клиентов.
На следующий день вышла GLM-5.2 - открытая, без локов, дешёвая. Аналитики Artificial Analysis поставили её на первое место среди открытых моделей.
GLM-5.2 - ведущая открытая модель в индексе Intelligence Index v4.1. С результатом 51 она лидирует.
В общем зачёте она четвёртая - позади Fable 5, Opus 4.8 и GPT-5.5. Но среди тех, что можно скачать и крутить без разрешения разработчика, она лучшая. Для предпринимателя это значит одно: появился сильный конкурент Claude, который стоит как чашка кофе.
Догнала ли GLM-5.2 Claude по коду на самом деле?
Тут легко обмануться красивыми цифрами, поэтому смотрим на конкретные тесты. Где GLM-5.2 реально близка к Opus, а где между ними пропасть.
| Тест | GLM-5.2 | Opus 4.8 | Кто лидер |
|---|---|---|---|
| FrontierSWE (средние задачи) | 74.4 | 75.1 | почти ничья |
| MCP-Atlas (работа с инструментами) | 76.8 | 77.8 | почти ничья |
| Terminal-Bench 2.1 | 81.0 | 85.0 | Opus, но GLM первой из открытых перешла 80% |
| SWE-bench Pro | 62.1 | 69.2 | Opus, отрыв ~7 пунктов |
| NL2Repo (правки в большом проекте) | 48.9 | 69.7 | Opus, отрыв 20+ пунктов |
| SWE-Marathon (многочасовые задачи) | 13.0 | 26.0 | Opus вдвое лучше |
| AIME 2026 (математика) | 99.2 | 95.7 | GLM |
| Выдуманные ответы (чем меньше, тем лучше) | 28% | 36% | GLM |
Картина такая: на коротких и средних правках GLM почти не отстаёт. Чем длиннее и сложнее задача, тем заметнее отрыв Opus. На самых тяжёлых вещах - переписать кусок большого проекта целиком, держать многочасовую задачу без потери нити - Opus впереди в полтора-два раза.
Самое показательное - тест от команды Cline, которая дала обеим моделям починить реальный баг из своего проекта.
Обе модели починили баг, но GLM выиграл по цене и качеству кода: GLM потратил вдвое больше токенов, но обошёлся вдвое дешевле. А Opus оставил ошибки типов, которые прошли тесты, но сломали сборку в проде.
Любопытно, что на узких задачах GLM иногда обгоняет Claude. Компания по безопасности Semgrep (не разработчик GLM, незаинтересованная сторона) гоняла модели на поиске уязвимостей и нашла, что голая GLM-5.2 обходит агента на Opus. Но у них же есть отрезвляющая оговорка, которую стоит запомнить.
Это один прогон на одном датасете. Оснастка вокруг модели важнее самой модели.
Запомни эту оговорку - оснастка важнее модели. Вывод по тестам: GLM-5.2 догнала Opus на повседневном коде и отстаёт на самом сложном. Для большинства задач предпринимателя этого с запасом хватает.
Насколько GLM-5.2 дешевле Claude?
Вот ради чего вся история. Сравним цены за миллион токенов.
| Модель | Вход ($/1M) | Выход ($/1M) |
|---|---|---|
| GLM-5.2 (Z.ai напрямую) | $1.40 | $4.40 |
| GLM-5.2 (через OpenRouter) | $0.95 | $3.00 |
| Claude Opus 4.8 | $5.00 | $25.00 |
По цене разница огромная: выход у GLM дешевле в 6-8 раз. На реальном месячном счёте, по оценке агрегатора EdenAI, при нагрузке около 50 миллионов токенов в месяц выходит примерно $145 у GLM против $750 у Opus.
GLM-5.2 стоит $1.40 за миллион токенов на входе и $4.40 на выходе. Для сравнения, Claude Opus 4.5-4.8 - $5 и $25.
Но честно про подвох. GLM настроена перепроверять себя перед сдачей, поэтому тратит заметно больше токенов на ту же задачу. В тесте Cline она сожгла 1.1 миллиона токенов против 660 тысяч у Opus - и всё равно вышла вдвое дешевле ($0.41 против $0.81). А вот разработчик Michael Tefula на своей задаче получил разницу в 7.5 раза.
GLM оказался в 7.5 раза дешевле Opus 4.8 ($0.31 против $2.33). Opus был чуть более отполированным. Но GLM шёл очень близко. Обе модели отличные, я бы спокойно начал с любой.
Итого реальная экономия на конкретной задаче - где-то от 2 до 7 раз, в зависимости от того, насколько GLM придётся себя перепроверять. Меньше «в 5 раз», обещанных ценой, но всё равно деньги, которые остаются у тебя в кармане. GLM - один из способов платить меньше: про DeepSeek и другие дешёвые модели для кода у меня есть отдельные разборы.
Сэкономить на одной модели - это только начало. Куда важнее собрать систему, где Claude перестаёт галлюцинировать на любой модели. Выбор модели - движок. Машину делает то, что ты кладёшь в контекст.
На практикуме за 3 эфира собираешь полную связку: Контекст-инжиниринг + Второй мозг + ИИ-клон. Это 3 кита, без которых ИИ галлюцинирует хоть на дорогом Opus, хоть на дешёвой GLM.
Как подключить GLM-5.2 в Claude Code за 5 минут?
Самое приятное: ты не меняешь инструмент. Claude Code остаётся, меняется только то, какая модель отвечает под капотом. Подключение - это пара строк в настройках.
Путь 1 - подписка Z.ai (для ежедневной работы)
У Z.ai есть специальная подписка GLM Coding Plan, заточенная под кодинг-инструменты. Цена фиксированная, а сам адрес API говорит на родном для Claude Code языке.
Оформи подписку
Зайди на z.ai/subscribe, выбери тариф. Lite - от $18 в месяц (хватает на день плотной работы), есть тарифы дороже для тех, кто кодит целыми днями.Создай ключ
На z.ai в разделе API Keys нажми «Create a new API key» и скопируй его.Пропиши настройки
Открой файл ~/.claude/settings.json и вставь блок ниже, подставив свой ключ.Перезапусти терминал
Открой новый терминал, запусти claude, введи /status для проверки.
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "твой_ключ_z_ai",
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"API_TIMEOUT_MS": "3000000",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]"
}
}Две частые ошибки из чужих гайдов. Первая: переменная называется ANTHROPIC_AUTH_TOKEN, а не ANTHROPIC_API_KEY. Вторая: адрес для Claude Code - именно https://api.z.ai/api/anthropic (формат Anthropic). Голый /api/paas/v4 с подпиской работать не будет.
После этого Claude Code будет показывать названия «Opus» и «Sonnet», но под капотом крутить GLM - Z.ai подменяет модель на своей стороне.
Путь 2 - через OpenRouter (удобно для оплаты из России)
OpenRouter умеет говорить с Claude Code напрямую, локальный посредник не нужен.
Заведи ключ
Зайди на openrouter.ai через Google или GitHub, создай ключ вида sk-or-v1-... на странице openrouter.ai/keys.Пополни баланс
На openrouter.ai/credits закинь денег. Из России - криптой в USDC, карта не нужна (подробнее в разделе про оплату).Пропиши настройки
В ~/.claude/settings.json вставь блок ниже - в нём модель GLM уже задана.Запусти Claude Code
Открой новый терминал и запусти claude. Переключиться на лету можно командой /model.
{
"env": {
"ANTHROPIC_BASE_URL": "https://openrouter.ai/api",
"ANTHROPIC_AUTH_TOKEN": "sk-or-v1-ТВОЙ-КЛЮЧ",
"ANTHROPIC_API_KEY": "",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "z-ai/glm-5.2",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "z-ai/glm-5.2"
}
}Точный адрес модели в OpenRouter - z-ai/glm-5.2 (префикс z-ai). Базовый адрес - https://openrouter.ai/api без /v1 на конце. И поле ANTHROPIC_API_KEY оставь пустой строкой - иначе будет конфликт.
Важная оговорка: сам OpenRouter предупреждает, что идеальную работу Claude Code обещает только с моделями Anthropic. С GLM вызовы инструментов в основном работают, но иногда могут сбоить. Если упрётся - есть запасной вариант через локальный посредник claude-code-router. Для большинства задач этого не понадобится.
Запустить локально дома - честно, нереально
Раз веса открытые, напрашивается вопрос: а можно скачать и крутить бесплатно у себя? Для предпринимателя без своего сервера - нет.
GLM-5.2 на 753 миллиарда параметров требует сервер уровня восьми видеокарт H200 (это больше терабайта видеопамяти и сотни тысяч долларов железа). Даже на топовом ноутбуке она просто не запустится. Открытая лицензия тут про другое: ценовая конкуренция и отсутствие блокировок. А пользоваться всё равно через API.
Когда брать GLM-5.2, а когда оставить Claude Opus?
Не нужно выбирать одну модель навсегда. Умные вайб-кодеры держат обе и переключаются по задаче. Вот рабочее правило, собранное из отзывов практиков.
Бери GLM, когда:
- Черновая работа и итерации - накидать, посмотреть, переделать.
- Фронтенд, вёрстка, типовой код для базы данных.
- Большой объём дешёвой рутины, где не жалко переделать.
- Нужен большой контекст за копейки.
- Просто хочется платить меньше за те 80% задач, что попроще.
Оставляй Opus, когда:
- Финальный сложный архитектурный код.
- Длинная многошаговая задача, где агент не должен залипнуть.
- Критичная логика, где цена ошибки высокая.
- Нужно с первого раза - Opus требует вдвое меньше правок.
У GLM есть документированная слабость: на длинных многошаговых задачах она иногда зацикливается, повторяя одни и те же действия. Разработчики прямо отмечают, что у Claude такого нет. Поэтому для долгой автономной работы Opus надёжнее.
И тут ловушка: самый дешёвый инструмент не всегда даёт самую дешёвую работу. Если GLM трижды сделала криво и пришлось доделывать руками, дешёвая модель вышла дороже Opus, который сделал бы сразу. Считай не цену за токен, а цену за готовый результат. А если остаёшься на Claude - какую модель брать под задачу, Sonnet или Opus, я разбираю отдельно.
Можно ли пользоваться GLM-5.2 из России?
Это важный плюс для нашей аудитории. Claude Anthropic официально не поддерживает Россию и банит тех, кто заходит через VPN. С GLM ситуация мягче.
Через OpenRouter - самый низкий порог: он принимает крипту в USDC, и это ключевое. Карта не нужна, VPN не нужен. Криптовалюту покупаешь за рубли через P2P, пополняешь баланс. Есть и рублёвый посредник через систему быстрых платежей, если с криптой возиться не хочется.
Через подписку Z.ai - дешевле, но оплата сложнее: российские карты не проходят. Реальные пути - иностранная виртуальная карта (Казахстан, Армения, Грузия) или рублёвый посредник, который оплатит за тебя за комиссию. Сам сайт и API при этом открываются из России без VPN.
Если ты уже знаком с криптой - начни с OpenRouter, там меньше всего возни. Если нужна самая дешёвая фиксированная подписка под Claude Code и есть иностранная карта - бери Z.ai Coding Plan.
Какие риски и подводные камни?
Дешевизна не бывает совсем бесплатной. Что нужно знать заранее.
Приватность. Международный сервис Z.ai оформлен на сингапурскую компанию, и по API-доступу политика приличная: заявлено, что материалы не хранятся и не используются для тренировки моделей без твоего явного согласия. Но это обещания политики, а не аудированные гарантии - публичного сертификата безопасности у них нет. Материнская компания китайская, и теоретически китайское право может требовать доступ к данным. Плюс в январе 2025 Zhipu внесли в экспортный список США - это ограничивает, что компания может покупать у США, а не запрет пользоваться её моделями, но как сигнал стоит держать в голове.
Стабильность - самый ощутимый минус. В середине июня API GLM-5.2 лежал пару дней из-за жёстких ограничений на нагрузку: в пиковые часы доходило до того, что отклонялась половина запросов. Для боевой работы это значит: держи Claude как запасной вариант, не завязывайся на одну модель целиком.
Общий совет по безопасности. Он касается любого стороннего ИИ, а китайского - с двойным вниманием. Никогда не отправляй в промпт секреты и личные данные: ключи API, содержимое файла с паролями, реальные почты и телефоны клиентов, дампы боевой базы. Политики - это обещания, а не криптозамок. Подробнее про защиту проекта я разбираю в гайде про безопасность вайб-кодинга.
Стоит ли переходить на GLM-5.2?
GLM-5.2 - это сдвиг. Впервые открытая модель встала так близко к самому дорогому Claude и при этом стоит в разы дешевле и доступна из России. Для предпринимателя, который боится сжечь весь бюджет на лимитах Claude, это прямой ответ.
Но я бы предостерёг от иллюзии, что дело только в выборе модели. Вспомни оговорку Semgrep - оснастка важнее модели. Та же мысль звучит у всех практиков: вайб-кодинг ломается чаще всего по одной причине: модели не дали контекст. Я видел, как люди берут дешёвую GLM, не настраивают контекст-инжиниринг и получают мусор - а потом винят модель.
GLM-5.2 - первая открытая модель, которая ощущается уместной в кодинг-инструментах как агент общего назначения.
Так что мой совет простой. Подключи GLM сегодня, погоняй на своих задачах неделю, оставь Opus для сложного. И параллельно займись тем, что реально решает - управлением контекстом. Тогда даже дешёвая модель будет давать стабильный результат.
Источники
- Z.ai - официальный блог о GLM-5.2 (HuggingFace)
- Z.ai - карточка модели GLM-5.2
- Z.ai - цены API
- Z.ai - подключение к Claude Code (документация)
- OpenRouter - интеграция с Claude Code
- Anthropic - цены Claude
- Anthropic - заявление об отключении Fable 5 и Mythos 5
- Artificial Analysis - GLM-5.2 как ведущая открытая модель
- Cline - тест GLM-5.2 против Opus 4.8 на реальном баге
- Semgrep - GLM-5.2 в тестах на безопасность
- Michael Tefula - две недели с GLM-5.2 против Opus
- Digital Applied - тесты GLM-5.2 против Opus
- Simon Willison - разбор GLM-5.2
- Interconnects - почему GLM-5.2 это сдвиг для открытых агентов
Дешёвая модель экономит деньги. Стабильный результат даёт связка: Контекст-инжиниринг + Второй мозг + ИИ-клон. Полная схема по вайб-кодингу за вечер - 3 эфира, 2 000 ₽. Записи остаются у тебя.
Новые материалы - дайджестом, без спама
Гайды выходят регулярно. Подпишись, чтобы не пропускать: пришлю подборку в Telegram или на email. Раз в неделю или каждый день - выбираешь сам.

