Я диктую почти всё: промпты для Claude, заметки, посты, ответы в мессенджерах. Голосом получается в 3-4 раза быстрее, чем руками по клавиатуре. Сам пользуюсь бесплатным локальным Whisper - он работает прямо на компьютере, и ни одно слово не уходит на чужой сервер.
Этот гайд - про то, как повторить это у себя. Без терминала и команд: ты опишешь задачу промптом, а Claude Code соберёт всё сам. А заодно разберёмся, стоит ли платить за Wispr Flow или хватит бесплатного варианта.
Каждый день в Telegram-канале - что нового в вайб-кодинге: инструменты, кейсы, ошибки. Подпишись, чтобы быть в курсе.
Зачем диктовать голосом вместо печати?
Когда работаешь с ИИ, главный расход времени - это не код, а формулировки. Ты объясняешь Claude, что нужно сделать, правишь, уточняешь. Печатать такие объяснения долго. Наговорить - быстро.
Цифры простые: голос примерно втрое быстрее печати. Это разница между «набрал абзац за две минуты» и «наговорил за тридцать секунд». За день набегают десятки сэкономленных минут.
Голос особенно выигрывает на длинных, «мыслительных» промптах - когда ты вслух проговариваешь задачу целиком, со всеми «а если» и «учти, что». Печатать такой поток мысли неудобно, а наговорить - естественно.
Плюс руки свободны. Можно ходить по комнате, смотреть в другой экран, держать чашку. Для многих это ещё и снимает барьер: говорить проще, чем садиться и формулировать письменно.
Wispr Flow, superwhisper, Whisper - в чём разница?
Здесь легко запутаться в названиях, поэтому давай по порядку.
Whisper (без буквы «р» в конце, от OpenAI) - это движок. Открытая модель, которая превращает речь в текст. Она бесплатная, с открытым кодом, и её можно запустить прямо на своём компьютере. Сама по себе это просто «мотор» без кнопок и окошек - готовые приложения используют его внутри.
Wispr Flow (с «р», wisprflow.ai) - это готовое платное приложение для Mac и Windows. Зажал клавишу, наговорил - текст появился в любом поле, куда смотрел курсор. Удобно, красиво, работает из коробки.
superwhisper (superwhisper.com) - похожее приложение для Mac, Windows и iPhone. У него есть бесплатный режим на локальных моделях, а за полную версию просят денег. Логика та же: зажал клавишу, сказал, получил текст.
Handy (github.com/cjpais/Handy) - бесплатное приложение с открытым кодом, работает офлайн на Mac, Windows и Linux. Это готовый бесплатный вариант, если не хочешь собирать всё через Claude Code (об этом дальше).
Названия Wispr Flow и Whisper звучат почти одинаково, и это сбивает. Запомни так: Whisper - бесплатный движок внутри, Wispr Flow - платная коробка снаружи.
Разница между платным приложением и бесплатным движком - это разница между «купить готовый кофе» и «сварить самому из тех же зёрен». Результат на выходе один: твоя речь стала текстом. Вопрос только в том, готов ли ты заплатить за удобство или соберёшь то же самое бесплатно.
Платно или бесплатно: за что берут деньги Wispr Flow и superwhisper?
Вот честная картина по платным вариантам:
| Вариант | Цена | Платформа | Что внутри |
|---|---|---|---|
| Wispr Flow | бесплатно до 2000 слов в неделю, дальше $15/мес (или $12 при оплате за год) | Mac, Windows, iPhone | свой движок + интерфейс, словарь, команды правок (в платной) |
| superwhisper | бесплатный локальный режим, полная версия $8.49/мес или ~$250 разово навсегда | Mac, Windows, iPhone | Whisper + интерфейс, работает офлайн |
| Handy | бесплатно, без лимитов | Mac, Windows, Linux | Whisper + Parakeet, открытый код, офлайн |
| Локальный Whisper сам | бесплатно, без лимитов | Mac, Windows, Linux | тот же движок, ставишь под себя |
За что реально платишь в платных приложениях:
- Готовый интерфейс. Поставил - работает, ничего настраивать не надо.
- Голосовые команды. «Запятая», «новый абзац», «удали последнее» распознаются как команды редактирования (в платных версиях).
- Синхронизация и словарь. Имена, термины, твой личный словарь подтягиваются между устройствами.
Это всё приятно. Но распознаёт речь там тот же класс моделей, что доступен бесплатно. Я лично за это не плачу - локальный Whisper делает ровно то же, что мне нужно: я говорю, появляется текст.
Если ценишь время дороже денег и не хочешь возиться даже 15 минут - возьми Wispr Flow, это нормальный выбор. Если не хочешь платить подписку каждый месяц или для тебя важна приватность (твоя речь остаётся только на твоём устройстве) - бесплатный локальный Whisper.
Голосовой ввод - мелочь, но именно из таких мелочей собирается окружение, в котором ИИ реально помогает. И сам способ установки выше - это уже метод смысло-кодинга: ты описываешь задачу словами, дальше Claude собирает всё сам. На практикуме за 3 вечера ты собираешь всю связку целиком: ИИ-клон + Второй мозг + Контекст-инжиниринг - три кита, без которых ИИ галлюцинирует.
Как работает локальный Whisper и почему это приватно?
Облачные сервисы работают так: твой голос летит на чужой сервер, там распознаётся, текст возвращается обратно. За это берут деньги (аренда серверов) и за это надо доверять компании свою речь.
Локальный Whisper устроен иначе. Один раз скачивается модель (файл на пару сотен мегабайт или чуть больше), и дальше всё происходит у тебя:
Ты зажимаешь горячую клавишу и говоришь
Микрофон пишет звук, пока клавиша зажата.Модель на твоём компьютере распознаёт речь
Звук превращается в текст прямо на устройстве, без интернета.Текст вставляется туда, где стоит курсор
В чат с Claude, в документ, в браузерную строку - куда угодно.
Из этого вытекают два плюса. Первый - бесплатно: нет сервера, за который надо платить. Второй - приватно: запись и распознавание не покидают компьютер, поэтому работает даже без интернета.
Для сравнения: облачное распознавание стоит примерно $0.006 за минуту. Если диктуешь полчаса в день, за месяц набегает несколько долларов только за расшифровку. Локальный Whisper после установки - ноль навсегда.
Whisper понимает около 99 языков, включая русский и редкие вроде казахского или татарского. У модели есть размеры - от самых лёгких (быстро, но грубее) до больших (точнее, но тяжелее). На русском Whisper чуть слабее, чем на английском, поэтому для русской речи лучше брать не самую маленькую модель - средний или крупный размер даёт заметно чище текст.
Какой компьютер потянет голосовой ввод?
Хорошая новость: голосовой ввод не требует мощного железа. Whisper работает даже без видеокарты, просто на процессоре - медленнее, но рабочее. К примеру, даже MacBook Air 2013 года с 4 ГБ памяти расшифровывает получасовую запись меньше чем за 12 минут, целиком офлайн. Дальше - по платформам.
| Железо | Как работает | Комментарий |
|---|---|---|
| Mac с чипом M1/M2/M3/M4 | быстро, нативно | идеальный вариант, ускорение через Metal |
| Mac на Intel (старый) | работает | медленнее, но базовые модели тянет |
| Windows с видеокартой NVIDIA | быстро | ускорение через видеокарту |
| Windows без видеокарты | работает на процессоре | медленнее, для коротких фраз норм |
| Старый ноут (5-10 лет) | базовые модели тянет | возьми модель поменьше |
На что смотреть:
- Место на диске. Модель весит примерно от пары сотен мегабайт (лёгкая) до 1-2 ГБ (крупная). Пары гигабайт свободного места хватит.
- Оперативная память. Чем больше, тем крупнее модель потянешь. 8 ГБ - минимум для комфорта, 16 ГБ и больше - запас.
- Видеокарта или чип Apple. Не обязательны, но ускоряют распознавание в десятки раз. Без них Whisper считает на процессоре - просто дольше.
Если компьютер слабый, не гонись за самой большой моделью. Возьми средний размер - распознавание будет почти таким же точным, но быстрее. Самое удобное, что подбор модели под твоё железо можно поручить Claude: он посмотрит твой компьютер и поставит оптимальную (об этом ниже).
Как поставить бесплатный голосовой ввод за 15 минут
Здесь показываю сам метод смысло-кодинга в действии: ты ничего не ставишь руками, ни одной команды в терминал. Просто копируешь два текста в чат Claude Code и жмёшь «Разрешить». Всё остальное он делает сам.
Для этого нужен установленный Claude Code (если его ещё нет - смотри гайд «Как поставить Claude Code из России»). Дальше - по шагам.
Шаг 1. Открой чат Claude Code
В левой панели редактора (VS Code) найди иконку с логотипом Claude и кликни. Справа откроется боковая панель - это чат с Claude.
Шаг 2. Поставь скилл одним промптом
Что такое скилл - это упакованный навык, который Claude применяет автоматически (подробнее - в гайде про скиллы, субагентов и MCP). Мы используем готовый открытый скилл для голосовой диктовки.
Я даю проверенный скилл. Для произвольных скиллов с GitHub нужен промпт-аудит безопасности - в чужом скилле может быть кража токенов или удаление файлов. Ставь руками только то, чему доверяешь.
Скопируй этот текст целиком и вставь в чат Claude:
Поставь мне скилл для голосовой диктовки из репозитория
https://github.com/Mobiss11/Whisper-Skill
Сделай так, чтобы он был доступен глобально для Claude Code
(папка скиллов в моём домашнем каталоге).
Если у меня не установлен git - поставь его тоже.
Если что-то не получится - объясни простыми словами,
что мне нужно сделать.Claude начнёт выполнять команды. Каждый раз, когда он попросит разрешение, жми «Разрешить». Если случайно отказал - напиши «повтори последнюю команду».
Шаг 3. Открой новый чат
Вверху панели Claude Code есть кнопка «+» - новый чат. Жми. Claude видит свежепоставленные скиллы только в новой сессии, в старом чате он скилл ещё «не видит».
Шаг 4. Попроси настроить голосовой ввод
Скопируй этот текст в новый чат:
Используй скилл whisper-skill.
Сначала подтверди одной фразой, что ты его видишь
в списке доступных скиллов. Если не видишь - скажи мне,
я перезапущу окно.
Если видишь - определи моё железо (система, процессор, память),
подбери оптимальный локальный Whisper под него, поставь
всё что нужно, настрой диктовку «зажми и говори» с глобальной
горячей клавишей Ctrl+Shift+Space.
В конце прогони тест: запиши короткую фразу через клавишу
и покажи, что текст распознался.Дальше снова жми «Разрешить» на каждый запрос. Времени уйдёт 5-30 минут, в основном на скачивание модели. Можешь спокойно сходить за чаем.
Скилл сам определяет, какой движок Whisper лучше для твоего компьютера: для Mac с чипом Apple - нативный быстрый вариант, для Windows с видеокартой - свой, для слабого ноута - лёгкий. Тебе не нужно в этом разбираться, Claude выберет сам.
Ссылка на сам скилл, если хочешь посмотреть, что внутри: github.com/Mobiss11/Whisper-Skill. Он бесплатный, с открытым кодом, и кроме диктовки умеет ещё вшивать субтитры в видео - бонус, если снимаешь рилсы.
Не хочешь ставить через Claude Code? Возьми готовое бесплатное приложение с открытым кодом - Handy. Скачал, поставил, работает офлайн на Mac и Windows. Для Windows у него есть быстрый движок Parakeet, который шустро работает даже без видеокарты.
Как проверить, что работает (и что делать если нет)?
Когда Claude напишет, что всё готово, проверь так:
Поставь курсор в любое поле ввода
Хоть в чат Claude, хоть в документ, хоть в строку браузера.Зажми Ctrl + Shift + Space
На Mac тоже Ctrl, не Cmd.Скажи вслух короткую фразу
Например: «проверка голосового ввода».Отпусти клавиши
Текст должен сам появиться там, где стоял курсор.
Если текст не появился - не страшно, это типовые вещи. Скопируй в чат Claude этот промпт, и он проведёт за руку:
Горячая клавиша Ctrl+Shift+Space не работает: я её нажимаю,
говорю, отпускаю - текст не появляется.
Проверь, что именно сломано (нет доступа к микрофону,
нет разрешения на управление компьютером, конфликт клавиши
с системой, модель не скачалась) и проведи меня по шагам
к починке.Это закрывает почти все случаи. Самые частые причины поломки:
- Нет доступа к микрофону. Система не дала программе слышать звук - надо разрешить в настройках приватности.
- Нет разрешения на управление компьютером (Mac). Чтобы вставлять текст в чужие окна, нужно дать разрешение в системных настройках. Claude подскажет, где именно.
- Конфликт горячей клавиши. Ctrl+Shift+Space уже занят другой программой - тогда выбери другое сочетание.
- Модель не докачалась. Прервалось скачивание - Claude перезапустит загрузку.
Что делать, если ничего не встало?
Бывает, что времени разбираться нет, а диктовать хочется уже сегодня. Тогда включи системный голосовой ввод - он встроен и бесплатен:
- Mac: «Системные настройки» → «Клавиатура» → «Диктовка» → включить. На чипах Apple распознавание идёт офлайн, прямо на устройстве.
- Windows: нажать
Win + H- откроется панель голосового ввода. Учти: она работает через интернет (распознавание идёт на серверах Microsoft), офлайн-приватности тут нет, и с русским иногда капризничает.
Работает прямо сейчас, без установки. Качество скромнее, чем у локального Whisper, особенно на длинных русских текстах. Но как способ не блокировать себя и начать писать голосом уже сегодня - вполне.
Системный вариант - это «запаска». Распробуешь голосовой ввод на нём, поймёшь, что тебе заходит - и тогда уже поставишь локальный Whisper для нормального качества.
Wispr Flow или бесплатный Whisper - что выбрать?
Короткая шпаргалка по выбору:
| Тебе важно | Выбор |
|---|---|
| Готовое из коробки, не жалко денег | Wispr Flow (Mac/Windows/iPhone) или superwhisper |
| Готовое и бесплатное, без терминала | Handy (Mac/Windows/Linux) |
| Поставить под своё железо одним промптом | локальный Whisper через скилл в Claude Code |
| Не платить подписку каждый месяц | любой бесплатный вариант (Handy или Whisper) |
| Приватность - речь не уходит на чужой сервер | Handy или локальный Whisper (всё офлайн) |
| Начать прямо сейчас без установки | системный ввод (Диктовка на Mac / Win+H) |
Я выбрал бесплатный локальный вариант: он делает ровно то, что мне нужно, не просит денег каждый месяц и не отправляет мою речь наружу. Но если для тебя 15 минут настройки дороже подписки - платное приложение тоже честный выбор, тут нет «правильного» ответа.
Просто попробуй надиктовать первый промпт. Я сам после пары дней на голосе для длинных текстов к клавиатуре почти не возвращаюсь.
Источники
- Whisper - OpenAI (GitHub)
- Whisper-Skill - бесплатный локальный расшифровщик (GitHub)
- Wispr Flow - официальный сайт
- superwhisper - официальный сайт
- faster-whisper - быстрый движок (GitHub)
- whisper.cpp - минималистичный движок (GitHub)
- mlx-whisper - для чипов Apple (GitHub)
- Диктовка на Mac - поддержка Apple
- Голосовой ввод в Windows (Win+H) - поддержка Microsoft
- Как поставить Claude Code из России
- Скиллы, субагенты, MCP и плагины в Claude Code
- Claude Code с телефона: удалённое управление компьютером
Полная схема по вайб-кодингу за вечер: ИИ-клон + Второй мозг + Контекст-инжиниринг. 3 вечера, записи остаются у тебя.
Новые материалы - дайджестом, без спама
Гайды выходят регулярно. Подпишись, чтобы не пропускать: пришлю подборку в Telegram или на email. Раз в неделю или каждый день - выбираешь сам.

