Я диктую почти всё: промпты для Claude, заметки, посты, ответы в мессенджерах. Голосом получается в 3-4 раза быстрее, чем руками по клавиатуре. Сам пользуюсь бесплатным локальным Whisper - он работает прямо на компьютере, и ни одно слово не уходит на чужой сервер.

Этот гайд - про то, как повторить это у себя. Без терминала и команд: ты опишешь задачу промптом, а Claude Code соберёт всё сам. А заодно разберёмся, стоит ли платить за Wispr Flow или хватит бесплатного варианта.

Каждый день в Telegram-канале - что нового в вайб-кодинге: инструменты, кейсы, ошибки. Подпишись, чтобы быть в курсе.

TelegramКанал MAXЕсли ТГ не открывается

Зачем диктовать голосом вместо печати?

Когда работаешь с ИИ, главный расход времени - это не код, а формулировки. Ты объясняешь Claude, что нужно сделать, правишь, уточняешь. Печатать такие объяснения долго. Наговорить - быстро.

Цифры простые: голос примерно втрое быстрее печати. Это разница между «набрал абзац за две минуты» и «наговорил за тридцать секунд». За день набегают десятки сэкономленных минут.

Совет

Голос особенно выигрывает на длинных, «мыслительных» промптах - когда ты вслух проговариваешь задачу целиком, со всеми «а если» и «учти, что». Печатать такой поток мысли неудобно, а наговорить - естественно.

Плюс руки свободны. Можно ходить по комнате, смотреть в другой экран, держать чашку. Для многих это ещё и снимает барьер: говорить проще, чем садиться и формулировать письменно.

Wispr Flow, superwhisper, Whisper - в чём разница?

Здесь легко запутаться в названиях, поэтому давай по порядку.

Whisper (без буквы «р» в конце, от OpenAI) - это движок. Открытая модель, которая превращает речь в текст. Она бесплатная, с открытым кодом, и её можно запустить прямо на своём компьютере. Сама по себе это просто «мотор» без кнопок и окошек - готовые приложения используют его внутри.

Wispr Flow (с «р», wisprflow.ai) - это готовое платное приложение для Mac и Windows. Зажал клавишу, наговорил - текст появился в любом поле, куда смотрел курсор. Удобно, красиво, работает из коробки.

superwhisper (superwhisper.com) - похожее приложение для Mac, Windows и iPhone. У него есть бесплатный режим на локальных моделях, а за полную версию просят денег. Логика та же: зажал клавишу, сказал, получил текст.

Handy (github.com/cjpais/Handy) - бесплатное приложение с открытым кодом, работает офлайн на Mac, Windows и Linux. Это готовый бесплатный вариант, если не хочешь собирать всё через Claude Code (об этом дальше).

Заметка

Названия Wispr Flow и Whisper звучат почти одинаково, и это сбивает. Запомни так: Whisper - бесплатный движок внутри, Wispr Flow - платная коробка снаружи.

Разница между платным приложением и бесплатным движком - это разница между «купить готовый кофе» и «сварить самому из тех же зёрен». Результат на выходе один: твоя речь стала текстом. Вопрос только в том, готов ли ты заплатить за удобство или соберёшь то же самое бесплатно.

Платно или бесплатно: за что берут деньги Wispr Flow и superwhisper?

Вот честная картина по платным вариантам:

Вариант	Цена	Платформа	Что внутри
Wispr Flow	бесплатно до 2000 слов в неделю, дальше $15/мес (или $12 при оплате за год)	Mac, Windows, iPhone	свой движок + интерфейс, словарь, команды правок (в платной)
superwhisper	бесплатный локальный режим, полная версия $8.49/мес или ~$250 разово навсегда	Mac, Windows, iPhone	Whisper + интерфейс, работает офлайн
Handy	бесплатно, без лимитов	Mac, Windows, Linux	Whisper + Parakeet, открытый код, офлайн
Локальный Whisper сам	бесплатно, без лимитов	Mac, Windows, Linux	тот же движок, ставишь под себя

За что реально платишь в платных приложениях:

Готовый интерфейс. Поставил - работает, ничего настраивать не надо.
Голосовые команды. «Запятая», «новый абзац», «удали последнее» распознаются как команды редактирования (в платных версиях).
Синхронизация и словарь. Имена, термины, твой личный словарь подтягиваются между устройствами.

Это всё приятно. Но распознаёт речь там тот же класс моделей, что доступен бесплатно. Я лично за это не плачу - локальный Whisper делает ровно то же, что мне нужно: я говорю, появляется текст.

Совет

Если ценишь время дороже денег и не хочешь возиться даже 15 минут - возьми Wispr Flow, это нормальный выбор. Если не хочешь платить подписку каждый месяц или для тебя важна приватность (твоя речь остаётся только на твоём устройстве) - бесплатный локальный Whisper.

Голосовой ввод - мелочь, но именно из таких мелочей собирается окружение, в котором ИИ реально помогает. И сам способ установки выше - это уже метод смысло-кодинга: ты описываешь задачу словами, дальше Claude собирает всё сам. На практикуме за 3 вечера ты собираешь всю связку целиком: ИИ-клон + Второй мозг + Контекст-инжиниринг - три кита, без которых ИИ галлюцинирует.

Практикум по вайб-кодингу

+Твой второй мозг

3 вечера - инструменты, метод, первый проект

Набор открыт

Записаться →

Как работает локальный Whisper и почему это приватно?

Облачные сервисы работают так: твой голос летит на чужой сервер, там распознаётся, текст возвращается обратно. За это берут деньги (аренда серверов) и за это надо доверять компании свою речь.

Локальный Whisper устроен иначе. Один раз скачивается модель (файл на пару сотен мегабайт или чуть больше), и дальше всё происходит у тебя:

Ты зажимаешь горячую клавишу и говоришь
Микрофон пишет звук, пока клавиша зажата.
Модель на твоём компьютере распознаёт речь
Звук превращается в текст прямо на устройстве, без интернета.
Текст вставляется туда, где стоит курсор
В чат с Claude, в документ, в браузерную строку - куда угодно.

Из этого вытекают два плюса. Первый - бесплатно: нет сервера, за который надо платить. Второй - приватно: запись и распознавание не покидают компьютер, поэтому работает даже без интернета.

Заметка

Для сравнения: облачное распознавание стоит примерно $0.006 за минуту. Если диктуешь полчаса в день, за месяц набегает несколько долларов только за расшифровку. Локальный Whisper после установки - ноль навсегда.

Whisper понимает около 99 языков, включая русский и редкие вроде казахского или татарского. У модели есть размеры - от самых лёгких (быстро, но грубее) до больших (точнее, но тяжелее). На русском Whisper чуть слабее, чем на английском, поэтому для русской речи лучше брать не самую маленькую модель - средний или крупный размер даёт заметно чище текст.

Какой компьютер потянет голосовой ввод?

Хорошая новость: голосовой ввод не требует мощного железа. Whisper работает даже без видеокарты, просто на процессоре - медленнее, но рабочее. К примеру, даже MacBook Air 2013 года с 4 ГБ памяти расшифровывает получасовую запись меньше чем за 12 минут, целиком офлайн. Дальше - по платформам.

Железо	Как работает	Комментарий
Mac с чипом M1/M2/M3/M4	быстро, нативно	идеальный вариант, ускорение через Metal
Mac на Intel (старый)	работает	медленнее, но базовые модели тянет
Windows с видеокартой NVIDIA	быстро	ускорение через видеокарту
Windows без видеокарты	работает на процессоре	медленнее, для коротких фраз норм
Старый ноут (5-10 лет)	базовые модели тянет	возьми модель поменьше

На что смотреть:

Место на диске. Модель весит примерно от пары сотен мегабайт (лёгкая) до 1-2 ГБ (крупная). Пары гигабайт свободного места хватит.
Оперативная память. Чем больше, тем крупнее модель потянешь. 8 ГБ - минимум для комфорта, 16 ГБ и больше - запас.
Видеокарта или чип Apple. Не обязательны, но ускоряют распознавание в десятки раз. Без них Whisper считает на процессоре - просто дольше.

Заметка

Если компьютер слабый, не гонись за самой большой моделью. Возьми средний размер - распознавание будет почти таким же точным, но быстрее. Самое удобное, что подбор модели под твоё железо можно поручить Claude: он посмотрит твой компьютер и поставит оптимальную (об этом ниже).

Как поставить бесплатный голосовой ввод за 15 минут

Здесь показываю сам метод смысло-кодинга в действии: ты ничего не ставишь руками, ни одной команды в терминал. Просто копируешь два текста в чат Claude Code и жмёшь «Разрешить». Всё остальное он делает сам.

Для этого нужен установленный Claude Code (если его ещё нет - смотри гайд «Как поставить Claude Code из России»). Дальше - по шагам.

Шаг 1. Открой чат Claude Code

В левой панели редактора (VS Code) найди иконку с логотипом Claude и кликни. Справа откроется боковая панель - это чат с Claude.

Шаг 2. Поставь скилл одним промптом

Что такое скилл - это упакованный навык, который Claude применяет автоматически (подробнее - в гайде про скиллы, субагентов и MCP). Мы используем готовый открытый скилл для голосовой диктовки.

Внимание

Я даю проверенный скилл. Для произвольных скиллов с GitHub нужен промпт-аудит безопасности - в чужом скилле может быть кража токенов или удаление файлов. Ставь руками только то, чему доверяешь.

Скопируй этот текст целиком и вставь в чат Claude:

ПромптПоставить скилл голосовой диктовки

Поставь мне скилл для голосовой диктовки из репозитория
https://github.com/Mobiss11/Whisper-Skill

Сделай так, чтобы он был доступен глобально для Claude Code
(папка скиллов в моём домашнем каталоге).

Если у меня не установлен git - поставь его тоже.
Если что-то не получится - объясни простыми словами,
что мне нужно сделать.

Claude начнёт выполнять команды. Каждый раз, когда он попросит разрешение, жми «Разрешить». Если случайно отказал - напиши «повтори последнюю команду».

Шаг 3. Открой новый чат

Вверху панели Claude Code есть кнопка «+» - новый чат. Жми. Claude видит свежепоставленные скиллы только в новой сессии, в старом чате он скилл ещё «не видит».

Шаг 4. Попроси настроить голосовой ввод

Скопируй этот текст в новый чат:

ПромптНастроить голосовой ввод под своё железо

Используй скилл whisper-skill.

Сначала подтверди одной фразой, что ты его видишь
в списке доступных скиллов. Если не видишь - скажи мне,
я перезапущу окно.

Если видишь - определи моё железо (система, процессор, память),
подбери оптимальный локальный Whisper под него, поставь
всё что нужно, настрой диктовку «зажми и говори» с глобальной
горячей клавишей Ctrl+Shift+Space.

В конце прогони тест: запиши короткую фразу через клавишу
и покажи, что текст распознался.

Дальше снова жми «Разрешить» на каждый запрос. Времени уйдёт 5-30 минут, в основном на скачивание модели. Можешь спокойно сходить за чаем.

Заметка

Скилл сам определяет, какой движок Whisper лучше для твоего компьютера: для Mac с чипом Apple - нативный быстрый вариант, для Windows с видеокартой - свой, для слабого ноута - лёгкий. Тебе не нужно в этом разбираться, Claude выберет сам.

Ссылка на сам скилл, если хочешь посмотреть, что внутри: github.com/Mobiss11/Whisper-Skill. Он бесплатный, с открытым кодом, и кроме диктовки умеет ещё вшивать субтитры в видео - бонус, если снимаешь рилсы.

Совет

Не хочешь ставить через Claude Code? Возьми готовое бесплатное приложение с открытым кодом - Handy. Скачал, поставил, работает офлайн на Mac и Windows. Для Windows у него есть быстрый движок Parakeet, который шустро работает даже без видеокарты.

Как проверить, что работает (и что делать если нет)?

Когда Claude напишет, что всё готово, проверь так:

Поставь курсор в любое поле ввода
Хоть в чат Claude, хоть в документ, хоть в строку браузера.
Зажми Ctrl + Shift + Space
На Mac тоже Ctrl, не Cmd.
Скажи вслух короткую фразу
Например: «проверка голосового ввода».
Отпусти клавиши
Текст должен сам появиться там, где стоял курсор.

Если текст не появился - не страшно, это типовые вещи. Скопируй в чат Claude этот промпт, и он проведёт за руку:

ПромптПочинить голосовой ввод

Горячая клавиша Ctrl+Shift+Space не работает: я её нажимаю,
говорю, отпускаю - текст не появляется.

Проверь, что именно сломано (нет доступа к микрофону,
нет разрешения на управление компьютером, конфликт клавиши
с системой, модель не скачалась) и проведи меня по шагам
к починке.

Это закрывает почти все случаи. Самые частые причины поломки:

Нет доступа к микрофону. Система не дала программе слышать звук - надо разрешить в настройках приватности.
Нет разрешения на управление компьютером (Mac). Чтобы вставлять текст в чужие окна, нужно дать разрешение в системных настройках. Claude подскажет, где именно.
Конфликт горячей клавиши. Ctrl+Shift+Space уже занят другой программой - тогда выбери другое сочетание.
Модель не докачалась. Прервалось скачивание - Claude перезапустит загрузку.

Что делать, если ничего не встало?

Бывает, что времени разбираться нет, а диктовать хочется уже сегодня. Тогда включи системный голосовой ввод - он встроен и бесплатен:

Mac: «Системные настройки» → «Клавиатура» → «Диктовка» → включить. На чипах Apple распознавание идёт офлайн, прямо на устройстве.
Windows: нажать Win + H - откроется панель голосового ввода. Учти: она работает через интернет (распознавание идёт на серверах Microsoft), офлайн-приватности тут нет, и с русским иногда капризничает.

Работает прямо сейчас, без установки. Качество скромнее, чем у локального Whisper, особенно на длинных русских текстах. Но как способ не блокировать себя и начать писать голосом уже сегодня - вполне.

Совет

Системный вариант - это «запаска». Распробуешь голосовой ввод на нём, поймёшь, что тебе заходит - и тогда уже поставишь локальный Whisper для нормального качества.

Wispr Flow или бесплатный Whisper - что выбрать?

Короткая шпаргалка по выбору:

Тебе важно	Выбор
Готовое из коробки, не жалко денег	Wispr Flow (Mac/Windows/iPhone) или superwhisper
Готовое и бесплатное, без терминала	Handy (Mac/Windows/Linux)
Поставить под своё железо одним промптом	локальный Whisper через скилл в Claude Code
Не платить подписку каждый месяц	любой бесплатный вариант (Handy или Whisper)
Приватность - речь не уходит на чужой сервер	Handy или локальный Whisper (всё офлайн)
Начать прямо сейчас без установки	системный ввод (Диктовка на Mac / Win+H)

Я выбрал бесплатный локальный вариант: он делает ровно то, что мне нужно, не просит денег каждый месяц и не отправляет мою речь наружу. Но если для тебя 15 минут настройки дороже подписки - платное приложение тоже честный выбор, тут нет «правильного» ответа.

Просто попробуй надиктовать первый промпт. Я сам после пары дней на голосе для длинных текстов к клавиатуре почти не возвращаюсь.

Источники

Полная схема по вайб-кодингу за вечер: ИИ-клон + Второй мозг + Контекст-инжиниринг. 3 вечера, записи остаются у тебя.

Практикум по вайб-кодингу

+Твой второй мозг

3 вечера - инструменты, метод, первый проект

Набор открыт

Записаться →

Новые материалы - дайджестом, без спама

Гайды выходят регулярно. Подпишись, чтобы не пропускать: пришлю подборку в Telegram или на email. Раз в неделю или каждый день - выбираешь сам.

Подписаться в Telegram

Голосовой ввод на компьютере бесплатно: Whisper вместо Wispr Flow

Зачем диктовать голосом вместо печати?

Wispr Flow, superwhisper, Whisper - в чём разница?

Платно или бесплатно: за что берут деньги Wispr Flow и superwhisper?

Как работает локальный Whisper и почему это приватно?

Ты зажимаешь горячую клавишу и говоришь

Модель на твоём компьютере распознаёт речь

Текст вставляется туда, где стоит курсор

Какой компьютер потянет голосовой ввод?

Как поставить бесплатный голосовой ввод за 15 минут

Шаг 1. Открой чат Claude Code

Шаг 2. Поставь скилл одним промптом

Шаг 3. Открой новый чат

Шаг 4. Попроси настроить голосовой ввод

Как проверить, что работает (и что делать если нет)?

Поставь курсор в любое поле ввода

Зажми Ctrl + Shift + Space

Скажи вслух короткую фразу

Отпусти клавиши

Что делать, если ничего не встало?

Wispr Flow или бесплатный Whisper - что выбрать?

Источники

Новые материалы - дайджестом, без спама

Связанные инструкции

Как собрать свой сервис вместо дорогой подписки в Claude Code

Как собрать дашборд для бизнеса в Claude: живая панель метрик в 2026

Как сделать анимированный сайт в Claude Code за вечер

Как сделать дизайн сайта в Claude Code через Google Stitch в 2026

Связанные концепты

Вайб-кодинг

Второй мозг

Контекст-инжиниринг