Голосовой ввод на компьютере бесплатно: Whisper вместо Wispr Flow

Опубликовано 09.06.202613 мин чтенияБазовый
Два компьютерных ядра: одно открыто работает, другое в премиум-корпусе — выбор между бесплатным и платным голосовым вводом.
Что узнаешь
  • Чем платный Wispr Flow отличается от бесплатного Whisper
  • Как развернуть локальный голосовой ввод одним промптом
  • Какой компьютер для этого подойдёт, а какой нет
  • Что делать, если горячая клавиша не сработала с первого раза
Применить за 15 мин
Сэкономит 4 ч
Базовый
7просмотров
Что понадобится

Я диктую почти всё: промпты для Claude, заметки, посты, ответы в мессенджерах. Голосом получается в 3-4 раза быстрее, чем руками по клавиатуре. Сам пользуюсь бесплатным локальным Whisper - он работает прямо на компьютере, и ни одно слово не уходит на чужой сервер.

Этот гайд - про то, как повторить это у себя. Без терминала и команд: ты опишешь задачу промптом, а Claude Code соберёт всё сам. А заодно разберёмся, стоит ли платить за Wispr Flow или хватит бесплатного варианта.

Каждый день в Telegram-канале - что нового в вайб-кодинге: инструменты, кейсы, ошибки. Подпишись, чтобы быть в курсе.

Зачем диктовать голосом вместо печати?

Когда работаешь с ИИ, главный расход времени - это не код, а формулировки. Ты объясняешь Claude, что нужно сделать, правишь, уточняешь. Печатать такие объяснения долго. Наговорить - быстро.

Цифры простые: голос примерно втрое быстрее печати. Это разница между «набрал абзац за две минуты» и «наговорил за тридцать секунд». За день набегают десятки сэкономленных минут.

Совет

Голос особенно выигрывает на длинных, «мыслительных» промптах - когда ты вслух проговариваешь задачу целиком, со всеми «а если» и «учти, что». Печатать такой поток мысли неудобно, а наговорить - естественно.

Плюс руки свободны. Можно ходить по комнате, смотреть в другой экран, держать чашку. Для многих это ещё и снимает барьер: говорить проще, чем садиться и формулировать письменно.

Wispr Flow, superwhisper, Whisper - в чём разница?

Здесь легко запутаться в названиях, поэтому давай по порядку.

Whisper (без буквы «р» в конце, от OpenAI) - это движок. Открытая модель, которая превращает речь в текст. Она бесплатная, с открытым кодом, и её можно запустить прямо на своём компьютере. Сама по себе это просто «мотор» без кнопок и окошек - готовые приложения используют его внутри.

Wispr Flow (с «р», wisprflow.ai) - это готовое платное приложение для Mac и Windows. Зажал клавишу, наговорил - текст появился в любом поле, куда смотрел курсор. Удобно, красиво, работает из коробки.

superwhisper (superwhisper.com) - похожее приложение для Mac, Windows и iPhone. У него есть бесплатный режим на локальных моделях, а за полную версию просят денег. Логика та же: зажал клавишу, сказал, получил текст.

Handy (github.com/cjpais/Handy) - бесплатное приложение с открытым кодом, работает офлайн на Mac, Windows и Linux. Это готовый бесплатный вариант, если не хочешь собирать всё через Claude Code (об этом дальше).

Заметка

Названия Wispr Flow и Whisper звучат почти одинаково, и это сбивает. Запомни так: Whisper - бесплатный движок внутри, Wispr Flow - платная коробка снаружи.

Разница между платным приложением и бесплатным движком - это разница между «купить готовый кофе» и «сварить самому из тех же зёрен». Результат на выходе один: твоя речь стала текстом. Вопрос только в том, готов ли ты заплатить за удобство или соберёшь то же самое бесплатно.

Платно или бесплатно: за что берут деньги Wispr Flow и superwhisper?

Вот честная картина по платным вариантам:

ВариантЦенаПлатформаЧто внутри
Wispr Flowбесплатно до 2000 слов в неделю, дальше $15/мес (или $12 при оплате за год)Mac, Windows, iPhoneсвой движок + интерфейс, словарь, команды правок (в платной)
superwhisperбесплатный локальный режим, полная версия $8.49/мес или ~$250 разово навсегдаMac, Windows, iPhoneWhisper + интерфейс, работает офлайн
Handyбесплатно, без лимитовMac, Windows, LinuxWhisper + Parakeet, открытый код, офлайн
Локальный Whisper самбесплатно, без лимитовMac, Windows, Linuxтот же движок, ставишь под себя

За что реально платишь в платных приложениях:

  • Готовый интерфейс. Поставил - работает, ничего настраивать не надо.
  • Голосовые команды. «Запятая», «новый абзац», «удали последнее» распознаются как команды редактирования (в платных версиях).
  • Синхронизация и словарь. Имена, термины, твой личный словарь подтягиваются между устройствами.

Это всё приятно. Но распознаёт речь там тот же класс моделей, что доступен бесплатно. Я лично за это не плачу - локальный Whisper делает ровно то же, что мне нужно: я говорю, появляется текст.

Совет

Если ценишь время дороже денег и не хочешь возиться даже 15 минут - возьми Wispr Flow, это нормальный выбор. Если не хочешь платить подписку каждый месяц или для тебя важна приватность (твоя речь остаётся только на твоём устройстве) - бесплатный локальный Whisper.

Голосовой ввод - мелочь, но именно из таких мелочей собирается окружение, в котором ИИ реально помогает. И сам способ установки выше - это уже метод смысло-кодинга: ты описываешь задачу словами, дальше Claude собирает всё сам. На практикуме за 3 вечера ты собираешь всю связку целиком: ИИ-клон + Второй мозг + Контекст-инжиниринг - три кита, без которых ИИ галлюцинирует.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 9–11 июня  ·  2 000 ₽
Записаться →

Как работает локальный Whisper и почему это приватно?

Облачные сервисы работают так: твой голос летит на чужой сервер, там распознаётся, текст возвращается обратно. За это берут деньги (аренда серверов) и за это надо доверять компании свою речь.

Локальный Whisper устроен иначе. Один раз скачивается модель (файл на пару сотен мегабайт или чуть больше), и дальше всё происходит у тебя:

  1. Ты зажимаешь горячую клавишу и говоришь

    Микрофон пишет звук, пока клавиша зажата.
  2. Модель на твоём компьютере распознаёт речь

    Звук превращается в текст прямо на устройстве, без интернета.
  3. Текст вставляется туда, где стоит курсор

    В чат с Claude, в документ, в браузерную строку - куда угодно.

Из этого вытекают два плюса. Первый - бесплатно: нет сервера, за который надо платить. Второй - приватно: запись и распознавание не покидают компьютер, поэтому работает даже без интернета.

Заметка

Для сравнения: облачное распознавание стоит примерно $0.006 за минуту. Если диктуешь полчаса в день, за месяц набегает несколько долларов только за расшифровку. Локальный Whisper после установки - ноль навсегда.

Whisper понимает около 99 языков, включая русский и редкие вроде казахского или татарского. У модели есть размеры - от самых лёгких (быстро, но грубее) до больших (точнее, но тяжелее). На русском Whisper чуть слабее, чем на английском, поэтому для русской речи лучше брать не самую маленькую модель - средний или крупный размер даёт заметно чище текст.

Какой компьютер потянет голосовой ввод?

Хорошая новость: голосовой ввод не требует мощного железа. Whisper работает даже без видеокарты, просто на процессоре - медленнее, но рабочее. К примеру, даже MacBook Air 2013 года с 4 ГБ памяти расшифровывает получасовую запись меньше чем за 12 минут, целиком офлайн. Дальше - по платформам.

ЖелезоКак работаетКомментарий
Mac с чипом M1/M2/M3/M4быстро, нативноидеальный вариант, ускорение через Metal
Mac на Intel (старый)работаетмедленнее, но базовые модели тянет
Windows с видеокартой NVIDIAбыстроускорение через видеокарту
Windows без видеокартыработает на процессоремедленнее, для коротких фраз норм
Старый ноут (5-10 лет)базовые модели тянетвозьми модель поменьше

На что смотреть:

  • Место на диске. Модель весит примерно от пары сотен мегабайт (лёгкая) до 1-2 ГБ (крупная). Пары гигабайт свободного места хватит.
  • Оперативная память. Чем больше, тем крупнее модель потянешь. 8 ГБ - минимум для комфорта, 16 ГБ и больше - запас.
  • Видеокарта или чип Apple. Не обязательны, но ускоряют распознавание в десятки раз. Без них Whisper считает на процессоре - просто дольше.
Заметка

Если компьютер слабый, не гонись за самой большой моделью. Возьми средний размер - распознавание будет почти таким же точным, но быстрее. Самое удобное, что подбор модели под твоё железо можно поручить Claude: он посмотрит твой компьютер и поставит оптимальную (об этом ниже).

Как поставить бесплатный голосовой ввод за 15 минут

Здесь показываю сам метод смысло-кодинга в действии: ты ничего не ставишь руками, ни одной команды в терминал. Просто копируешь два текста в чат Claude Code и жмёшь «Разрешить». Всё остальное он делает сам.

Для этого нужен установленный Claude Code (если его ещё нет - смотри гайд «Как поставить Claude Code из России»). Дальше - по шагам.

Шаг 1. Открой чат Claude Code

В левой панели редактора (VS Code) найди иконку с логотипом Claude и кликни. Справа откроется боковая панель - это чат с Claude.

Шаг 2. Поставь скилл одним промптом

Что такое скилл - это упакованный навык, который Claude применяет автоматически (подробнее - в гайде про скиллы, субагентов и MCP). Мы используем готовый открытый скилл для голосовой диктовки.

Скопируй этот текст целиком и вставь в чат Claude:

ПромптПоставить скилл голосовой диктовки
Поставь мне скилл для голосовой диктовки из репозитория
https://github.com/Mobiss11/Whisper-Skill

Сделай так, чтобы он был доступен глобально для Claude Code
(папка скиллов в моём домашнем каталоге).

Если у меня не установлен git - поставь его тоже.
Если что-то не получится - объясни простыми словами,
что мне нужно сделать.

Claude начнёт выполнять команды. Каждый раз, когда он попросит разрешение, жми «Разрешить». Если случайно отказал - напиши «повтори последнюю команду».

Шаг 3. Открой новый чат

Вверху панели Claude Code есть кнопка «+» - новый чат. Жми. Claude видит свежепоставленные скиллы только в новой сессии, в старом чате он скилл ещё «не видит».

Шаг 4. Попроси настроить голосовой ввод

Скопируй этот текст в новый чат:

ПромптНастроить голосовой ввод под своё железо
Используй скилл whisper-skill.

Сначала подтверди одной фразой, что ты его видишь
в списке доступных скиллов. Если не видишь - скажи мне,
я перезапущу окно.

Если видишь - определи моё железо (система, процессор, память),
подбери оптимальный локальный Whisper под него, поставь
всё что нужно, настрой диктовку «зажми и говори» с глобальной
горячей клавишей Ctrl+Shift+Space.

В конце прогони тест: запиши короткую фразу через клавишу
и покажи, что текст распознался.

Дальше снова жми «Разрешить» на каждый запрос. Времени уйдёт 5-30 минут, в основном на скачивание модели. Можешь спокойно сходить за чаем.

Заметка

Скилл сам определяет, какой движок Whisper лучше для твоего компьютера: для Mac с чипом Apple - нативный быстрый вариант, для Windows с видеокартой - свой, для слабого ноута - лёгкий. Тебе не нужно в этом разбираться, Claude выберет сам.

Ссылка на сам скилл, если хочешь посмотреть, что внутри: github.com/Mobiss11/Whisper-Skill. Он бесплатный, с открытым кодом, и кроме диктовки умеет ещё вшивать субтитры в видео - бонус, если снимаешь рилсы.

Совет

Не хочешь ставить через Claude Code? Возьми готовое бесплатное приложение с открытым кодом - Handy. Скачал, поставил, работает офлайн на Mac и Windows. Для Windows у него есть быстрый движок Parakeet, который шустро работает даже без видеокарты.

Как проверить, что работает (и что делать если нет)?

Когда Claude напишет, что всё готово, проверь так:

  1. Поставь курсор в любое поле ввода

    Хоть в чат Claude, хоть в документ, хоть в строку браузера.
  2. Зажми Ctrl + Shift + Space

    На Mac тоже Ctrl, не Cmd.
  3. Скажи вслух короткую фразу

    Например: «проверка голосового ввода».
  4. Отпусти клавиши

    Текст должен сам появиться там, где стоял курсор.

Если текст не появился - не страшно, это типовые вещи. Скопируй в чат Claude этот промпт, и он проведёт за руку:

ПромптПочинить голосовой ввод
Горячая клавиша Ctrl+Shift+Space не работает: я её нажимаю,
говорю, отпускаю - текст не появляется.

Проверь, что именно сломано (нет доступа к микрофону,
нет разрешения на управление компьютером, конфликт клавиши
с системой, модель не скачалась) и проведи меня по шагам
к починке.

Это закрывает почти все случаи. Самые частые причины поломки:

  • Нет доступа к микрофону. Система не дала программе слышать звук - надо разрешить в настройках приватности.
  • Нет разрешения на управление компьютером (Mac). Чтобы вставлять текст в чужие окна, нужно дать разрешение в системных настройках. Claude подскажет, где именно.
  • Конфликт горячей клавиши. Ctrl+Shift+Space уже занят другой программой - тогда выбери другое сочетание.
  • Модель не докачалась. Прервалось скачивание - Claude перезапустит загрузку.

Что делать, если ничего не встало?

Бывает, что времени разбираться нет, а диктовать хочется уже сегодня. Тогда включи системный голосовой ввод - он встроен и бесплатен:

  • Mac: «Системные настройки» → «Клавиатура» → «Диктовка» → включить. На чипах Apple распознавание идёт офлайн, прямо на устройстве.
  • Windows: нажать Win + H - откроется панель голосового ввода. Учти: она работает через интернет (распознавание идёт на серверах Microsoft), офлайн-приватности тут нет, и с русским иногда капризничает.

Работает прямо сейчас, без установки. Качество скромнее, чем у локального Whisper, особенно на длинных русских текстах. Но как способ не блокировать себя и начать писать голосом уже сегодня - вполне.

Совет

Системный вариант - это «запаска». Распробуешь голосовой ввод на нём, поймёшь, что тебе заходит - и тогда уже поставишь локальный Whisper для нормального качества.

Wispr Flow или бесплатный Whisper - что выбрать?

Короткая шпаргалка по выбору:

Тебе важноВыбор
Готовое из коробки, не жалко денегWispr Flow (Mac/Windows/iPhone) или superwhisper
Готовое и бесплатное, без терминалаHandy (Mac/Windows/Linux)
Поставить под своё железо одним промптомлокальный Whisper через скилл в Claude Code
Не платить подписку каждый месяцлюбой бесплатный вариант (Handy или Whisper)
Приватность - речь не уходит на чужой серверHandy или локальный Whisper (всё офлайн)
Начать прямо сейчас без установкисистемный ввод (Диктовка на Mac / Win+H)

Я выбрал бесплатный локальный вариант: он делает ровно то, что мне нужно, не просит денег каждый месяц и не отправляет мою речь наружу. Но если для тебя 15 минут настройки дороже подписки - платное приложение тоже честный выбор, тут нет «правильного» ответа.

Просто попробуй надиктовать первый промпт. Я сам после пары дней на голосе для длинных текстов к клавиатуре почти не возвращаюсь.

Источники

Полная схема по вайб-кодингу за вечер: ИИ-клон + Второй мозг + Контекст-инжиниринг. 3 вечера, записи остаются у тебя.

Практикум по вайб-кодингу
+Твой второй мозг
3 вечера - стек, метод, первый проект
Старт 9–11 июня  ·  2 000 ₽
Записаться →

Новые материалы - дайджестом, без спама

Гайды выходят регулярно. Подпишись, чтобы не пропускать: пришлю подборку в Telegram или на email. Раз в неделю или каждый день - выбираешь сам.

Была инструкция полезна?
Артемий Миллер
Автор
Артемий Миллер
Предприниматель и вайб-кодер

Артемий Миллер - предприниматель и вайб-кодер. Бывший программист, собирает продукты исключительно вместе с ИИ-агентами, без найма разработчиков.

Связанные инструкции

Безопасность вайб-кодинга: как не дать взломать приложение на ИИ в 2026

Приложения на ИИ взламывают из-за предсказуемых дыр: выключенный RLS, ключи в коде, нет проверки прав. Разбираю реальные утечки и даю чек-лист, как защитить свой проект - даже если ты не программист.

19 мин

Топ-10 плагинов Claude Code 2026: что ставить из 101

Поставил 25 плагинов из реестра Claude Code, оставил 10. Личный отбор с цифрами установок, цитатами авторов и антипаттернами.

14 мин

Как Boris Cherny делегирует кодинг тысячам ИИ-агентов через Claude Code в 2026

Boris Cherny из Anthropic не пишет код 8 месяцев. Утром он управляет несколькими сотнями ИИ-агентов, в день - десятками тысяч. Это новая роль человека в кодинге: оркестратор оркестраторов. Разбираю как это устроено технически (Claude Code 2.1.169, субагенты, dynamic workflows) и что значит для тех, кто строит Я-компанию.

20 мин

Вайб-кодинг по-взрослому: что такое agentic engineering в 2026

Мир говорит «вайб-кодинг мёртв, наступает agentic engineering». На самом деле вайб-кодинг просто повзрослел. Разбираю, что изменилось, и как перейти на оркестрацию агентов без хаоса.

13 мин

Связанные концепты