Голосовой ввод в Windows 11 (Win+H) работает, но у него три проблемы, мешающие серьёзному использованию:
- Средняя точность на русском. Собственные имена, сленг, технические термины — часто ошибается и нет простого способа исправить.
- Частичная зависимость от облака. Некоторые режимы отправляют звук на серверы Microsoft.
- Нет хоткея по приложению. Работает только с попапом Windows, который забирает фокус и ломает флоу.
Если пишешь много — почта, Slack, Obsidian, сценарии, код — лучший голосовой ввод окупается часами в неделю. Вот настройка с VoxBooster в 2026.
Что меняется с локальным, нейронным вводом
VoxBooster использует Whisper-производные модели, работающие локально на ПК. Практические отличия:
- Достаточно высокая точность на русском, чтобы не редактировать много. Принимает пунктуацию по команде (“запятая”, “точка”, “новая строка”).
- 100% локально. Ничего не уходит на сервер. Важно для тех, кто диктует чувствительные документы, проприетарный код или профессиональный разговор.
- Глобальный хоткей. Удерживай
Ctrl+Shift+Dв любом приложении — Outlook, VS Code, браузер, WhatsApp Web — говори, отпусти, текст появляется в поле, где курсор.
Настройка
- В VoxBooster заходи в Диктант и активируй.
- Выбери модель: Быстрая (задержка 200 мс, хорошая точность) или Точная (задержка 500 мс, высокая точность). Для большинства использований Быстрой хватает.
- Задай основной язык (ru-RU) и опциональный вторичный (en-US) — полезно, если смешиваешь технический английский в речь.
- Задай глобальный хоткей. По умолчанию:
Ctrl+Shift+D. - Готово. Открывай любое приложение, ставь курсор, удерживай хоткей, говори, отпускай.
Режимы использования
Push-to-dictate. Удерживай хоткей, говори, отпускай. Текст появляется сразу. Этот режим для 80% случаев.
Toggle. Нажми хоткей один раз чтобы включить, ещё раз чтобы выключить. Полезно для длинного ввода (сценарий, большое письмо), где не хочется держать клавишу.
Всегда включён. Пассивное распознавание, ожидающее голосового триггера (“Vox, напиши…”). Полезно для hands-free флоу типа за рулём или с RSI.
Полезные команды
- “запятая” →
, - “точка” →
. - “вопросительный знак” →
? - “восклицательный знак” →
! - “новая строка” → перенос строки
- “новый абзац” → два переноса
- “двоеточие” →
: - “открыть скобку / закрыть скобку” →
(/) - “удалить последнее слово” → бэкспейс слова
- “удалить всё” → очищает текущий буфер диктанта
Случаи использования, где работает хорошо
- Почта в объёме. Диктовать черновик в 3x быстрее, чем печатать. 30-секундная проверка в конце.
- Личные заметки в Obsidian / Notion. Захватывать идею в ритме, в котором она приходит в голову, не ограниченно скоростью печати.
- Ответы в Slack / WhatsApp Web. Для длинного ответа диктант с глобальным хоткеем быстрее, чем переход на телефон и использование телефонного диктанта.
- Голосовые сообщения в формате текста. Записываешь идею голосом, получаешь текст, быстрый редакт. Уважает время читателя лучше, чем аудио.
- Сценарий, пост в блог, документация. Первый черновик надиктованный в 2-4x быстрее печати. Текстовый редакт потом, обычно.
Случаи, где диктант не выигрывает
- Код. Имена переменных, синтаксис, скобки открыть/закрыть — диктовать код медленнее, чем печатать с автозаполнением. Исключение: длинный комментарий в функции, который диктуется хорошо.
- Таблица / таблицы. Сеточная структура не сочетается с потоком речи.
- Шумная среда. Комната с громким кондиционером, кафе, коворкинг — точность падает. Лучше вернуться к печати.
Приватность
Модель работает локально, звук никогда не покидает ПК, никакой лог диктанта не сохраняется по умолчанию. Если хочешь лог — для просмотра потерянных черновиков — включи “Сохранять историю” в настройках; файлы в локальной папке, к которой имеешь доступ только ты, зашифрованы Windows.
Это важно для тех, кто диктует чувствительный разговор. Встроенный диктант Windows, даже в оффлайн-режиме, делится телеметрией устройства. VoxBooster нет — в модуле диктанта вообще нет телеметрии.