Dyktowanie głosowe w Windows 11 (Win+H) działa, ale ma trzy problemy utrudniające poważne użytkowanie:
- Średnia dokładność po polsku. Nazwy własne, slang, terminy techniczne — często się myli i nie ma łatwego sposobu korekty.
- Częściowa zależność od chmury. Niektóre tryby wysyłają audio na serwery Microsoftu.
- Brak skrótu per aplikacja. Działa tylko z popupem Windows, który kradnie focus i łamie flow.
Jeśli piszesz dużo — email, Slack, Obsidian, scenariusze, kod — lepsze dyktowanie zwraca się w godzinach tygodniowo. Oto setup z VoxBoosterem w 2026.
Co zmienia lokalne, neuronowe dyktowanie
VoxBooster używa modeli pochodnych od Whisper działających lokalnie na twoim PC. Praktyczne różnice:
- Wystarczająco wysoka dokładność po polsku żeby nie trzeba było dużo edytować. Akceptuje interpunkcję komendą (“przecinek”, “kropka”, “nowa linia”).
- 100% lokalnie. Nic nie idzie na serwer. Ważne dla każdego, kto dyktuje dokumenty wrażliwe, kod własnościowy albo rozmowę profesjonalną.
- Globalny skrót. Przytrzymaj
Ctrl+Shift+Dw dowolnej aplikacji — Outlook, VS Code, przeglądarka, WhatsApp Web — mówisz, puszczasz, tekst pojawia się w polu gdzie jest kursor.
Setup
- W VoxBoosterze idź do Dyktowanie i włącz.
- Wybierz model: Szybki (latencja 200 ms, dobra dokładność) albo Precyzyjny (latencja 500 ms, wysoka dokładność). Dla większości użyć Szybki wystarczy.
- Ustaw język główny (pl-PL) i opcjonalny drugi (en-US) — przydatne jeśli mieszasz techniczny angielski w mowie.
- Ustaw globalny skrót. Domyślnie:
Ctrl+Shift+D. - Gotowe. Otwórz dowolną aplikację, ustaw kursor, przytrzymaj skrót, mów, puść.
Tryby użycia
Push-to-dictate. Przytrzymaj skrót, mów, puść. Tekst pojawia się natychmiast. To tryb dla 80% przypadków.
Toggle. Naciśnij skrót raz żeby włączyć, drugi raz żeby wyłączyć. Przydatne do długiego dyktowania (scenariusz, duży email), gdzie nie chcesz trzymać klawisza.
Zawsze włączony. Pasywne rozpoznawanie czekające na głosowy trigger (“Vox, napisz…”). Przydatne do hands-free flow typu jazda albo z RSI.
Przydatne komendy
- “przecinek” →
, - “kropka” →
. - “znak zapytania” →
? - “wykrzyknik” →
! - “nowa linia” → złamanie linii
- “nowy akapit” → dwa złamania
- “dwukropek” →
: - “otwórz nawias / zamknij nawias” →
(/) - “usuń ostatnie słowo” → backspace słowa
- “usuń wszystko” → czyści bieżący bufor dyktowania
Przypadki użycia, które działają dobrze
- Email w ilości. Dyktowanie szkicu jest 3x szybsze niż pisanie. 30-sekundowa recenzja na końcu.
- Osobista notka w Obsidian / Notion. Łapanie pomysłu w rytmie w jakim przychodzi do głowy, nie ograniczone szybkością pisania.
- Odpowiadanie na Slack / WhatsApp Web. Przy długiej odpowiedzi dyktowanie z globalnym skrótem jest szybsze niż przełączanie na telefon i używanie dyktowania telefonu.
- Wiadomości audio w formie tekstowej. Nagrywasz pomysł mówiąc, dostajesz go tekstem, szybki edit. Szanuje czas czytelnika lepiej niż audio.
- Scenariusz, post blogowy, dokumentacja. Pierwszy szkic podyktowany jest 2-4x szybszy niż napisany. Edycja tekstowa potem, normalnie.
Przypadki gdzie dyktowanie nie wygrywa
- Kod. Nazwy zmiennych, składnia, klamra otwórz/zamknij — dyktowanie kodu jest wolniejsze niż pisanie z autouzupełnianiem. Wyjątek: długi komentarz w funkcji, dyktuje się dobrze.
- Tabela / arkusz kalkulacyjny. Struktura siatki nie pasuje do przepływu głosu.
- Hałaśliwe otoczenie. Pokój z głośnym AC, kawiarnia, coworking — dokładność spada. Lepiej wrócić do pisania.
Prywatność
Model działa lokalnie, audio nigdy nie opuszcza PC, żaden log dyktowania nie jest domyślnie zapisywany. Jeśli chcesz log — do przeglądu zgubionych szkiców — włącz “Zachowaj historię” w ustawieniach; pliki są w lokalnym folderze do którego masz dostęp tylko ty, szyfrowanym przez Windows.
To ma znaczenie dla każdego, kto dyktuje wrażliwą rozmowę. Natywne dyktowanie Windows, nawet w trybie offline, udostępnia telemetrię urządzenia. VoxBooster nie — żadnej telemetrii w module dyktowania.