Sprachdiktat in Windows 11 (Win+H) funktioniert, hat aber drei Probleme, die ernste Nutzung stören:
- Mittelmäßige Genauigkeit im Deutschen. Eigennamen, Slang, technische Begriffe — häufige Fehler und keine einfache Korrekturmöglichkeit.
- Teilweise Cloud-Abhängigkeit. Manche Modi senden Audio an Microsofts Server.
- Kein App-spezifischer Hotkey. Funktioniert nur mit dem Windows-Popup, das Fokus stiehlt und Flow bricht.
Wenn du viel schreibst — Mails, Slack, Obsidian, Skripte, Code — zahlt sich besseres Diktat in gesparten Stunden pro Woche aus. Hier ist das Setup mit VoxBooster 2026.
Was sich mit lokalem, neuronalem Diktat ändert
VoxBooster nutzt von Whisper abgeleitete Modelle, die lokal auf deinem PC laufen. Praktische Unterschiede:
- Hohe Genauigkeit im Deutschen — du musst nicht viel editieren. Akzeptiert Interpunktion per Befehl (“Komma”, “Punkt”, “Neue Zeile”).
- 100% lokal. Nichts geht auf Server. Wichtig für alle, die sensible Dokumente, proprietären Code oder professionelle Gespräche diktieren.
- Globaler Hotkey. Halte
Strg+Umschalt+Din einer beliebigen App — Outlook, VS Code, Browser, WhatsApp Web — sprich, lass los, der Text erscheint im Feld mit dem Cursor.
Setup
- In VoxBooster gehe zu Diktat und aktiviere.
- Wähle Modell: Schnell (200 ms Latenz, gute Genauigkeit) oder Präzise (500 ms Latenz, hohe Genauigkeit). Für die meisten Nutzungen reicht Schnell.
- Setze die primäre Sprache (de-DE) und eine optionale sekundäre (en-US) — nützlich wenn du technisches Englisch in die Rede mischst.
- Setze den globalen Hotkey. Standard:
Strg+Umschalt+D. - Fertig. Öffne eine App, platziere den Cursor, halte den Hotkey, sprich, lass los.
Nutzungsmodi
Push-to-dictate. Hotkey halten, sprechen, loslassen. Text erscheint sofort. Das ist der Modus für 80% der Fälle.
Toggle. Einmal den Hotkey drücken zum Ein-, nochmal zum Ausschalten. Nützlich für lange Diktate (Skript, große Mail), wo du keine Taste gedrückt halten willst.
Immer an. Passive Erkennung wartet auf einen Sprach-Trigger (“Vox, schreibe…”). Nützlich für Hands-free-Flow, etwa beim Fahren oder mit RSI.
Nützliche Befehle
- “Komma” →
, - “Punkt” →
. - “Fragezeichen” →
? - “Ausrufezeichen” →
! - “Neue Zeile” → Zeilenumbruch
- “Neuer Absatz” → zwei Zeilenumbrüche
- “Doppelpunkt” →
: - “Klammer auf / Klammer zu” →
(/) - “Letztes Wort löschen” → Backspace das Wort
- “Alles löschen” → leert den aktuellen Diktat-Buffer
Anwendungsfälle, die gut funktionieren
- E-Mail im Volumen. Einen Entwurf zu diktieren ist 3x schneller als tippen. 30-Sekunden-Review am Ende.
- Persönliche Notizen in Obsidian / Notion. Eine Idee im Tempo einfangen, in dem sie dir in den Kopf kommt, nicht durch Tippgeschwindigkeit limitiert.
- Slack / WhatsApp Web antworten. Bei langer Antwort ist Diktat mit globalem Hotkey schneller als aufs Handy wechseln und dort diktieren.
- Audio-Nachrichten in Textform. Nimmt die Idee sprechend auf, bekommst sie als Text, schneller Edit. Respektiert die Zeit des Lesers besser als Audio.
- Skript, Blog-Post, Dokumentation. Erster Entwurf diktiert ist 2-4x schneller als getippt. Textbearbeitung danach, normal.
Fälle, in denen Diktat nicht gewinnt
- Code. Variablennamen, Syntax, Klammer auf/zu — Code diktieren ist langsamer als mit Autocomplete tippen. Ausnahme: langer Kommentar in einer Funktion, der diktiert sich gut.
- Tabelle / Spreadsheet. Gitterstruktur passt nicht zum Sprachfluss.
- Lautes Umfeld. Raum mit lauter Klimaanlage, Café, Coworking — die Genauigkeit sinkt. Besser zurück zum Tippen.
Datenschutz
Das Modell läuft lokal, Audio verlässt nie deinen PC, kein Diktat-Log wird standardmäßig gespeichert. Wenn du ein Log willst — um verlorene Entwürfe zu reviewen — aktiviere “Verlauf behalten” in den Einstellungen; die Dateien liegen in einem lokalen Ordner, den nur du öffnen kannst, verschlüsselt durch Windows.
Das zählt für alle, die sensible Gespräche diktieren. Windows-natives Diktat teilt auch im Offline-Modus Gerätetelemetrie. VoxBooster tut das nicht — keine Telemetrie im Diktatmodul.