El dictado por voz en Windows 11 (Win+H) funciona, pero tiene tres problemas que obstaculizan a quien lo usa en serio:
- Precisión en español media. Nombres propios, jerga, términos técnicos — falla con frecuencia y sin forma fácil de corregir.
- Dependencia parcial de la nube. Algunos modos mandan audio a los servidores de Microsoft.
- Sin atajo por aplicación. Solo funciona con el popup de Windows, que roba el foco y rompe el flujo.
Si escribes mucho — email, Slack, Obsidian, guiones, código — un dictado mejor se paga solo en horas ahorradas por semana. Aquí está el setup con VoxBooster en 2026.
Qué cambia con dictado local y neural
VoxBooster usa modelos derivados de Whisper corriendo local en tu PC. Diferencias prácticas:
- Precisión en ES suficientemente alta para no tener que editar mucho. Acepta puntuación por comando (“coma”, “punto”, “nueva línea”).
- 100% local. Nada va al servidor. Importante para quien dicta documentos sensibles, código propietario o conversación profesional.
- Atajo global. Mantén
Ctrl+Shift+Den cualquier app — Outlook, VS Code, navegador, WhatsApp Web — hablas, sueltas, el texto aparece en el campo donde está el cursor.
Setup
- En VoxBooster, ve a Dictado y activa.
- Elige modelo: Rápido (latencia 200 ms, precisión buena) o Preciso (latencia 500 ms, precisión alta). Para mayoría de usos, Rápido basta.
- Define idioma primario (es-ES o es-LATAM) y secundario opcional (en-US) — útil si mezclas inglés técnico en tu habla.
- Define el atajo global. Por defecto:
Ctrl+Shift+D. - Listo. Abre cualquier app, posiciona el cursor, mantén el atajo, habla, suelta.
Modos de uso
Push-to-dictate. Mantén el atajo, hablas, sueltas. Texto aparece al instante. Ese es el modo del 80% de los casos.
Toggle. Pulsas el atajo una vez para encender, otra para apagar. Útil para dictado largo (guión, email grande) donde no quieres tener tecla apretada.
Siempre encendido. Reconocimiento pasivo esperando un trigger de voz (“Vox, escribe…”). Útil para flujo manos libres tipo manejando o con lesión por esfuerzo repetitivo.
Comandos útiles
- “coma” →
, - “punto” / “punto final” →
. - “signo de interrogación” →
? - “signo de exclamación” →
! - “nueva línea” → salto de línea
- “nuevo párrafo” → dos saltos de línea
- “dos puntos” →
: - “abrir paréntesis / cerrar paréntesis” →
(/) - “borrar última palabra” → backspace de la palabra
- “borrar todo” → limpia el buffer de dictado actual
Casos de uso que funcionan bien
- Email en volumen. Dictar borrador es 3x más rápido que tipear. Revisión de 30 segundos al final.
- Nota personal en Obsidian / Notion. Capturar idea al ritmo que viene a la cabeza, sin estar limitado por velocidad de tipeo.
- Responder Slack / WhatsApp Web. En respuesta larga, dictar con atajo global es más rápido que cambiar al celular y usar el dictado del celular.
- Mensajes de audio en formato texto. Grabas la idea hablando, la recibes en texto, editas rápido. Respeta el tiempo del lector mejor que audio.
- Guión, post de blog, documentación. Primer borrador dictado es 2-4x más rápido que tipeado. Edición textual después, normal.
Casos donde el dictado no gana
- Código. Nombres de variable, sintaxis, llave abierta/cerrada — dictar código es más lento que tipear con autocomplete. Excepción: comentario largo en función, que dicta bien.
- Tabla / planilla. Estructura de grilla no cuadra con flujo de voz.
- Ambiente ruidoso. Sala con AC fuerte, café, coworking — la precisión cae. Mejor volver a tipear.
Privacidad
El modelo corre local, audio nunca sale de tu PC, ningún log de dictado se guarda por defecto. Si quieres log — para revisar borradores perdidos — activa “Mantener historial” en configs; los archivos quedan en carpeta local que solo tú accedes, encriptada por Windows.
Eso importa para quien dicta conversación sensible. Dictado nativo de Windows, incluso en modo offline, comparte telemetría del dispositivo. VoxBooster no — no tiene telemetría en el módulo de dictado.