Ditado por voz no Windows que realmente funciona (em 2026)

O ditado nativo do Windows melhorou, mas ainda erra em português, fica offline pela metade e não tem atalho global. Aqui está como configurar ditado preciso, local e com atalho em qualquer app.

O ditado por voz no Windows 11 (Win+H) funciona, mas tem três problemas que atrapalham quem usa sério:

  1. Precisão em português médio. Nomes próprios, gírias, termos técnicos — erra com frequência e sem jeito fácil de corrigir.
  2. Dependência parcial de nuvem. Alguns modos mandam áudio pros servidores da Microsoft.
  3. Sem atalho por aplicativo. Só funciona com o popup do Windows, que toma foco e quebra o fluxo.

Se você escreve muito — e-mail, Slack, Obsidian, roteiro, código — um ditado melhor paga o custo em horas poupadas por semana. Aqui está o setup com VoxBooster em 2026.

O que muda com ditado local e neural

O VoxBooster usa modelos Whisper-derivados rodando local no seu PC. Diferenças práticas:

  • Precisão em PT-BR alta o suficiente pra não precisar editar muito. Aceita pontuação por comando (“vírgula”, “ponto final”, “nova linha”).
  • 100% local. Nada vai pra servidor. Importante pra quem dita documentos sensíveis, código proprietário ou conversa profissional.
  • Atalho global. Segura Ctrl+Shift+D em qualquer app — Outlook, VS Code, navegador, WhatsApp Web — fala, solta, o texto aparece no campo onde tá o cursor.

Setup

  1. No VoxBooster, vai em Ditado e ativa.
  2. Escolhe modelo: Rápido (latência 200 ms, precisão boa) ou Preciso (latência 500 ms, precisão alta). Pra maioria dos usos, Rápido basta.
  3. Define o idioma primário (pt-BR) e secundário opcional (en-US) — útil se você mistura inglês técnico no meio da fala.
  4. Define o atalho global. Padrão: Ctrl+Shift+D.
  5. Pronto. Abre qualquer app, posiciona o cursor, segura o atalho, fala, solta.

Modos de uso

Push-to-dictate. Segura o atalho, fala, solta. Texto aparece na hora. Esse é o modo 80% dos casos.

Toggle. Aperta o atalho uma vez pra ligar, outra pra desligar. Útil pra ditado longo (roteiro, e-mail grande) onde você não quer segurar tecla.

Sempre ligado. Reconhecimento passivo esperando um gatilho de voz (“Vox, escreva…”). Útil pra fluxo hands-free tipo driver ou com lesão por esforço repetitivo.

Comandos úteis

  • “vírgula” → ,
  • “ponto” / “ponto final” → .
  • “ponto de interrogação” → ?
  • “ponto de exclamação” → !
  • “nova linha” → quebra de linha
  • “novo parágrafo” → dois quebras de linha
  • “dois pontos” → :
  • “parênteses abrir/fechar” → ( / )
  • “apagar última palavra” → backspace da palavra
  • “apagar tudo” → limpa o buffer de ditado atual

Casos de uso que funcionam bem

  • E-mail em volume. Ditar rascunho é 3x mais rápido que digitar. Revisão de 30 segundos no final.
  • Anotação pessoal em Obsidian / Notion. Capturar ideia no ritmo que vem à cabeça, sem ser limitado pela velocidade de digitação.
  • Responder Slack / WhatsApp Web. Em resposta longa, ditar com o atalho global é mais rápido que trocar pro celular e usar o ditado do celular.
  • Mensagens de áudio em formato texto. Grava a ideia falando, recebe em texto, edita rápido. Respeita o tempo do leitor melhor que áudio.
  • Roteiro, post de blog, documentação. Primeiro rascunho ditado é 2-4x mais rápido que digitado. Edição textual depois, normal.

Casos onde ditado não ganha

  • Código. Nomes de variável, sintaxe, chave aberta/fechada — ditar código é mais lento que digitar com autocomplete. Exceção: comentário longo em função, que dita bem.
  • Tabela / planilha. Estrutura de grade não casa com fluxo de voz.
  • Ambiente barulhento. Sala com AC forte, café, coworking — a precisão cai. Melhor voltar a digitar.

Privacidade

O modelo roda local, áudio nunca sai do seu PC, nenhum log de ditado é salvo por padrão. Se você quer log — pra revisar rascunhos perdidos — ativa “Manter histórico” nas configs; os arquivos ficam em pasta local que só você acessa, criptografada pelo Windows.

Isso importa pra quem dita conversa sensível. Ditado nativo do Windows, mesmo no modo offline, compartilha telemetria do dispositivo. VoxBooster não — não tem telemetria nenhuma no módulo de ditado.

Experimente o VoxBooster — 3 dias grátis.

Clone de voz em tempo real, soundboard e efeitos — onde você já fala.

  • Sem cartão
  • ~30ms de latência
  • Discord · Teams · OBS
Experimentar 3 dias grátis