Gravar audiobook em casa é uma das poucas produções de áudio onde a qualidade técnica é medida objetivamente. A ACX (plataforma de audiobooks da Audible/Amazon) tem especificações publicadas: nível de ruído de fundo máximo, faixa de loudness aceitável, formato de arquivo. Ou você passa nas specs, ou o arquivo é rejeitado na submissão.

A boa notícia: essas specs são atingíveis com setup doméstico. A parte complicada não é a acústica — é gravar 6, 8, 10 horas de conteúdo ao longo de dias ou semanas e manter o timbre consistente do capítulo 1 ao capítulo 40.

É aqui que o voice changer entra, mas vamos chegar nele depois de montar a base.

O que a ACX exige de verdade

As especificações técnicas da ACX que mais reprovam envios são:

Loudness: entre -23 e -18 LUFS RMS, pico máximo em -3 dBFS
Ruído de fundo: abaixo de -60 dBRMS no silêncio entre falas
Formato: MP3 192 kbps ou WAV 44.1kHz/16bit, mono ou stereo

O ruído de fundo é o que reprova mais gente. Não é o microfone ruim — é o compressor de ar que você nem ouve mais depois de uma hora gravando, ou a geladeira que liga exatamente quando você tá no meio do parágrafo mais bonito do capítulo.

Setup mínimo que funciona

Microfone: dinâmico, não condensador. O Samson Q2U (USB + XLR, menos de R$400) é o ponto de entrada que a maioria dos autores independentes usa. Se você já tem budget, o Shure MV7 resolve. Microfone dinâmico tem padrão cardioide que rejeita ruído lateral e traseiro — pra ambiente doméstico, isso vale mais que a “qualidade superior” de um condensador de diafragma grande em ambiente sem tratamento.

Tratamento acústico: você não precisa de cabine. Precisa de um quarto com:

Superfícies moles (roupas, cortinas, carpete, colchão próximo)
Sem superfícies paralelas grandes sem nada (parede + chão = reverb que vai aparecer na gravação)

O truque mais barato: grava dentro de um armário cheio de roupas. Parece brincadeira, mas funciona melhor que muita solução cara.

Interface de áudio: se o microfone tem saída XLR, usa uma interface simples (Focusrite Scarlett Solo). Se é USB direto, tá ok — mas evita cabo longo sem ferrite pra reduzir ruído de linha.

A consistência de timbre é o problema real

Aqui tá o desafio que os guias técnicos geralmente ignoram.

Você começa o audiobook em março, descansado, voz cheia. Grava dois capítulos por semana. Em maio, passou uma gripe. Em junho, mudou a estação, o ar ficou mais seco. Em agosto, você finalmente chegou no capítulo 38 — e sua voz soa diferente do capítulo 1.

O ouvinte que escuta o audiobook de corrido vai notar. Não vai conseguir articular o problema, mas vai sentir que “a voz mudou” no meio do livro.

O VoxBooster resolve isso como camada de padronização: você grava sua voz crua normalmente, e depois processa cada sessão com o mesmo perfil de clone. O modelo preserva sua performance (ritmo, emoção, intenção) e normaliza o timbre pro mesmo ponto de referência. O capítulo gravado no dia ruim vai soar consistente com o capítulo gravado no pico da forma.

O fluxo: grava o capítulo, exporta, arrasta pro VoxBooster no modo de processamento offline, aplica o perfil escolhido. Sai um arquivo com timbre padronizado. Só então faz o tratamento de loudness e ruído.

Fluxo de gravação por capítulo

Aquece a voz antes de gravar — 5 minutos de leitura em voz alta antes de apertar record faz diferença audível no primeiro parágrafo
Grava capítulo inteiro, não parágrafo por parágrafo — interrupções frequentes criam inconsistência de performance; se errar, diz “ERRO” em voz alta e repete da frase, não corta na hora
Deixa 2 segundos de silêncio antes e depois de cada take — vai precisar pra medir o nível de ruído de fundo na edição
Exporta em WAV antes de editar — nunca edita o MP3 final; mantém o WAV como arquivo mestre
Processa no VoxBooster com o perfil de voz padronizado
Edita no Audacity ou Reaper — remove erros marcados, limpa respirações pesadas, aplica noise reduction se necessário
Normaliza pra -19 LUFS (centro da faixa ACX) com limiter em -3 dBFS
Mede o ruído de fundo — seleciona 1 segundo de silêncio e checa o RMS; se tiver acima de -60 dB, aplica noise gate ou noise reduction antes de normalizar

Sobre narrar ficção vs. não-ficção

Para não-ficção técnica, voz mais neutra e consistente funciona melhor — o ouvinte quer clareza, não performance dramática.

Para ficção, você tem mais latitude. Se o livro tem diálogos, vale usar perfis de voz ligeiramente diferentes pra personagens principais — não ao ponto de virar audiodrama, mas o suficiente pra o ouvinte diferenciar o narrador do protagonista quando ele fala em primeira pessoa.

O VoxBooster permite salvar perfis separados: “narrador padrão” como base e “protagonista” com uma leve variação de timbre. Isso adiciona uma camada de produção que audiobooks independentes raramente têm.

Antes de submeter pra ACX

Roda o arquivo final no ACX Check ou no plugin gratuito ACX Check pro Audacity. Ele mede loudness, pico e ruído de fundo e diz exatamente o que tá fora das specs. Não submete sem passar nesse check — a rejeição atrasa semanas e o processo de re-submissão é burocrático.

Gravar audiobook em casa é lento, exige disciplina e consistência de processo. Mas é completamente viável, e a plataforma de distribuição é a mesma que os grandes estúdios usam.

Como gravar audiobook em casa com qualidade ACX — sem estúdio, sem gastar fortuna