Gravar audiobook em casa é uma das poucas produções de áudio onde a qualidade técnica é medida objetivamente. A ACX (plataforma de audiobooks da Audible/Amazon) tem especificações publicadas: nível de ruído de fundo máximo, faixa de loudness aceitável, formato de arquivo. Ou você passa nas specs, ou o arquivo é rejeitado na submissão.
A boa notícia: essas specs são atingíveis com setup doméstico. A parte complicada não é a acústica — é gravar 6, 8, 10 horas de conteúdo ao longo de dias ou semanas e manter o timbre consistente do capítulo 1 ao capítulo 40.
É aqui que o voice changer entra, mas vamos chegar nele depois de montar a base.
O que a ACX exige de verdade
As especificações técnicas da ACX que mais reprovam envios são:
- Loudness: entre -23 e -18 LUFS RMS, pico máximo em -3 dBFS
- Ruído de fundo: abaixo de -60 dBRMS no silêncio entre falas
- Formato: MP3 192 kbps ou WAV 44.1kHz/16bit, mono ou stereo
O ruído de fundo é o que reprova mais gente. Não é o microfone ruim — é o compressor de ar que você nem ouve mais depois de uma hora gravando, ou a geladeira que liga exatamente quando você tá no meio do parágrafo mais bonito do capítulo.
Setup mínimo que funciona
Microfone: dinâmico, não condensador. O Samson Q2U (USB + XLR, menos de R$400) é o ponto de entrada que a maioria dos autores independentes usa. Se você já tem budget, o Shure MV7 resolve. Microfone dinâmico tem padrão cardioide que rejeita ruído lateral e traseiro — pra ambiente doméstico, isso vale mais que a “qualidade superior” de um condensador de diafragma grande em ambiente sem tratamento.
Tratamento acústico: você não precisa de cabine. Precisa de um quarto com:
- Superfícies moles (roupas, cortinas, carpete, colchão próximo)
- Sem superfícies paralelas grandes sem nada (parede + chão = reverb que vai aparecer na gravação)
O truque mais barato: grava dentro de um armário cheio de roupas. Parece brincadeira, mas funciona melhor que muita solução cara.
Interface de áudio: se o microfone tem saída XLR, usa uma interface simples (Focusrite Scarlett Solo). Se é USB direto, tá ok — mas evita cabo longo sem ferrite pra reduzir ruído de linha.
A consistência de timbre é o problema real
Aqui tá o desafio que os guias técnicos geralmente ignoram.
Você começa o audiobook em março, descansado, voz cheia. Grava dois capítulos por semana. Em maio, passou uma gripe. Em junho, mudou a estação, o ar ficou mais seco. Em agosto, você finalmente chegou no capítulo 38 — e sua voz soa diferente do capítulo 1.
O ouvinte que escuta o audiobook de corrido vai notar. Não vai conseguir articular o problema, mas vai sentir que “a voz mudou” no meio do livro.
O VoxBooster resolve isso como camada de padronização: você grava sua voz crua normalmente, e depois processa cada sessão com o mesmo perfil de clone. O modelo preserva sua performance (ritmo, emoção, intenção) e normaliza o timbre pro mesmo ponto de referência. O capítulo gravado no dia ruim vai soar consistente com o capítulo gravado no pico da forma.
O fluxo: grava o capítulo, exporta, arrasta pro VoxBooster no modo de processamento offline, aplica o perfil escolhido. Sai um arquivo com timbre padronizado. Só então faz o tratamento de loudness e ruído.
Fluxo de gravação por capítulo
- Aquece a voz antes de gravar — 5 minutos de leitura em voz alta antes de apertar record faz diferença audível no primeiro parágrafo
- Grava capítulo inteiro, não parágrafo por parágrafo — interrupções frequentes criam inconsistência de performance; se errar, diz “ERRO” em voz alta e repete da frase, não corta na hora
- Deixa 2 segundos de silêncio antes e depois de cada take — vai precisar pra medir o nível de ruído de fundo na edição
- Exporta em WAV antes de editar — nunca edita o MP3 final; mantém o WAV como arquivo mestre
- Processa no VoxBooster com o perfil de voz padronizado
- Edita no Audacity ou Reaper — remove erros marcados, limpa respirações pesadas, aplica noise reduction se necessário
- Normaliza pra -19 LUFS (centro da faixa ACX) com limiter em -3 dBFS
- Mede o ruído de fundo — seleciona 1 segundo de silêncio e checa o RMS; se tiver acima de -60 dB, aplica noise gate ou noise reduction antes de normalizar
Sobre narrar ficção vs. não-ficção
Para não-ficção técnica, voz mais neutra e consistente funciona melhor — o ouvinte quer clareza, não performance dramática.
Para ficção, você tem mais latitude. Se o livro tem diálogos, vale usar perfis de voz ligeiramente diferentes pra personagens principais — não ao ponto de virar audiodrama, mas o suficiente pra o ouvinte diferenciar o narrador do protagonista quando ele fala em primeira pessoa.
O VoxBooster permite salvar perfis separados: “narrador padrão” como base e “protagonista” com uma leve variação de timbre. Isso adiciona uma camada de produção que audiobooks independentes raramente têm.
Antes de submeter pra ACX
Roda o arquivo final no ACX Check ou no plugin gratuito ACX Check pro Audacity. Ele mede loudness, pico e ruído de fundo e diz exatamente o que tá fora das specs. Não submete sem passar nesse check — a rejeição atrasa semanas e o processo de re-submissão é burocrático.
Gravar audiobook em casa é lento, exige disciplina e consistência de processo. Mas é completamente viável, e a plataforma de distribuição é a mesma que os grandes estúdios usam.