¿Puedo automatizar el procesamiento de Auphonic con la API tras cada grabación?

Sí. Auphonic ofrece una API REST y un flujo de trabajo basado en SFTP. Puedes hacer POST de un archivo de una o varias pistas en una producción preconfigurada, sondear el estado de finalización y descargar el master terminado. Combinado con un script activado al cerrar tu sesión de grabación, todo el paso de normalización de loudness y limpieza se automatiza completamente.

Voice Changer + Auphonic Mastering: Flujo de trabajo completo para podcast

Si estás combinando un voice changer con Auphonic mastering para tu podcast o contenido de voz, estás uniendo dos herramientas muy distintas: una que transforma tu voz antes de grabar y otra que pule el audio terminado hasta los estándares de loudness de emisión. El traspaso correcto entre ellas es lo que separa un episodio de sonido profesional de uno que técnicamente ha sido procesado pero sigue sonando irregular.

Esta guía lo cubre todo: qué hace realmente Auphonic (y qué no hace), cómo configurar tu cadena de voice changer antes de que la grabación llegue a Auphonic, cómo funcionan el Adaptive Leveler y la normalización de loudness, y un flujo de trabajo paso a paso que puedes repetir en cada sesión de grabación.

TL;DR

Auphonic es un servicio de mastering de podcast en la nube (Viena): normaliza la loudness, reduce el ruido, nivela la dinámica y puede eliminar muletillas. No cambia tu voz.
Ejecuta tu voice changer en tiempo real antes de grabar para que Auphonic reciba un archivo limpio y ya transformado.
Apunta a -16 LUFS integrado para podcast, -23 LUFS para radiodifusión (EBU R128). Auphonic hace los cálculos automáticamente.
El Adaptive Leveler corrige la variación de ganancia por segmentos, ideal para grabaciones con varios locutores o un único presentador con distancia al micrófono inconsistente.
La eliminación de muletillas está disponible en la interfaz web y API de Auphonic, impulsada por IA de transcripción.
Graba con al menos -12 dBFS de margen para que la etapa de salida del voice changer no sature antes de que Auphonic procese el archivo.

Qué hace realmente Auphonic

Auphonic es un servicio de posproducción de audio en la nube creado en Viena, diseñado específicamente para contenido de voz hablada. No es un DAW, ni un voice changer, ni un editor de audio general. Lo que hace es tomar una grabación terminada y ejecutarla a través de un pipeline de procesamiento inteligente para entregar un master listo para emisión.

La cadena de procesamiento principal incluye:

Adaptive Leveler — nivelación dinámica multibanda por segmentos
Normalización de loudness — orientada al estándar elegido (podcast, radiodifusión, web)
Reducción de ruido y zumbidos — noise gate espectral
Restauración de audio — manejo de clipping, dropouts y artefactos de códec
Eliminación de muletillas y respiraciones — análisis de voz con IA
Mezcla multipista — balance de varios locutores o stems antes del mastering

Auphonic procesa archivos que subes a través de la interfaz web, las apps iOS/Android o su API REST. Defines un preset de “producción” una vez —estableciendo el objetivo de loudness, el formato de salida y si la eliminación de muletillas está activada— y lo reutilizas en cada episodio.

Dónde encaja un voice changer

Auphonic recibe tu archivo de audio terminado y lo masteriza. No transforma tu voz, aplica efectos de personaje ni hace conversión de pitch en tiempo real. Si quieres sonar diferente en tu podcast —una voz de locutor más grave, una voz de personaje para un segmento narrativo o conversión de voz con IA a un modelo entrenado— necesitas un voice changer en tiempo real durante la sesión de grabación.

La cadena es: micrófono → voice changer en tiempo real → software de grabación → archivo de audio terminado → Auphonic.

VoxBooster, por ejemplo, se sitúa entre tu micrófono físico y tu software de grabación a través de un dispositivo de audio virtual. Tu DAW o aplicación de grabación captura la voz ya transformada. Ese archivo va después a Auphonic para el mastering. Auphonic no necesita saber que se usó un voice changer: procesa el audio que recibe.

Esto importa por razones de flujo de trabajo: no puedes aplicar retroactivamente un cambio de voz en tiempo real dentro de Auphonic. Si grabas en seco y quieres sonar diferente, necesitas pasar el archivo por una herramienta de conversión de voz separada, lo que introduce un paso de procesamiento adicional y cierta pérdida de calidad. Grabar la voz transformada directamente siempre es más limpio.

Para podcasters que quieren transformación de voz sin el paso de edición adicional, consulta cómo los creadores de contenido usan los voice changers en su flujo de producción.

Cómo funciona el Adaptive Leveler de Auphonic

El Adaptive Leveler es la herramienta de procesamiento más potente de Auphonic para podcasters. A diferencia de un compresor o limitador tradicional que reacciona a los picos en tiempo real, el Adaptive Leveler analiza toda la grabación primero, la segmenta por locutor o sección y luego aplica ajustes de ganancia por segmento para llevar cada parte del audio a una loudness percibida consistente.

Los beneficios prácticos:

Varios locutores a diferentes niveles de ganancia: dos presentadores grabados en micrófonos USB separados con distintas sensibilidades serán nivelados para coincidir, incluso si uno estaba consistentemente 6 dB más alto que el otro.
Distancia variable al micrófono: si un presentador se inclina hacia adelante y hacia atrás durante una entrevista, el Adaptive Leveler suaviza esas variaciones de nivel a lo largo del segmento en lugar de aplicar un compresor que bombea con cada respiración.
Procesamiento por frecuencia: el Adaptive Leveler opera en múltiples bandas de frecuencia, por lo que gestiona los picos de presencia de forma diferente al ruido grave. El resultado es más natural que un rider de ganancia de banda ancha.

Para contenido con voz modificada, el Adaptive Leveler también compensa cualquier inconsistencia de ganancia que tu voice changer pueda introducir en ciertos intervalos de pitch o intensidades de efecto. Algunos efectos de conversión de voz causan una ligera variación de ganancia en la salida al cambiar entre voces o ajustar la profundidad del efecto a mitad de grabación; el Adaptive Leveler absorbe esas transiciones.

Un ajuste importante: la fuerza del Adaptive Leveler, que encontrarás en la configuración de producción de Auphonic. Un valor de 80-100% es adecuado para la mayoría de los podcasts. Para contenido con mucha música o donde el rango dinámico es intencional (drama de audio hablado, ASMR), redúcelo al 40-60% para preservar el contraste entre secciones fuertes y suaves.

Estándares de loudness: -16 LUFS frente a -23 LUFS

LUFS significa Loudness Units Full Scale, la medida de loudness perceptual definida por el estándar ITU-R BS.1770. La mayoría de las plataformas de podcast modernas y los estándares de radiodifusión especifican su objetivo en LUFS.

Destino de distribución	LUFS integrado	Techo de pico verdadero
Spotify, Apple Podcasts (master recomendado)	-16 LUFS	-1 dBTP
YouTube (normalización de contenido)	-14 LUFS (reproducción)	-1 dBTP
EBU R128 (radiodifusión europea)	-23 LUFS	-1 dBTP
ATSC A/85 (radiodifusión estadounidense)	-24 LUFS	-2 dBTP
Audible / audiolibro	-18 a -23 LUFS	-3 dBTP

Auphonic te permite seleccionar un objetivo de loudness preestablecido en un menú desplegable (“Podcast”, “EBU R128”, “ATSC A/85”, “Apple Podcasts”, etc.) en lugar de introducir valores LUFS directamente, pero conocer los números te ayuda a entender lo que estás seleccionando.

Para la mayoría de los podcasters, -16 LUFS integrado con -1 dBTP de pico verdadero es la opción correcta. Este nivel suena completo y competitivo junto a otro contenido de podcast, y las principales plataformas no lo atenuarán significativamente. Spotify normaliza a -14 LUFS en reproducción, lo que significa que un master a -16 LUFS recibe un ligero aumento de volumen, sin que se sature ni se comprima.

Para radiodifusión, usa -23 LUFS (EBU R128). Si tu podcast se distribuye en radio pública o servicios de streaming europeos con cumplimiento estricto de loudness, -23 LUFS garantiza que tu contenido pase la medición automatizada de loudness en la ingesta de radiodifusión. La contrapartida es que -23 LUFS suena notablemente más silencioso en dispositivos de consumo sin la normalización de plataforma que aplican las apps de podcast.

Auphonic calcula la loudness integrada en todo el programa, no solo en los picos. Una sección fuerte seguida de una silenciosa se nivelará al objetivo promedio. Esto es diferente a aplicar un limitador que solo controla los picos: toda la envolvente de energía espectral se mide y ajusta.

Eliminación de muletillas en Auphonic

La eliminación de muletillas de Auphonic es una función basada en IA que transcribe tu audio e identifica eventos de habla que no son contenido: “eh”, “um”, “bueno”, “este” y respiraciones prolongadas. Los segmentos identificados se silencian (o en algunas configuraciones, se reducen en lugar de cortarse completamente) sin desplazar el timing de la grabación.

Para usarla:

Activa el Reconocimiento Automático de Voz (ASR) en la configuración de producción de Auphonic.
Elige tu idioma de la lista de idiomas ASR.
Activa Muletillas en la sección de postprocesado.
Sube tu grabación y procesa.

Algunas notas prácticas sobre la eliminación de muletillas en audio con voz modificada:

El modelo ASR analiza patrones de habla, no la identidad del locutor. Una grabación con voz modificada sigue siendo transcribible siempre que los fonemas del habla estén intactos, lo que ocurrirá si tu voice changer usa un modelo que preserva la inteligibilidad en lugar de destruirla.
Los efectos de bajada extrema de pitch (voz robótica, voz demoníaca) pueden confundir al motor ASR y reducir la precisión de detección de muletillas. Para contenido donde la eliminación de muletillas importa, usa una conversión de voz que se mantenga dentro del rango de voz humana natural, grave pero aún reconocible como habla.
La conversión de voz con IA de VoxBooster preserva la estructura formántica y el timing de los fonemas, lo que significa que los modelos ASR, incluido el de Auphonic, pueden seguir interpretando el habla con fiabilidad.

Para flujos de trabajo de podcast donde cada segundo de tiempo de grabación es valioso, combinar un voice changer para un carácter de entrega consistente con la eliminación de muletillas de Auphonic es más eficiente que editar manualmente los tropiezos en postproducción. Consulta la guía de clonación de voz para profesionales del voiceover para ver cómo esto se integra en un pipeline de producción profesional.

Flujo de trabajo paso a paso: de voice changer a master de Auphonic

Aquí tienes el flujo de trabajo completo para grabar un episodio de podcast con voz modificada y producir un master listo para emisión a través de Auphonic.

Antes de grabar

Configura tu voice changer. Abre VoxBooster (o tu herramienta preferida), selecciona tu micrófono de entrada y elige tu efecto de voz o modelo de voz cargado. Ajusta el nivel de salida para que los picos en sílabas fuertes rononden -12 dBFS: deja margen para la nivelación de Auphonic.
Crea una ruta de micrófono virtual. VoxBooster crea un dispositivo de audio virtual. Selecciónalo como entrada de micrófono en tu software de grabación (Audacity, Adobe Audition, Hindenburg, GarageBand, OBS, etc.).
Ajusta la frecuencia de muestreo de forma consistente. Haz coincidir la frecuencia de muestreo del dispositivo virtual (48 kHz es estándar) con la tasa de proyecto de tu software de grabación. Las tasas no coincidentes causan remuestreo silencioso y pueden introducir artefactos sutiles que se acumulan durante el procesamiento de Auphonic.
Configura tu producción de Auphonic. Inicia sesión en auphonic.com, ve a Producciones > Nueva Producción y configura:
- Loudness de salida: -16 LUFS para podcast, -23 LUFS para radiodifusión
- Techo de pico verdadero: -1 dBTP
- Adaptive Leveler: activado, fuerza 80%
- Reducción de ruido: activada
- Muletillas: activadas si se desea (requiere ASR)
- Formato de salida: MP3 192 kbps o FLAC para archivado

Sesión de grabación

Graba tu episodio. Tu software de grabación captura el audio con voz modificada directamente. Si es posible, graba todos los presentadores en la misma pasada; el modo de producción multipista de Auphonic puede balancear varios stems antes del mastering, lo que es mejor que intentar nivelar pistas grabadas por separado en postproducción.
Vigila el clipping. Observa el medidor de grabación. Si algún pico supera -3 dBFS, reduce la ganancia de entrada del voice changer o del micrófono. El clipping que entra en Auphonic no puede repararse completamente: la restauración de audio ayuda, pero no puede recrear picos que se saturaron antes de la captura.

Posproducción

Exporta tu grabación con la máxima calidad disponible desde tu software de grabación: WAV de 24 bits o FLAC a 48 kHz. No apliques ningún procesamiento ni normalización adicional dentro de tu DAW antes de subir a Auphonic. Deja que Auphonic haga el trabajo de mastering desde una fuente limpia.
Sube a Auphonic. Ve a tu producción preconfigurada y sube el archivo (o usa la carpeta SFTP para flujos de trabajo automatizados). Auphonic pondrá en cola la producción.
Revisa la forma de onda y las estadísticas. Cuando el procesamiento termine, Auphonic muestra un gráfico de loudness, la medición de LUFS integrado, la lectura de pico verdadero y una transcripción con las muletillas detectadas. Revisa las estadísticas para confirmar que la salida alcanzó tu objetivo.
Descarga el archivo masterizado y revísalo en tu reproductor de podcast o DAW. Compáralo con un episodio publicado de un podcast de la competencia para verificar la equiparación de niveles.

Comparación de voice changers para flujos de trabajo con Auphonic

No todos los voice changers generan audio lo suficientemente limpio para que Auphonic trabaje con él de forma óptima. La siguiente tabla cubre las opciones más comunes:

Herramienta	Calidad de salida	Compatible con Auphonic	Consistencia de LUFS	Notas
VoxBooster	PCM 24 bits, 48 kHz	Sí	Excelente	Conversión de voz con IA, low-latency audio capture baja latencia
Voicemod	PCM 16 bits, 48 kHz	Sí	Buena	Efectos preestablecidos, sin entrenamiento de modelo personalizado
MorphVOX Pro	PCM 16 bits, 44,1 kHz	Sí	Buena	Motor DSP antiguo, sin conversión con IA
Clownfish Voice Changer	PCM 16 bits, variable	Sí	Variable	Gratuito, calidad de efecto limitada
Procesadores de voz hardware	24 bits, variable	Sí	Excelente	Mejor calidad, costosos (200-800 €)
Filtro de micrófono virtual OBS	Float 32 bits, 48 kHz	Sí	Excelente	Sin transformación de voz, solo filtro de ruido

El factor más importante para la compatibilidad con Auphonic es el nivel de salida consistente y sin clipping interno. El Adaptive Leveler de Auphonic puede corregir inconsistencias dinámicas moderadas, pero no puede reparar una grabación que se saturó en la etapa de entrada del voice changer.

Consideraciones sobre el piso de ruido en audio con voz modificada

Un aspecto del audio del voice changer que la reducción de ruido de Auphonic gestiona bien: los modelos de IA de conversión de voz a veces introducen un piso de ruido estacionario de bajo nivel que no está presente en grabaciones de micrófono en seco. Esta es una característica conocida de las arquitecturas de conversión de voz neuronal: el proceso de inferencia genera una pequeña cantidad de energía de ruido en el rango de 3-8 kHz.

La reducción de ruido espectral de Auphonic actúa muy eficazmente sobre el ruido estacionario (ruido que permanece a un nivel y perfil de frecuencia consistentes durante toda la grabación). El algoritmo de reducción de ruido construye un perfil de ruido a partir de las secciones silenciosas entre el habla y lo sustrae de la señal completa.

Si escuchas un ligero “brillo digital” o zumbido de fondo en tus grabaciones con voz modificada, activa la reducción de ruido en tu producción de Auphonic y ajústala a Media (no Agresiva: la reducción de ruido agresiva en audio ya procesado puede producir artefactos metálicos en el habla). La combinación de la salida del modelo de voz del voice changer más la reducción del piso de ruido de Auphonic produce un resultado más limpio que cualquiera de las dos por separado.

Para una comparación detallada de cómo las herramientas de supresión de ruido interactúan con los voice changers, consulta integración de VoxBooster con Krisp AI.

Integración de Auphonic en un flujo de distribución de podcast

Auphonic se integra directamente con varias plataformas de alojamiento y distribución de podcasts:

Libsyn, Buzzsprout, Simplecast, Captivate: subida directa a través de las integraciones de publicación de Auphonic
Dropbox, Google Drive, S3: sincronización automática de archivos de salida masterizados
WordPress: el plugin de WordPress de Auphonic puede publicar audio masterizado en tu entrada de blog automáticamente
Acast: sube MP3 masterizados por Auphonic a través del panel de control de Acast para distribución en streaming

Para podcasters que distribuyen específicamente en Acast, consulta la guía de voice changer para podcast en Acast para conocer los requisitos de loudness específicos de la distribución y cómo Acast trata el contenido con voz modificada.

Automatización del pipeline completo con la API de Auphonic

Para productores de contenido de alto volumen —programas diarios, dramas de audio en serie, series de entrevistas multipista— subir manualmente los archivos a través de la interfaz web de Auphonic es un cuello de botella. La API REST de Auphonic permite automatizar todo el paso de posproducción.

Un script de automatización básico:

Al finalizar tu sesión de grabación, tu software de grabación guarda el archivo en una carpeta local.
Un script (Python, Node.js, shell script) vigila esa carpeta y detecta archivos nuevos.
El script hace POST del archivo al endpoint /productions de Auphonic con tu configuración preestablecida.
El script sondea /productions/{uuid} para conocer el estado de finalización.
Al completarse, el script descarga el archivo masterizado y lo mueve a tu cola de distribución.

Auphonic proporciona ejemplos de código en Python y curl en su documentación de la API. La API usa autenticación básica HTTP con las credenciales de tu cuenta de Auphonic. Los presets de producción que configuras en la interfaz web se pueden reutilizar mediante su UUID en las llamadas a la API, por lo que no es necesario especificar cada ajuste en cada solicitud.

Para usuarios de Adobe Premiere o Audition que procesan voiceover antes del mastering, la guía de voice changer para Adobe Premiere Speech cubre cómo configurar una cadena de grabación y exportación paralela que alimenta el procesamiento automatizado de Auphonic.

Errores comunes que hay que evitar

Algunos problemas que causan fallos consistentes en los flujos de trabajo de voice changer + Auphonic:

Grabar demasiado alto. El error más común. Los voice changers pueden añadir ganancia, especialmente los efectos de subida de pitch que aumentan la energía de alta frecuencia. Ajusta a -12 dBFS y deja que el Adaptive Leveler de Auphonic lleve el nivel al objetivo. Nunca confíes en los medidores de nivel visuales de tu aplicación de grabación sin comprobar después la loudness de pico e integrada.

Aplicar normalización antes de subir. Algunos DAWs ofrecen “normalizar al exportar”. No uses esta opción antes de subir a Auphonic. Quieres el archivo sin procesar en bruto. El pipeline de Auphonic está diseñado para trabajar desde el material fuente, no desde audio pre-normalizado donde las decisiones de margen ya se han tomado.

Olvidar sincronizar las frecuencias de muestreo. Una salida del voice changer a 44,1 kHz subida a un proyecto de Auphonic a 48 kHz provoca un remuestreo sutil que introduce aliasing. Siempre exporta a 48 kHz si tu voice changer opera a 48 kHz.

Aplicar reducción de ruido dos veces. Algunos voice changers incluyen un paso de supresión de ruido integrado. Auphonic también aplica reducción de ruido. Ejecutar ambos en serie puede producir artefactos metálicos o acuosos. O bien desactiva la supresión de ruido del voice changer y deja que Auphonic lo gestione, o desactiva la reducción de ruido de Auphonic si el voice changer ya produjo un piso limpio.

Elegir el objetivo de LUFS incorrecto. Ajustar -23 LUFS para un podcast de Spotify hará que tus episodios suenen silenciosos. Seleccionar -16 LUFS para distribución en radiodifusión EBU R128 fallará en las comprobaciones de cumplimiento. Ajusta el objetivo al canal de distribución principal.

Preguntas frecuentes

¿Puedo usar Auphonic como cambiador de voz?

Auphonic es un servicio de mastering en la nube centrado en la normalización de loudness, reducción de ruido y eliminación de muletillas, no en la transformación de voz en tiempo real. Para cambiar tu voz necesitas un voice changer en tiempo real como VoxBooster antes de grabar. Luego pasa la grabación por Auphonic para obtener un acabado listo para emisión.

¿Qué objetivo de LUFS debo usar en Auphonic para podcast?

La mayoría de las plataformas normalizan las subidas a -14 LUFS durante la reproducción. El objetivo estándar del sector es -16 LUFS de loudness integrado con un techo de -1 dBTP. La radiodifusión (EBU R128, ATSC A/85) apunta a -23 LUFS. Configura la salida de Auphonic según tu canal de distribución principal.

¿Qué es el Adaptive Leveler de Auphonic y por qué importa?

El Adaptive Leveler es un procesador dinámico multibanda que ajusta continuamente la ganancia para mantener el habla a un nivel consistente, compensando que el locutor se mueva, la variación de intensidad vocal o varios locutores a distintas ganancias. A diferencia de un compresor, opera en bandas de frecuencia y se adapta por segmentos, sin artefactos de bombeo.

¿Usar un voice changer antes de Auphonic perjudica la calidad?

No, si grabas con limpieza. Un voice changer bien configurado genera PCM de 16 o 24 bits a 44,1 o 48 kHz, la misma resolución que acepta Auphonic. El único riesgo es el clipping antes de la etapa de salida del voice changer. Graba con -12 dBFS de margen de pico y el Adaptive Leveler de Auphonic gestiona el resto.

¿Cómo funciona la eliminación de muletillas en Auphonic?

El análisis de voz con IA de Auphonic detecta y silencia muletillas comunes y respiraciones en el audio subido. Requiere que el reconocimiento automático de voz (ASR) de Auphonic esté activo en el archivo. Los segmentos identificados se silencian sin desplazar el timing de la grabación.

¿Puedo automatizar el procesamiento de Auphonic con la API?

Sí. Auphonic ofrece una API REST. Puedes hacer POST del archivo en una producción preconfigurada, sondear el estado y descargar el master terminado. Combinado con un script al cerrar la sesión de grabación, todo el paso de normalización de loudness y limpieza se automatiza.

¿Es Auphonic mejor que el mastering manual para podcasters?

Para podcast de voz hablada, el pipeline automatizado de Auphonic iguala o supera lo que la mayoría haría manualmente. El mastering manual gana en contenido con mucha música, donde EQ más preciso y separación de stems dan más control sobre la mezcla final.

Conclusión

La combinación voice changer + Auphonic mastering cubre las dos etapas que necesitan la mayoría de los flujos de trabajo de podcast y contenido de voz: transformación de voz en la fuente y normalización de loudness en la salida. Ninguna herramienta reemplaza a la otra. El voice changer da forma a cómo suenas durante la grabación; Auphonic da forma a cómo esa grabación suena a tu audiencia tras el mastering.

La clave para que funcionen bien juntos es la disciplina de margen: graba a -12 dBFS de pico, exporta a 24 bits desde tu software de grabación y deja que el Adaptive Leveler y la normalización de loudness de Auphonic hagan su trabajo desde material fuente limpio. Añade la eliminación de muletillas y tendrás un pipeline de posproducción automatizado completo a partir de un único preset de producción de Auphonic.

Si aún no has configurado el lado del voice changer de este flujo de trabajo, descarga VoxBooster y configura primero tu cadena de micrófono virtual; después pasa una grabación de prueba por Auphonic para ajustar tu configuración de producción antes de tu próximo episodio.