Cambiador de Voz con Focusrite Scarlett Solo: Guía Completa de Configuración
El Focusrite Scarlett Solo (4.ª generación) ocupa un punto óptimo para creadores de contenido en casa: 120 dólares, alimentado por bus USB-C, una sola entrada XLR con 56 dB de ganancia limpia, alimentación phantom de 48V para micrófonos de condensador y un circuito de modo Air que añade presencia profesional sin tocar un ecualizador de software. Es la interfaz de audio más popular del planeta, y se combina de forma natural con un cambiador de voz con IA en tiempo real, siempre que se configuren correctamente el enrutamiento WASAPI y el monitoreo.
Esta guía recorre la configuración completa: desde el desempaquetado y la instalación del controlador, pasando por las decisiones de alimentación phantom y modo Air, hasta la integración de VoxBooster como modificador de voz en tiempo real, y la optimización de la latencia y el monitoreo para que lo que escuchas en los auriculares coincida con lo que recibe tu stream o llamada de Discord.
Resumen rápido
- Instala el controlador de Focusrite y la aplicación Focusrite Control 2; configura la frecuencia de muestreo en 48 kHz / 24 bits.
- Activa la alimentación phantom de 48V solo si tu micrófono de condensador la requiere (mantén el botón pulsado 1 segundo).
- Activa el modo Air para voces: añade presencia que ayuda a que los efectos de voz suenen con claridad.
- Desactiva Direct Monitor cuando uses un cambiador de voz en tiempo real; usa el monitoreo por software.
- En VoxBooster, selecciona “Focusrite USB Audio” como dispositivo de entrada.
- Establece el micrófono virtual de VoxBooster como entrada en Discord, OBS, Zoom o tu aplicación de streaming.
- Apunta a menos de 20 ms de latencia total para efectos de voz; menos de 300 ms para clonación de voz con IA en tiempo real.
Por Qué el Scarlett Solo es una Base Sólida para Cambiar la Voz
El atractivo del Focusrite Scarlett Solo para creadores de contenido va más allá del precio. El modelo de 4.ª generación introdujo tres mejoras significativas respecto a su predecesor: un preamplificador con un sonido más brillante y abierto, un botón True/Air que hace que el circuito Air sea notablemente más efectivo y conectividad USB-C que elimina el desorden de cables USB-A anteriores.
Para el cambio de voz en particular, lo que importa es ganancia limpia, monitoreo honesto por auriculares y estabilidad del controlador. El Solo puntúa bien en los tres aspectos:
| Característica | Scarlett Solo 4.ª Gen | Por Qué Importa para el Cambio de Voz |
|---|---|---|
| Rango de ganancia del preamp | 56 dB | Suficiente para dinámicos y ribbons sin preamp adicional |
| Alimentación phantom | 48V vía XLR | Necesaria para micrófonos de condensador |
| Modo Air | Circuito analógico ISA | Aclara la voz para que los efectos destaquen con nitidez |
| Direct Monitor | Bypass de hardware | Debe estar DESACTIVADO para monitoreo de software en tiempo real |
| Alimentación por bus USB-C | Sin alimentación externa | Portátil; funciona desde puerto USB-C de portátil |
| ASIO + WASAPI | Ambos disponibles | ASIO para DAW, modo compartido WASAPI para apps de cambio de voz |
| Frecuencias de muestreo nativas | 44,1 / 48 / 88,2 / 96 kHz | Usa 48 kHz para comunicaciones de voz |
Comparado con el Universal Audio Apollo Twin, el Solo prescinde de efectos DSP integrados y ancho de banda Thunderbolt, pero a una décima parte del precio ofrece el ADC limpio y el controlador estable que requiere el cambio de voz.
Configuración de Hardware: Del Desempaquetado a la Primera Señal
1. Instalación del Controlador
No conectes el Scarlett Solo antes de instalar el controlador. Descarga Focusrite Control 2 desde focusrite.com/downloads. Esto instala tanto el controlador ASIO (para DAW) como el controlador estándar WDM/WASAPI de Windows simultáneamente.
Tras la instalación, conecta el Solo por USB-C y espera a que Windows enumere el dispositivo. Deberías ver “Focusrite USB Audio” en los ajustes de Sonido de Windows tanto en Reproducción (salida de auriculares) como en Grabación (entrada de micrófono).
2. Ajustes de Focusrite Control 2
Abre Focusrite Control 2 y configura:
- Frecuencia de muestreo: 48000 Hz
- Tamaño de búfer: 128 muestras (buen equilibrio entre latencia y CPU para cambio de voz; reduce a 64 para ASIO si tu sistema puede manejarlo)
3. Alineación con los Ajustes de Sonido de Windows
Haz clic derecho en el icono de altavoz en la bandeja del sistema → Configuración de sonido → desplázate hasta “Más opciones de sonido.”
En Grabación, encuentra “Focusrite USB Audio,” haz clic derecho → Propiedades → pestaña Opciones avanzadas. Establece el formato en 2 canales, 24 bits, 48000 Hz (Calidad de estudio). Repite para Reproducción (la salida de auriculares de Focusrite) para que el monitoreo y la reproducción usen el mismo reloj.
Micrófono y Alimentación Phantom
Cuándo Activar la Alimentación Phantom de 48V
El Scarlett Solo suministra alimentación phantom de 48V a través de la entrada XLR. Los micrófonos de condensador — condensadores de membrana grande como el Audio-Technica AT2020, el Rode NT1 o cualquier condensador de estudio — necesitan alimentación phantom para funcionar. Sin ella producen poca o ninguna señal.
Para activar la alimentación phantom: mantén pulsado el botón 48V del panel frontal durante aproximadamente un segundo. El botón se ilumina para confirmar que está activo. No lo pulses brevemente: el requisito de mantener pulsado evita activaciones accidentales.
Los micrófonos dinámicos (Shure SM7B, SM57, SM58, Electro-Voice RE20) no requieren ni se benefician de la alimentación phantom. Es seguro dejar 48V activo con la mayoría de los dinámicos, pero la práctica recomendada es desactivarlo si no usas un condensador, especialmente con micrófonos de cinta, que pueden dañarse con la alimentación phantom si su cableado está comprometido.
El Potenciómetro de Ganancia y el Nivel de Entrada
Con el micrófono conectado y la alimentación phantom activa (si es necesario), habla con tu volumen habitual de streaming o grabación mientras observas el anillo de ganancia de dos segmentos alrededor del potenciómetro:
- Anillo verde: la señal está presente y limpia — apunta a esto
- Anillo rojo (indicador de saturación): la señal está demasiado alta — reduce la ganancia
Para el cambio de voz, apunta a picos entre -18 y -12 dBFS en el medidor de ganancia del Solo.
Modo Air: Qué Hace y Cuándo Usarlo
El botón Air del panel frontal activa un circuito analógico diseñado para replicar el carácter de entrada con transformador de los preamplificadores de micrófono ISA clásicos de Focusrite. El efecto sonoro es un suave realce de presencia en los medios-agudos y frecuencias de aire (rango de 2 a 20 kHz), haciendo que las voces suenen más abiertas y detalladas sin aumentar una banda específica de ecualización.
Para el cambio de voz, el modo Air es generalmente beneficioso. Los algoritmos de modificación de voz con IA y los efectos tradicionales de desplazamiento de tono trabajan sobre el audio de espectro completo que les alimentas. Una fuente con buena presencia y definición proporciona al motor de procesamiento información de transitorios más clara, lo que resulta en una salida más limpia.
La excepción: si tu sala tiene reflexiones de alta frecuencia significativas o tu micrófono ya es brillante, el modo Air puede añadir aspereza no deseada. Usa tus oídos: actívalo y desactívalo mientras escuchas por los auriculares para decidir.
Direct Monitor: Desactívalo para Cambiar la Voz
Este es el error de configuración más común con el Scarlett Solo y un cambiador de voz. El interruptor Direct Monitor del Solo (etiquetado con un icono de monitoreo en el panel frontal) enruta la señal cruda del micrófono directamente a la salida de auriculares con latencia de hardware casi nula, completamente sin pasar por el ordenador.
Cuando Direct Monitor está ACTIVADO y ejecutas un cambiador de voz:
- Escuchas tu voz sin procesar en los auriculares inmediatamente
- Tu stream, llamada de Discord o grabación recibe la voz procesada con un desfase de latencia
- El resultado es una situación de doble monitoreo confusa
La solución: Establece el interruptor Direct Monitor en DESACTIVADO. Cambia al monitoreo por software dentro de VoxBooster. La ruta de monitoreo de software tiene más latencia que Direct Monitor (típicamente 5-20 ms para un efecto sin IA, 250-550 ms para síntesis neural de voz según el modo), pero significa que escuchas exactamente lo que todos los demás escuchan.
Configuración de VoxBooster con el Scarlett Solo
Instalación y Selección de Dispositivo
Descarga VoxBooster y ejecuta el instalador. No se requiere controlador del kernel: VoxBooster usa WASAPI y crea un micrófono virtual que Windows registra como dispositivo de audio estándar.
Tras la instalación, abre VoxBooster:
- En Configuración → Entrada de Audio, selecciona “Focusrite USB Audio” de la lista de dispositivos.
- Establece la frecuencia de muestreo en 48000 Hz.
- Activa el Modo Compartido WASAPI (predeterminado en VoxBooster).
- Establece el tamaño de búfer para que coincida con el de Focusrite Control 2 (128 muestras a 48 kHz ≈ 2,7 ms).
Cadena de Enrutamiento
Micrófono XLR → Preamplificador hardware Scarlett Solo (Air ACTIVADO)
→ ADC → Captura WASAPI → Procesamiento VoxBooster
→ Micrófono virtual → Discord / OBS / Zoom
Para efectos de voz (desplazamiento de tono, reverb, robot, chipmunk, voz grave), toda la cadena añade menos de 20 ms de latencia en una CPU de gama media. Para la clonación de voz con IA, espera entre 250 y 550 ms según la complejidad del modelo de voz seleccionado y tu hardware.
Para una visión más amplia de cómo VoxBooster encaja en la cadena de audio de un creador de contenido, consulta nuestra guía de cambiador de voz para creadores de contenido.
Tabla de Ajuste de Latencia
| Tamaño de búfer (Focusrite Control 2) | Latencia de ida y vuelta (efecto WASAPI) | Adecuado para |
|---|---|---|
| 32 muestras | ~3-5 ms | Monitoreo de baja latencia; exigente para la CPU |
| 64 muestras | ~5-8 ms | Recomendado para efectos de voz |
| 128 muestras | ~8-15 ms | Predeterminado; seguro para la mayoría de configuraciones |
| 256 muestras | ~15-25 ms | Usar si hay interrupciones de audio |
| 512 muestras | ~25-50 ms | Solo para solución de problemas |
Configuración de Discord con el Scarlett Solo
- Discord → Configuración → Voz y Vídeo → Dispositivo de Entrada: Establece “Micrófono Virtual VoxBooster.”
- Cancelación de eco: Deja ACTIVADA en Discord.
- Supresión de ruido: Considera desactivar la supresión de ruido de Discord si usas la de VoxBooster. Ejecutar dos algoritmos de supresión de ruido en serie introduce más artefactos que cualquiera de ellos por separado.
Para una guía paso a paso del enrutamiento de voz en Discord con un micrófono virtual, consulta la guía de configuración de cambiador de voz en Discord.
Uso del Scarlett Solo para Streaming y OBS
En OBS Studio, añade una nueva fuente de captura de entrada de audio:
- Dispositivo: Micrófono Virtual VoxBooster
- Frecuencia de muestreo: 48000 Hz (configura en OBS Configuración → Audio)
También puedes añadir el Scarlett Solo como segunda fuente de audio si quieres grabar tu voz sin procesar en una pista separada para tener una copia de seguridad.
Lee nuestro artículo completo de cambiador de voz para creadores de contenido para una visión más profunda del flujo de trabajo de streaming.
Recomendaciones de Micrófonos para el Scarlett Solo + Cambiador de Voz
| Micrófono | Tipo | Phantom | Notas para el Cambio de Voz |
|---|---|---|---|
| Audio-Technica AT2020 | Condensador | 48V necesario | Brillante y detallado; excelente con modo Air |
| Rode NT1 | Condensador | 48V necesario | Ruido propio extremadamente bajo; bueno para salas silenciosas |
| Shure SM7B | Dinámico | No necesario | Estándar de la industria; gestiona bien la ganancia alta |
| Shure SM58 | Dinámico | No necesario | Económico; el efecto de proximidad añade calidez |
| Rode PodMic | Dinámico | No necesario | Diseñado para voz; funciona bien con procesamiento de voz |
Para un análisis dedicado de cómo la elección del micrófono afecta la calidad del cambiador de voz, lee la guía del mejor micrófono para cambiador de voz.
Solución de Problemas Comunes
Sin señal en VoxBooster
- Confirma que la alimentación phantom está ACTIVADA si usas un micrófono de condensador
- Comprueba que los ajustes de Sonido de Windows muestran Focusrite como dispositivo de grabación predeterminado
- En VoxBooster Configuración → Entrada de Audio, confirma que está seleccionado “Focusrite USB Audio”
Interrupciones o crepitaciones de audio
- Aumenta el tamaño de búfer en Focusrite Control 2 (128 → 256 → 512 muestras)
- Desactiva el ahorro de energía USB: Administrador de Dispositivos → Controladores de bus serie universal → Hub raíz USB → Propiedades → Administración de energía → desmarca “Permitir que el equipo apague este dispositivo para ahorrar energía”
- Prueba un puerto USB diferente — conecta el Solo directamente a un puerto USB de la placa base
Eco o realimentación en los auriculares
- Confirma que Direct Monitor está en DESACTIVADO en el panel frontal del Solo
- En Sonido de Windows → Reproducción → propiedades de Focusrite USB Audio → pestaña Escuchar → desmarca “Escuchar este dispositivo”
El cambiador de voz suena robótico o con demasiado procesamiento
- Reduce la ganancia de entrada en el Solo — los artefactos de saturación producen armónicos ásperos que los algoritmos de voz amplifican
- Desactiva temporalmente el modo Air para descartar que el brillo de la fuente contribuya a los artefactos
Comparación del Scarlett Solo con Otras Interfaces para Cambio de Voz
| Interfaz | Precio | Phantom | Air/Color | Latencia ASIO | Notas |
|---|---|---|---|---|---|
| Focusrite Scarlett Solo 4.ª Gen | ~120 $ | 48V | Modo Air | Excelente | Mejor valor para trabajo vocal solo |
| Focusrite Scarlett 2i2 | ~160 $ | 48V | Modo Air | Excelente | Dos entradas; mejor para instrumento + micrófono |
| Behringer UMC22 | ~50 $ | 48V | Ninguno | Buena | Opción económica; preamplificador más ruidoso |
| Universal Audio Apollo Twin X | ~900 $ | 48V | DSP Unison | Excelente | DSP de efectos en entrada; excesivo para cambiador de voz |
Clonación de Voz para Locución con el Scarlett Solo
El preamplificador limpio del Scarlett Solo lo convierte en una interfaz de grabación de locución legítima. Combinarlo con la clonación de voz con IA de VoxBooster abre un camino creativo adicional: grabar con una voz y entregar contenido con otra, de forma consistente, en todas las sesiones.
Para una mirada detallada a cómo la clonación de voz con IA se integra con la producción de locución, consulta nuestra guía de clonación de voz para locución.
Preguntas Frecuentes
¿Puedo usar un cambiador de voz con el Focusrite Scarlett Solo?
Sí. El Scarlett Solo aparece como un dispositivo de audio estándar de Windows una vez instalado su controlador. Cualquier software de cambio de voz que lea desde una entrada de Windows, incluido VoxBooster, puede capturar la señal del Solo y enviar una señal modificada a un micrófono virtual que Discord, Zoom, OBS y otras aplicaciones pueden seleccionar.
¿El Scarlett Solo funciona con el modo compartido WASAPI para cambiar la voz?
Sí. El controlador ASIO de Focusrite está diseñado para grabación en DAW, pero Windows también expone el Solo como dispositivo WASAPI. Un cambiador de voz en tiempo real como VoxBooster usa el modo compartido WASAPI para capturar desde el Solo con baja latencia sin interferir con otras aplicaciones. Configura la frecuencia de muestreo de Windows en 48 kHz para coincidir con la frecuencia nativa del Solo.
¿Qué hace el modo Air del Scarlett Solo?
El modo Air activa un circuito analógico que modela la etapa de entrada con transformador de los preamplificadores de micrófono ISA clásicos de Focusrite. Añade presencia y aire en el rango de 2 a 20 kHz, una brillantez sutil que hace que la voz destaque en la mezcla sin necesidad de ecualizar. Activa el botón Air del panel frontal para habilitarlo.
¿Debo usar Direct Monitor cuando ejecuto un cambiador de voz con el Scarlett Solo?
Desactiva Direct Monitor cuando uses un cambiador de voz en tiempo real. Direct Monitor enruta la señal cruda del micrófono directamente a los auriculares con latencia casi nula, sin pasar por el ordenador, por lo que escuchas tu voz sin procesar, no la voz modificada. Cambia al monitoreo por software a través de VoxBooster para escuchar la voz modificada en los auriculares.
¿Qué frecuencia de muestreo debo configurar en el Scarlett Solo para el cambiador de voz?
Usa 48 kHz / 24 bits en la aplicación Focusrite Control 2 y hazlo coincidir con la configuración de sonido de Windows. Usar 44,1 kHz obliga a Windows a remuestrear sobre la marcha, lo que añade una pequeña latencia y puede provocar una ligera degradación de la calidad de audio.
¿El Scarlett Solo necesita alimentación phantom para un micrófono de condensador?
Sí. Los micrófonos de condensador requieren 48V. El Scarlett Solo suministra 48V a través del conector combo XLR: mantén pulsado el botón 48V del panel frontal durante un segundo para activarla.
¿Puedo usar el Scarlett Solo para cambiar la voz en Discord sin una tarjeta de sonido dedicada?
El Scarlett Solo ES la interfaz de audio. Instala el controlador de Focusrite, configura el Solo como entrada en los ajustes de Voz y Vídeo de Discord y selecciona el micrófono virtual de VoxBooster como dispositivo de salida.
Conclusión
El Focusrite Scarlett Solo de 4.ª generación es el punto de entrada más limpio y accesible a una configuración de cambio de voz de calidad profesional para creadores de contenido en casa. A 120 dólares con alimentación por bus, 48V de alimentación phantom para micrófonos de condensador, modo Air para realce instantáneo de presencia y soporte de controlador WASAPI sólido en Windows, elimina todas las variables de hardware que pueden comprometer la calidad de salida del cambiador de voz.
Las decisiones clave de configuración son simples: 48V solo cuando el micrófono lo necesita, modo Air activado para voces, Direct Monitor desactivado para monitorear la señal procesada y modo compartido WASAPI a 48 kHz para la ruta de menor latencia y mayor compatibilidad con VoxBooster.
Descarga VoxBooster — prueba gratuita de 3 días, Windows 10/11, sin controlador del kernel.