Voice Changer avec Focusrite Scarlett Solo : Guide de Configuration Complet
Le Focusrite Scarlett Solo (4e génération) se situe au bon point pour les créateurs de contenu à domicile : 120 euros, alimenté par USB-C, entrée XLR unique avec 56 dB de gain propre, alimentation fantôme 48V pour les microphones condensateurs, et un circuit mode Air qui ajoute de la présence professionnelle sans avoir besoin d’un EQ logiciel. C’est l’interface audio la plus populaire de la planète, et elle se marie naturellement avec un changeur de voix AI en temps réel — mais seulement si vous configurez correctement le routage low-latency audio capture et la surveillance.
Ce guide traite la configuration complète : de la livraison et l’installation du pilote, via l’alimentation fantôme et les décisions du mode Air, jusqu’à l’intégration de VoxBooster comme votre modificateur de voix en temps réel, et enfin l’ajustement fin de la latence et de la surveillance pour que ce que vous entendez dans vos écouteurs corresponde à ce que votre flux ou appel Discord reçoit.
TL;DR
- Installez le pilote Focusrite et l’application Focusrite Control 2 ; définissez le taux d’échantillonnage sur 48 kHz / 24-bit.
- Activez l’alimentation fantôme 48V uniquement si votre microphone condensateur l’exige (maintenez le bouton pendant environ 1 seconde).
- Activez le mode Air ACTIVÉ pour les voix — il ajoute de la présence qui rend les effets vocaux nets.
- Mettez Direct Monitor OFF quand vous utilisez un changeur de voix en temps réel ; utilisez plutôt la surveillance logicielle.
- Dans VoxBooster, sélectionnez “Focusrite USB Audio” comme appareil d’entrée.
- Définissez le microphone virtuel de VoxBooster comme entrée dans Discord, OBS, Zoom ou votre application de diffusion.
- Ciblez une latence de bout en bout inférieure à 20ms pour les effets vocaux ; inférieure à 300ms pour le clonage vocal AI en temps réel.
Pourquoi le Scarlett Solo est une fondation solide pour le changement de voix
L’attrait du Focusrite Scarlett Solo pour les créateurs de contenu dépasse son prix. Le modèle 4e génération a apporté trois améliorations importantes par rapport à son prédécesseur : un préamplificateur plus brillant et plus ouvert, un commutateur True/Air qui rend le circuit Air notablement plus efficace, et la connectivité USB-C qui élimine l’ancien désordre du câble USB-A.
Pour le changement de voix spécifiquement, ce qui compte est le gain propre, la surveillance honnête des écouteurs et la stabilité du pilote. Le Solo score bien sur les trois :
| Caractéristique | Scarlett Solo 4e Gén. | Pourquoi c’est important pour le changement de voix |
|---|---|---|
| Plage de gain du préamplificateur | 56 dB | Suffisant pour les rubans et les dynamiques sans préamplificateur supplémentaire |
| Alimentation fantôme | 48V via XLR | Requis pour les microphones condensateurs utilisés avec changeurs de voix |
| Mode Air | Circuit analogique ISA | Rend les voix plus brillantes afin que les effets vocaux ressorent clairement |
| Direct Monitor | Contournement matériel | Doit être OFF pour la surveillance logicielle en temps réel |
| Alimentation USB-C par bus | Pas d’alimentation externe nécessaire | Portable ; fonctionne à partir du port USB-C d’un ordinateur portable |
| ASIO + low-latency audio capture | Les deux exposés | ASIO pour DAW, mode partagé low-latency audio capture pour applications changeur de voix |
| Taux d’échantillonnage natifs | 44,1 / 48 / 88,2 / 96 kHz | Corresponde 48 kHz pour communications vocales |
Par rapport au Universal Audio Apollo Twin, le Solo abandonne les effets DSP embarqués et la bande passante Thunderbolt — mais à un dixième du prix, il vous donne le CAN propre et le pilote stable dont le changement de voix a besoin. La modélisation de préamplificateur Unison d’Apollo Twin n’est pas nécessaire pour le travail de changeur de voix, qui traite l’audio en logiciel de toute façon.
Configuration matérielle : De la livraison au premier signal
1. Installation du pilote
Ne branchez pas le Scarlett Solo avant d’installer le pilote. Téléchargez Focusrite Control 2 à partir de focusrite.com/downloads. Ceci installe à la fois le pilote ASIO (pour DAW) et le pilote audio WDM/low-latency audio capture Windows standard simultanément.
Après l’installation, connectez le Solo via USB-C et attendez que Windows énumère l’appareil. Vous devriez voir “Focusrite USB Audio” apparaître dans les paramètres de son Windows sous Lecture (sortie écouteurs) et Enregistrement (entrée microphone).
2. Paramètres de Focusrite Control 2
Ouvrez Focusrite Control 2 et configurez :
- Taux d’échantillonnage : 48000 Hz
- Taille du tampon : 128 samples (bon équilibre entre latence et CPU pour changement de voix ; réduisez à 64 pour ASIO si votre système peut le gérer)
Le paramètre de taille de tampon ici affecte le pilote ASIO. Le mode partagé low-latency audio capture utilise sa propre négociation de tampon avec Windows, mais le réglage du tampon ASIO sur une valeur inférieure encourage généralement Windows à négocier une période shared-mode inférieure aussi.
3. Alignement des paramètres de son Windows
Cliquez avec le bouton droit sur l’icône du haut-parleur dans la zone de notification → Paramètres de son → faites défiler vers “Plus de paramètres de son.”
Sous Enregistrement, trouvez “Focusrite USB Audio,” clic droit → Propriétés → onglet Avancé. Définissez le format sur 2 canaux, 24 bits, 48000 Hz (Qualité Studio). Cela indique à Windows le format de mode partagé low-latency audio capture préféré et évite une étape de rééchantillonnage.
Répétez pour Lecture (la sortie écouteurs Focusrite) afin que la surveillance et la lecture utilisent la même horloge.
Choix du microphone et alimentation fantôme
Quand activer l’alimentation fantôme 48V
Le Scarlett Solo fournit une alimentation fantôme 48V via l’entrée XLR. Les microphones condensateurs — grands condensateurs comme l’Audio-Technica AT2020, le Rode NT1 ou n’importe quel condensateur studio — nécessitent une alimentation fantôme pour fonctionner. Sans elle, ils produisent peu ou pas de sortie.
Pour activer l’alimentation fantôme : appuyez et maintenez le bouton 48V sur le panneau avant pendant environ une seconde. Le bouton s’illumine pour confirmer qu’il est actif. Ne frappez pas simplement — l’exigence de maintien empêche l’activation accidentelle.
Les microphones dynamiques (Shure SM7B, SM57, SM58, Electro-Voice RE20) ne nécessitent pas ou ne bénéficient pas d’une alimentation fantôme. Il est sûr de laisser 48V activé avec la plupart des dynamiques, mais la meilleure pratique est de la désactiver si vous n’utilisez pas de condensateur — particulièrement avec les microphones à ruban, qui peuvent être endommagés par l’alimentation fantôme si leur câblage est compromis.
Le bouton de gain et le réglage du niveau d’entrée
Avec le microphone connecté et l’alimentation fantôme activée (si nécessaire), parlez à votre volume typique de diffusion ou d’enregistrement tout en observant le halo de gain à deux segments autour du bouton de gain :
- Halo vert : le signal est présent et propre — visez ceci
- Halo rouge (indicateur d’écrêtage) : le signal est trop fort — réduisez le gain
Pour le changement de voix, visez un pic entre -18 et -12 dBFS sur le mètre de gain du Solo. Un niveau d’entrée défini de manière conservatrice donne aux algorithmes de traitement vocal plus d’espace de tête et produit une sortie plus propre du changement de pas et de la re-synthèse AI. Si le gain est trop poussé, les artefacts d’écrêtage survivent à l’étape de traitement vocal et apparaissent comme des transitoires durs dans la sortie.
Mode Air : Ce qu’il fait et quand l’utiliser
Le bouton Air sur le panneau avant active un circuit analogique conçu pour répliquer le caractère d’entrée couplé par transformateur des préamplificateurs de microphone ISA classiques de Focusrite. L’effet sonore est une légère remontée de présence dans le milieu supérieur et les fréquences air (plage 2–20 kHz), rendant les voix plus ouvertes et détaillées sans surélever une bande EQ spécifique.
Pour le changement de voix, le mode Air est généralement bénéfique. Les algorithmes de modification vocale AI et les effets de changement de pas traditionnels fonctionnent tous deux sur l’audio plein spectre que vous leur alimentez. Une source avec une bonne présence et une définition donne au moteur de traitement des informations transitoires plus claires, ce qui donne une sortie plus propre — particulièrement pour les consonnes (s, t, f sons) qui définissent l’intelligibilité vocale.
L’exception : si votre pièce a d’importantes réflexions haute fréquence ou si votre microphone est déjà brillant (par exemple, un condensateur placé très près avec un traitement acoustique minimal), le mode Air peut ajouter une dureté indésirable. Écoutez — basculez-le marche/arrêt tout en écoutant dans vos écouteurs pour décider.
Le mode True (l’alternative, étiqueté sur le panneau avant) contourne le circuit Air et livre un caractère de préamplificateur plus neutre et plat. Il convient aux instruments, aux microphones au son foncé ou aux créateurs qui préfèrent l’EQ entièrement en logiciel.
Direct Monitor : Mettez-le OFF pour le changement de voix
C’est la plus grande erreur de configuration commune avec le Scarlett Solo et un changeur de voix. Le commutateur Direct Monitor du Solo (marqué avec une icône de surveillance sur le panneau avant) route votre signal de microphone brut directement vers la sortie écouteurs avec une latence matérielle quasi nulle — contournant entièrement l’ordinateur.
Lorsque Direct Monitor est ON et que vous exécutez un changeur de voix :
- Vous entendez votre voix non traitée dans vos écouteurs immédiatement
- Votre flux, appel Discord ou enregistrement reçoit la voix traitée avec un décalage de latence
- Le résultat est une situation confuse de double surveillance : voix brute à vos oreilles, voix traitée partout ailleurs
La solution : Réglez le commutateur Direct Monitor sur OFF (la position du commutateur sans icône illuminée). Passez à la surveillance logicielle dans VoxBooster. Le chemin de surveillance logicielle a plus de latence que Direct Monitor (typiquement 5–20ms pour un effet non-AI, 250–550ms pour la synthèse vocale neurale selon le mode), mais cela signifie que vous entendez exactement ce que tout le monde entend.
Si vous n’utilisez VoxBooster que pour les effets vocaux non-AI (changement de pas, reverb, façonnage EQ), la latence de surveillance est imperceptible. Pour le mode de clonage vocal AI, le délai de traitement neural inhérent est présent quel qu’en soit le cas — éteindre Direct Monitor garantit simplement que votre surveillance correspond à votre sortie.
Configuration VoxBooster avec le Scarlett Solo
Installation et sélection d’appareil
Téléchargez VoxBooster et exécutez le programme d’installation. Aucun pilote kernel nécessaire — VoxBooster utilise low-latency audio capture et crée un microphone virtuel que Windows enregistre comme appareil audio standard. Les systèmes anti-triche et les politiques audio d’entreprise qui bloquent les logiciels au niveau du pilote ne l’affectent pas.
Après l’installation, ouvrez VoxBooster :
- Dans Paramètres → Entrée Audio, sélectionnez “Focusrite USB Audio” dans la liste des appareils.
- Définissez le taux d’échantillonnage sur 48000 Hz (correspondant à Focusrite Control 2 et les paramètres de son Windows).
- Activez Mode partagé low-latency audio capture (le standard pour VoxBooster ; le mode ASIO est également disponible si vous préférez une latence inférieure et ne pas exécuter d’autres applications low-latency audio capture simultanément).
- Définissez la taille du tampon pour correspondre à votre tampon Focusrite Control 2 (128 samples à 48 kHz ≈ environ 2,7ms).
Effets vocaux et clonage vocal
VoxBooster présente l’audio transformé sur un appareil microphone virtuel. Dans Discord, OBS, Zoom ou n’importe quelle application qui accepte une entrée microphone, sélectionnez “VoxBooster Virtual Microphone” comme appareil d’entrée. La chaîne de routage est :
Micro XLR → Préamplificateur matériel Scarlett Solo (Air ON)
→ ADC → Capture low-latency audio capture → Traitement VoxBooster
→ Microphone virtuel → Discord / OBS / Zoom
Pour les effets vocaux (changement de pas, reverb, robot, chipmunk, voix profonde), la chaîne entière ajoute moins de 20ms de latence sur une CPU milieu de gamme. Pour le clonage vocal AI — où le modèle neural re-synthétise la parole dans la timbre d’une voix cible — attendez 250–550ms selon la complexité du modèle vocal sélectionné et votre matériel. Pour la plupart des créateurs de contenu qui enregistrent dans un fichier ou diffusent sur Twitch, ce délai est invisible pour le public. Pour les appels en direct où vous attendez une rétroaction conversationnelle instantanée, testez votre modèle vocal préféré à votre charge CPU réelle avant de vous y engager en direct.
Pour une discussion plus large sur comment VoxBooster s’inscrit dans une chaîne audio de créateur de contenu, consultez notre guide changeur de voix pour créateurs de contenu.
Tableau d’ajustement fin de latence
| Taille du tampon (Focusrite Control 2) | Latence aller-retour (effet low-latency audio capture) | Convient pour |
|---|---|---|
| 32 samples | ~3–5ms | Surveillance basse latence ; exigeant en CPU |
| 64 samples | ~5–8ms | Recommandé pour effets vocaux |
| 128 samples | ~8–15ms | Standard ; sûr pour la plupart des configurations |
| 256 samples | ~15–25ms | Utiliser si pertes audio |
| 512 samples | ~25–50ms | Dépannage uniquement |
Pour le clonage vocal AI, la latence est dominée par le temps d’inférence neural, pas le tampon audio. Réduire la taille du tampon en dessous de 128 samples ne réduira pas sensiblement la latence de clonage mais peut réduire la stabilité du système sur certaines configurations.
Configuration de Discord avec le Scarlett Solo
Discord applique sa propre suppression de bruit et AGC à n’importe quel microphone que vous lui alimentez. Avec VoxBooster dans la chaîne, Discord traite la voix déjà modifiée — ce qui est bien. Deux paramètres à vérifier :
- Discord → Paramètres → Voice & Video → Appareil d’entrée : Réglez sur “VoxBooster Virtual Microphone.”
- Annulation d’écho : Laissez ON dans Discord même avec Direct Monitor OFF — la rétroaction acoustique des haut-parleurs est toujours possible.
- Suppression du bruit : Désactivez la suppression du bruit de Discord si la suppression du bruit de VoxBooster est active. Deux algorithmes en série introduisent plus d’artefacts qu’un seul.
Pour une procédure pas à pas du routage vocal Discord avec un microphone virtuel, consultez le guide de configuration Discord du changeur de voix.
Utilisation du Scarlett Solo pour la diffusion et OBS
Dans OBS Studio, ajoutez une nouvelle source de capture d’entrée audio :
- Appareil : VoxBooster Virtual Microphone
- Taux d’échantillonnage : 48000 Hz (défini dans les paramètres OBS → Audio)
OBS recevra alors l’audio traité par la voix pour votre flux. Vous pouvez également ajouter le Scarlett Solo comme deuxième source audio pour enregistrer votre voix brute sur une piste séparée en tant que sauvegarde — réglez cette source sur sans surveillance afin qu’elle ne se double pas dans le flux.
Lisez notre article complet changeur de voix pour créateurs de contenu pour un regard plus profond sur le flux de travail de diffusion.
Recommandations de microphone pour la configuration Scarlett Solo + Changeur de voix
Vous n’avez pas besoin d’un microphone coûteux pour obtenir de bons résultats de changement de voix — le préamplificateur du Scarlett Solo fait le travail lourd sur la qualité du signal. Cela dit, les caractéristiques du microphone interagissent avec le traitement vocal :
| Microphone | Type | Fantôme | Notes pour le changement de voix |
|---|---|---|---|
| Audio-Technica AT2020 | Condensateur | 48V requis | Brillant, détaillé ; excellent avec mode Air |
| Rode NT1 | Condensateur | 48V requis | Bruit d’auto-énorme extrêmement bas ; bon pour les salles calmes |
| Shure SM7B | Dynamique | Non requis | Standard de l’industrie ; gère bien la mise en scène de gain élevée |
| Shure SM58 | Dynamique | Non requis | Budget-friendly ; effet de proximité ajoute de la chaleur |
| AKG P220 | Condensateur | 48V requis | Motif cardioïde large ; utiliser un filtre anti-pop |
| Rode PodMic | Dynamique | Non requis | Construit pour la parole ; fonctionne bien avec le traitement vocal |
Pour une analyse dédiée sur la façon dont le choix du microphone affecte la qualité de sortie du changeur de voix, lisez le guide meilleur microphone pour changeur de voix.
Dépannage des problèmes courants
Pas de signal dans VoxBooster
- Confirmez que l’alimentation fantôme est ON si vous utilisez un microphone condensateur
- Vérifiez que les paramètres de son Windows affichent le Focusrite comme appareil d’enregistrement par défaut
- Dans les paramètres VoxBooster → Entrée Audio, confirmez que “Focusrite USB Audio” est sélectionné
- Redémarrez le pilote ASIO Focusrite à partir du Gestionnaire d’appareils si l’appareil s’est affiché mais ne montre pas l’audio
Pertes audio ou crépitement
- Augmentez la taille du tampon dans Focusrite Control 2 (128 → 256 → 512 samples de manière progressive)
- Désactivez l’économie d’énergie USB : Gestionnaire d’appareils → Contrôleurs de bus série universel → Concentrateur racine USB → Propriétés → Gestion d’alimentation → décochez “Permettre à l’ordinateur d’éteindre cet appareil pour économiser l’énergie”
- Essayez un port USB différent — évitez les hubs USB ; connectez le Solo directement à un port USB de la carte mère
- Fermez les applications d’arrière-plan qui ouvrent des appareils audio (logiciel de capture de jeu, applications de caméra virtuelle)
Écho ou rétroaction dans les écouteurs
- Confirmez que Direct Monitor est réglé sur OFF sur le panneau avant du Solo
- Dans Son Windows → Lecture → Propriétés Focusrite USB Audio → onglet Écoute → décochez “Écouter cet appareil”
- Si vous utilisez des haut-parleurs au lieu d’écouteurs, assurez-vous que l’annulation d’écho Discord ou OBS est activée
Le changeur de voix semble robotique ou sur-traité
- Baissez le niveau d’entrée sur le Solo (tournez le bouton de gain vers l’arrière) — les artefacts d’écrêtage produisent des harmoniques dures que les algorithmes vocaux amplifient
- Désactivez temporairement le mode Air pour exclure la brillance source contribuant aux artefacts
- Essayez dans VoxBooster un mode d’effet plus léger ou réduisez l’intensité du changement de pas
Focusrite Control 2 ne détecte pas l’appareil
- Réinstallez le pilote à partir de focusrite.com/downloads
- Essayez un câble USB-C différent — l’alimentation par bus et les données sur le même câble signifient qu’un câble défectueux cause une détection d’appareil intermittente
- Sous Windows 10, vérifiez que l’appareil Focusrite USB Audio n’est pas désactivé dans le Gestionnaire d’appareils
Comparaison du Scarlett Solo avec d’autres interfaces pour le changement de voix
| Interface | Prix | Fantôme | Air/Couleur | Latence ASIO | Remarques |
|---|---|---|---|---|---|
| Focusrite Scarlett Solo 4e Gén. | ~120 euros | 48V | Mode Air | Excellent | Meilleur rapport qualité-prix pour travail vocal solo |
| Focusrite Scarlett 2i2 | ~160 euros | 48V | Mode Air | Excellent | Deux entrées ; mieux pour instrument + micro |
| Behringer UMC22 | ~50 euros | 48V | Aucun | Bon | Option budget ; préamplificateur plus bruyant |
| PreSonus AudioBox USB 96 | ~100 euros | 48V | Aucun | Bon | Construction solide ; bruit de préamplificateur comparable |
| Universal Audio Apollo Twin X | ~900 euros | 48V | Unison DSP | Excellent | Effets DSP en entrée ; overkill pour utilisation changeur de voix |
Pour le travail vocal solo et le changement de voix, le Scarlett Solo est l’option de valeur maximale. Passez à 2i2 seulement si vous avez besoin de deux entrées simultanées. Le UA Apollo Twin ajoute du DSP embarqué — utile dans un contexte DAW, mais largement contourné quand un changeur de voix low-latency audio capture gère tout le traitement en logiciel.
Clonage vocal pour travail de voix-off avec le Scarlett Solo
Le préamplificateur propre du Scarlett Solo en fait une interface d’enregistrement de voix-off capable. L’appairer avec le clonage vocal AI de VoxBooster ouvre un chemin supplémentaire : enregistrement dans une voix et livraison de contenu dans une autre, de manière cohérente sur les sessions — utile pour les longs projets, la cohérence des personnages ou le maintien d’un persona de diffusion quand votre voix est fatiguée.
Pour un regard détaillé sur comment le clonage vocal AI s’inscrit dans la production de voix-off, consultez notre guide clonage vocal pour voix-off.
Conclusion
Le Focusrite Scarlett Solo 4e génération est le point d’entrée le plus propre et le plus accessible pour une configuration de changement de voix professionnel pour les créateurs de contenu à domicile. À 120 euros avec alimentation par bus, fantôme 48V pour les microphones condensateurs, mode Air pour relever instantanément la présence, et le support du pilote low-latency audio capture solide sur Windows, il élimine chaque variable matérielle qui peut compromettre la qualité de sortie du changeur de voix.
Les décisions de configuration clés sont simples une fois que vous comprenez la logique : 48V activé seulement quand le micro l’exige, mode Air activé pour les voix, Direct Monitor éteint afin de surveiller le signal traité, et mode partagé low-latency audio capture à 48 kHz pour le chemin le moins latent et le plus compatible vers VoxBooster.
De là, les effets vocaux et le clonage vocal AI fonctionnent à la limite de qualité de ce que votre audio source offre — et le préamplificateur du Scarlett Solo est plus que capable de livrer du matériel source vocal propre et percutant pour le traitement en temps réel.
Téléchargez VoxBooster — essai gratuit de 3 jours, Windows 10/11, aucun pilote kernel nécessaire.