Générateur de voix IA pour les systèmes d'annonceurs à bord des bus

Comment fonctionne la voix IA pour annonceurs de bus — annonces de arrêts déclenchées par GPS, matériel Clever Devices et Luminator, conformité ADA, NYC MTA, London Buses, Tokyo Toei Bus et comment créer de l'audio PA de qualité transit.

Générateur de voix IA pour les systèmes d’annonceurs à bord des bus

La voix IA pour annonceurs de bus est le système qui travaille silencieusement chaque fois qu’un bus de ville vous dit que le prochain arrêt approche — et il est devenu bien plus sophistiqué que la plupart des passagers ne le réalisent. Ce qui ressemble à un simple message préenregistré est de plus en plus un événement de synthèse neuronale en direct : les coordonnées GPS déclenchent une chaîne de texte, un moteur TTS embarqué la convertit en parole en moins de 300 millisecondes, et l’audio atteint les haut-parleurs de la cabine avant que le bus n’ait parcouru 30 mètres de plus.


En bref

  • Les annonces de bus à bord sont générées par TTS neuronal déclenché par GPS, pas par des banques de clips — permettant des appels d’arrêts précis et dynamiques pour toute modification de route en temps réel.
  • Clever Devices et Luminator sont les principaux fournisseurs de matériel nord-américains ; les deux prennent en charge la synthèse vocale neuronale.
  • NYC MTA, London Buses et Tokyo Toei Bus utilisent chacun des caractères vocaux distincts et des stratégies bilingues adaptées à leurs passagers.
  • La conformité ADA (49 CFR Part 37) exige des annonces d’arrêts automatisées ; la synthèse IA satisfait à cela et produit des journaux de conformité vérifiables.
  • La même technologie peut générer de l’audio PA de bus réaliste pour des jeux, des films et des simulations de transport.

Comment fonctionnent les systèmes d’annonces de bus déclenchés par GPS

Le système d’information automatique des passagers (APIS) dans un bus de transport en commun moderne est un petit ordinateur embarqué qui intègre le positionnement GPS, les données d’horaires de route, un moteur TTS, le contrôle de l’amplificateur PA et la gestion des affichages des passagers :

  1. Positionnement GPS — le calculateur du véhicule suit la position à intervalles de 1 seconde
  2. Déclencheur de géofence — quand le véhicule entre dans la zone d’approche d’un arrêt
  3. Construction du texte — le système assemble le texte d’annonce à partir d’un modèle
  4. Synthèse TTS — le moteur TTS convertit le texte en forme d’onde audio en moins de 300 ms
  5. Acheminement audio — le contrôleur PA achemine l’audio vers les haut-parleurs de cabine
  6. Journalisation de conformité — l’APIS enregistre chaque événement d’annonce pour le reporting ADA

Clever Devices et Luminator : le matériel derrière la voix IA des bus

Clever Devices

Clever Devices est le plus grand fournisseur APIS en Amérique du Nord, avec des déploiements à MTA New York City Transit, Chicago CTA et des dizaines d’agences de transport plus petites. Leur unité IVIU combine GPS, cellulaire, ordinateur de bord, amplification PA et logiciel de gestion des annonces.

Clever Devices prend en charge plusieurs moteurs TTS et dispose d’un mode bilingue : les lignes peuvent être configurées pour délivrer des annonces dans deux langues séquentiellement.

Luminator Technology Group

Luminator est particulièrement fort dans les systèmes de transport européens et canadiens. Leur infrastructure de synthèse vocale prend en charge un modèle de marque de comédien de voix : les agences peuvent commander un modèle vocal sur mesure formé sur un comédien professionnel spécifiquement recruté. La voix féminine britannique caractéristique sur London Buses en est un exemple bien connu.

FonctionnalitéClever Devices IVIULuminator ATPIS
Marché principalAmérique du NordAmérique du Nord + Europe
Architecture TTSEmbarqué + hybride cloud-edgeNeural embarqué
Support bilingueDouble moteur séquentielSéquentiel et basé sur les zones
Option comédien personnaliséNonOui

NYC MTA : la complexité d’une flotte de 5 800 véhicules

La flotte de bus locaux de MTA est l’une des plus grandes au monde — plus de 5 800 véhicules sur environ 300 lignes. Le système d’annonces à bord fonctionne sur matériel Clever Devices. La voix anglaise tourne à un rythme légèrement plus lent que la parole conversationnelle — environ 145-155 mots par minute. Pour le service bilingue, certaines lignes principales délivrent des paires d’annonces anglais-espagnol séquentielles.

London Buses : une voix cohérente sur un réseau franchisé

Transport for London (TfL) n’exploite pas directement la plupart des services de bus — il franchit les lignes à des opérateurs privés. TfL a résolu cela via une spécification APIS mandatée dans les contrats des opérateurs de bus. La voix féminine britannique caractéristique sur les bus londoniens est un modèle vocal commandé par TfL déployé uniformément sur tout le réseau.

Le système londonien utilise un dictionnaire phonétique de plusieurs milliers de noms de rues et de quartiers londoniens — beaucoup d’entre eux sont prononcés de façon contre-intuitive.

Tokyo Toei Bus : synthèse bilingue et conventions d’annonces culturelles

Les annonces à bord des bus japonais sont nettement plus longues que leurs équivalents occidentaux. Une annonce d’approche typique du Toei Bus comprend : le nom de l’arrêt actuel, un rappel poli de se préparer à descendre, le nom du prochain arrêt et parfois un rappel de correspondance. Chaque élément est délivré au rythme mesuré caractéristique de la communication par haut-parleur public japonaise — environ 130-140 mots par minute en japonais.

Conformité ADA : ce que la réglementation exige vraiment

Le 49 CFR 37.167(b) exige que les agences de transport annoncent les arrêts aux :

  • Points de correspondance avec d’autres lignes fixes
  • Intersections principales et points de destination
  • Intervalles suffisants le long de la route pour orienter les passagers malvoyants
Exigence ADAComment l’annonceur IA de bus y satisfait
Annoncer les points de correspondanceDéclenché par GPS à tous les arrêts de correspondance désignés
Annoncer les intersections principalesLa base de données d’arrêts inclut des balises d’intersection
Annoncer à intervalles suffisantsAnnonces à intervalles configurables
Audible dans tout le véhiculePA calibré sur le modèle acoustique du véhicule
Support des arrêts à la demandeTTS déclenché par bouton à la demande

Le défi acoustique de l’audio en cabine de bus

La cabine d’un bus est acoustiquement hostile. La chaîne DSP pour bus PA :

Étape DSPRéglage pour bus PAJustification
Filtre passe-haut200 Hz, 2e ordreSupprimer les sous-basses
Emphase passe-bande+4 dB à 1-3 kHzBooster la bande d’intelligibilité
Filtre coupe-hautRolloff à 5 kHzSupprimer les aigus hors portée des haut-parleurs
CompressionRapport 6:1, threshold -15 dB, attaque 5msÉviter l’écrêtage de l’amplificateur PA
Limiteur-2 dBFS True PeakPlafond absolu

Créer de l’audio PA de bus pour des projets créatifs

Étape 1 — Choisir un modèle vocal. Pour un style NYC MTA, choisissez une voix féminine américaine anglaise neutre. Pour un style London Buses, une voix féminine britannique en Received Pronunciation.

Étape 2 — Cloner et entraîner. Utilisez un outil de clonage vocal IA pour créer un modèle à partir de 2-4 minutes d’audio source propre. VoxBooster gère cela sur matériel Windows 10/11 standard, en fonctionnant localement.

Étape 3 — Écrire vos scripts. Gardez chaque annonce d’arrêt à un maximum d’une phrase composée. Utilisez le présent continu pour les appels d’approche.

Étape 4 — Synthétiser en WAV propre. Générer chaque annonce à 44,1 kHz, WAV 16 bits.

Étape 5 — Appliquer la chaîne DSP bus PA. Passe-haut à 200 Hz, boost passe-bande à 1-3 kHz, compression 6:1, coupe-haut à 5 kHz, limite absolue à -2 dBFS.


La voix IA pour annonceurs de bus a transformé ce qui était autrefois un patchwork de clips préenregistrés en un système fiable, vérifiable et multilingue. Pour les créateurs et développeurs qui ont besoin d’audio PA de bus de qualité transit sans budgets d’agence de transport, le pipeline est le même en miniature. VoxBooster gère le clonage vocal et la synthèse sur Windows 10/11, avec un essai gratuit de 3 jours.

Télécharger VoxBooster — essai gratuit de 3 jours, sans carte de crédit requise.

Essayez VoxBooster — essai gratuit de 3 jours.

Clonage vocal en temps réel, soundboard et effets — partout où vous parlez déjà.

  • Sans carte bancaire
  • ~30 ms de latence
  • Discord · Teams · OBS
Essayer gratuitement 3 jours