Generador de Voz IA para Surtidores de Gasolina con Pago en Bomba

Cómo la IA de voz para surtidores impulsa los mensajes de Gilbarco Veeder-Root y Wayne Fueling Systems — inserte tarjeta, seleccione grado, tome recibo — con despliegues multilingüe Shell, BP, Chevron y Petrobras.

Generador de Voz IA para Surtidores de Gasolina con Pago en Bomba

La IA de voz para surtidores es la voz sintetizada que guía al cliente en cada paso de un dispensador de combustible con pago en bomba: “Por favor inserte su tarjeta”, “Seleccione el grado de combustible”, “Levante la boquilla e inicie el repostaje”, “Por favor tome su recibo”. Estos mensajes provienen de un sistema de audio integrado en los dispensadores Gilbarco Veeder-Root y Wayne Fueling Systems, las dos plataformas de hardware que dominan el mercado minorista de combustible en América del Norte. Esta guía explica cómo se construyen esos mensajes, cómo son el conjunto completo de audio, cómo Shell, BP, Chevron y Petrobras abordan la identidad de voz de marca, y cómo producir audio profesional para surtidores con un generador de voz IA moderno.


Resumen

  • Los surtidores con pago en bomba utilizan IA de voz sintetizada para guiar al cliente — insertar tarjeta, seleccionar grado, tomar recibo.
  • Gilbarco Veeder-Root y Wayne Fueling Systems son los principales fabricantes de hardware; su firmware reproduce archivos WAV cargados por el operador.
  • Shell, BP, Chevron y Petrobras mantienen guías de audio de marca; los sitios franquiciados varían.
  • Los surtidores multilingüe (inglés/español/portugués) son estándar en ubicaciones de alto tráfico en el sur y suroeste de EE. UU. y América Latina.
  • La producción de audio requiere ajustarse a las especificaciones WAV de bajo bitrate del hardware embebido del dispensador.
  • El motor de voz IA de VoxBooster genera y exporta el conjunto completo de mensajes en cualquier idioma, adaptado a las especificaciones del hardware.

Por qué los surtidores necesitan una voz IA consistente

Al acercarse a cualquier surtidor de autoservicio en América del Norte, la voz que se escucha no es la grabación de un empleado — es un sistema de mensajes sintetizados integrado en el hardware del dispensador. Las razones prácticas son evidentes. Una red de venta de combustible puede operar miles de ubicaciones en varios estados o países. Una sola actualización de mensaje — añadir un nuevo método de pago, modificar un aviso de seguridad o renovar el saludo de marca — exige reemplazar archivos de audio en miles de unidades. Esto solo es manejable si el audio se generó de forma coherente desde una biblioteca de guiones, no a partir de sesiones de grabación con actores de voz puntuales.

El otro factor es la precisión. Los mensajes de los surtidores guían al cliente a través de una transacción monetaria real en un equipo físico al aire libre. Los mensajes ambiguos o inaudibles crean fricción: clientes que no entienden si el surtidor aceptó su tarjeta, no identifican la boquilla correcta o se pierden el aviso del recibo terminan entrando a la tienda a hablar con el cajero — lo que frustra el propósito del pago en bomba.

Las redes que han invertido en mensajes de voz IA claros y bien producidos registran de manera consistente menos interrupciones en el servicio al cliente, menos transacciones abortadas en la bomba y mejor fluidez en horas pico.

Gilbarco Veeder-Root y Wayne Fueling Systems: Las plataformas de hardware

Entender la producción de voz para surtidores comienza por el hardware. En América del Norte, dos fabricantes dominan el mercado de dispensadores:

Gilbarco Veeder-Root (empresa de Fortive) produce las líneas Encore, Edge y Passport. Sus dispensadores están ampliamente desplegados en sitios Chevron, BP e independientes. El sistema de audio embebido de Gilbarco reproduce archivos WAV precargados desde la memoria flash interna. El controlador de la instalación — típicamente un Passport de Gilbarco o un TPV de terceros integrado vía API — determina qué mensajes de audio se activan en cada estado de la transacción.

Wayne Fueling Systems (marca de Enovis) produce los dispensadores Ovation, Helix e iXPay. El hardware Wayne domina en muchos sitios Shell, ExxonMobil y grandes cadenas. Los dispensadores Wayne también usan una biblioteca de audio de firmware con archivos WAV, y la plataforma de gestión en la nube Wayne Nucleus permite a los operadores enviar actualizaciones de audio de forma remota a toda una flota.

Ambas plataformas tienen hardware heredado en el campo que solo acepta WAV PCM a 8 kHz o 16 kHz, una frecuencia de muestreo proveniente del hardware de dispensadores de principios de los años noventa. El hardware de nueva generación admite 44,1 kHz, lo que mejora notablemente la calidad de la voz. Al producir para flotas mixtas, lo más seguro es generar a 44,1 kHz y remuestrear a 16 kHz para los equipos más antiguos.

CaracterísticaGilbarco Veeder-RootWayne Fueling Systems
Modelos principalesEncore, Edge, PassportOvation, Helix, iXPay
Redes comunesChevron, BP, independientesShell, ExxonMobil, cadenas
Formato de audio (legado)WAV PCM 16 bits, 8–16 kHzWAV PCM 16 bits, 8–16 kHz
Formato de audio (nuevo)WAV 44,1 kHz (Encore 700 S)WAV 44,1 kHz (Helix)
Actualización remotaControlador PassportWayne Nucleus cloud
Soporte multilingüeSí, un archivo por idiomaSí, un archivo por idioma

El conjunto completo de mensajes de audio para surtidores

Un sistema de audio bien diseñado para pago en bomba cubre cada estado de la transacción. A continuación, una tabla de referencia para un despliegue completo:

ID de mensajeTexto (español neutro)Estado de activación
BIENVENIDA”Bienvenido. Por favor inserte o acerque su tarjeta.”Acercamiento del cliente
INSERTAR_TARJETA”Por favor inserte su tarjeta en la ranura.”Tarjeta aún no detectada
PAGO_SIN_CONTACTO”Acerque su tarjeta o teléfono para pagar sin contacto.”NFC activado, sin tarjeta insertada
INGRESO_PIN”Por favor ingrese su PIN y presione Aceptar.”Tarjeta con chip detectada
CODIGO_POSTAL”Por favor ingrese el código postal de su dirección de facturación.”Verificación ZIP de tarjeta de crédito
LAVADO”¿Desea agregar un lavado de auto hoy?”Oferta tras autorización
SELECCION_GRADO”Por favor seleccione el grado de combustible.”Autorización aprobada
LEVANTAR_BOQUILLA”Levante la boquilla e inicie el repostaje.”Grado seleccionado
INICIO_REPOSTAJE”El repostaje ha comenzado.”Sensor de flujo de boquilla activo
FIN_REPOSTAJE”Repostaje completo.”Boquilla devuelta
OFERTA_RECIBO”¿Desea un recibo? Presione Sí o No.”Cierre de transacción
IMPRIMIR_RECIBO”Por favor tome su recibo.”Recibo en impresión
SIN_RECIBO”Gracias. Tenga un buen viaje.”Sin recibo seleccionado
TARJETA_RECHAZADA”Su tarjeta no fue aprobada. Por favor intente con otra tarjeta.”Autorización denegada
FALLO_BOMBA”Esta bomba está temporalmente fuera de servicio. Por favor diríjase a caja.”Fallo de hardware
ERROR_BOQUILLA”Boquilla no detectada. Cuelgue la boquilla e intente de nuevo.”Fallo del sensor de boquilla

Producir todos los mensajes desde una misma sesión del generador de voz IA garantiza la consistencia vocal a lo largo de la transacción.

Shell, BP, Chevron y Petrobras: Guías de audio de marca

Las principales petroleras tienen estándares de voz de marca que van más allá de elegir un género de voz. Así es como las cuatro redes más grandes abordan la identidad de audio en la bomba:

Shell mantiene una voz de marca global que prioriza la claridad y la accesibilidad. Los dispensadores Shell en sitios de propiedad corporativa usan una voz femenina neutra con acento norteamericano moderado en EE. UU. Los sitios Shell internacionales adaptan el perfil de voz a los estándares regionales, pero mantienen el mismo tono amable y sin presiones. Las guías de audio de Shell especifican umbrales mínimos de inteligibilidad medidos con el índice STIPA (Speech Transmission Index for Public Address) en el hardware de altavoces al exterior.

BP (British Petroleum) utiliza una voz igualmente neutra para su red en EE. UU., a menudo con una entonación ligeramente más cálida que la de las redes competidoras. La red global de BP abarca suficientes regiones como para que su equipo de audio mantenga variantes en inglés norteamericano, inglés británico, alemán, holandés y varios otros mercados.

Chevron (que también opera sitios Texaco en muchos mercados) adopta un enfoque más funcional en el audio de sus bombas — la voz es limpia y directa más que cálida o marcada. El requisito bilingüe inglés/español de Chevron en sitios de California es uno de los más estrictos del mercado norteamericano.

Petrobras opera la mayor red minorista de combustible en América Latina, con miles de sitios en Brasil. El audio de las bombas Petrobras es principalmente en portugués brasileño (pt-BR), con un perfil fonético marcadamente diferente al del portugués europeo — los sonidos vocálicos, la prosodia y la entonación son lo suficientemente distintos como para que usar un modelo de voz de PT-EU en sitios brasileños produzca un resultado notablemente antinatural.

Audio multilingüe para surtidores: Inglés, Español y Portugués

El requisito multilingüe más común en la venta minorista de combustible en América del Norte es inglés y español. En estados con grandes poblaciones hispanas — California, Texas, Florida, Arizona, Nuevo México — los operadores enfrentan tanto presión comercial como requisitos regulatorios para ofrecer mensajes en español.

La elección del registro para el audio de surtidores en español sigue la misma convención que los sistemas IVR de aerolíneas y bancos: el formal “usted” en lugar del informal “tú”. Un terminal de pago que se dirige al cliente de manera informal transmite falta de profesionalismo en el mercado latinoamericano.

El pipeline de detección de idioma en un surtidor multilingüe funciona así:

  1. El terminal de pago lee el BIN (Bank Identification Number) de la tarjeta. Algunos emisores incluyen metadatos de idioma en el BIN que permiten al dispensador inferir el idioma preferido.
  2. La pantalla táctil muestra un selector de idioma al inicio de la transacción — típicamente como icono de bandera o indicación “English / Español / Português”.
  3. El controlador de la instalación dirige la elección de idioma del cliente al reproductor de audio del firmware, que reproduce la pista correcta para cada paso posterior.
  4. Si no se realiza ninguna selección dentro de un tiempo límite, el dispensador pasa al idioma predeterminado.

Producir un conjunto de mensajes en tres idiomas — inglés, español, portugués — significa tres versiones de cada mensaje en la tabla anterior, aproximadamente 48–60 archivos de audio en total, generados desde el mismo guión maestro.

Ingeniería de audio para altavoces externos de dispensadores

El entorno acústico en la explanada de una gasolinera es hostil para la claridad del habla. El ruido ambiente incluye:

  • Ruido de tráfico: 65–80 dB SPL en una vía arterial transitada
  • Eco de la marquesina: las superficies metálicas o de fibra de vidrio crean reflexiones tempranas que difuminan las consonantes
  • Viento: ráfagas de 15–30 km/h añaden ruido de banda ancha
  • Ruido de motor: vehículos del cliente al ralentí a 50–60 dB

El altavoz del dispensador suele ser un cono de gama completa pequeño (7–10 cm) en una carcasa plástica sellada, con una respuesta en frecuencia que cae por debajo de 200 Hz y por encima de 8 kHz.

Optimizar el audio de voz IA para altavoces externos de dispensadores requiere el mismo tratamiento de ecualización que otros sistemas de megafonía exterior:

Paso 1 — Filtro paso alto a 200 Hz

Aplique un filtro paso alto Butterworth de 24 dB/octava a 180–200 Hz. La energía por debajo de ese umbral crea distorsión dentro de la carcasa en lugar de sonido audible.

Paso 2 — Realce de presencia a 2–4 kHz

La banda de 2–4 kHz es donde viven las consonantes más importantes del habla. Un realce de +2 a +3 dB mejora significativamente la inteligibilidad en entornos ruidosos sin que la voz suene áspera.

Paso 3 — Normalización de picos

Apunte a picos a -3 dBFS con un limitador a -1 dBFS. Los reproductores de audio de los dispensadores suelen usar niveles de ganancia fijos en el firmware; mantener niveles de pico consistentes en todos los archivos evita que algunos mensajes suenen notablemente más altos o bajos que otros.

Paso 4 — Formato de exportación

Hardware legado Gilbarco Veeder-Root y Wayne: WAV PCM 16 bits, 16 kHz (u 8 kHz para las unidades más antiguas). Hardware de nueva generación: WAV PCM 16 bits o 24 bits, 44,1 kHz.

Estos pasos de procesamiento son idénticos en principio a la optimización necesaria para mensajes de voz en estaciones de carga de vehículos eléctricos y sistemas de megafonía en estacionamientos.

Flujo de trabajo paso a paso para producir mensajes de voz para surtidores

1. Construir el guión maestro

Cree un documento con cada mensaje organizado por ID, estado de activación, texto, idioma y notas. Para despliegues bilingües, añada una columna por idioma.

2. Elegir un perfil de voz consistente

Seleccione un único modelo de voz y aplique la misma velocidad de locución y parámetros de pausa en todos los mensajes. Una velocidad cómoda para mensajes de surtidores es de 130–145 palabras por minuto.

3. Generar y aplicar la cadena de procesamiento exterior

Genere cada mensaje y aplique la cadena de EQ descrita anteriormente: paso alto a 180–200 Hz, realce de presencia a 2–4 kHz, normalización de picos a -3 dBFS, limitador a -1 dBFS. Exporte en el formato requerido por el hardware objetivo.

4. Control de calidad en condiciones exteriores

Pruebe los archivos exportados a través de un altavoz que se aproxime al hardware del dispensador en un entorno exterior con ruido ambiente. Si las consonantes no se distinguen claramente, revise el realce de presencia y la velocidad de locución.

5. Control de versiones y mantenimiento

Los mensajes de surtidores requieren mantenimiento continuo. Un generador de voz IA agiliza esto: actualice el guión, regenere los archivos afectados, aplique la cadena de procesamiento y envíe al controlador de la instalación.

VoxBooster para la producción de audio de surtidores

El motor de voz IA de VoxBooster gestiona la producción sistemática y de alto volumen que requieren los despliegues de surtidores. Usted programa cada mensaje, elige entre varios perfiles de voz, genera el audio y exporta en el formato WAV que requiere su hardware. Para despliegues multilingüe — inglés, español y portugués brasileño como el trío más común en América del Norte — VoxBooster produce todas las variantes de idioma desde la misma biblioteca de guiones.

Para contextos relacionados de producción de voz IA con requisitos de ingeniería de audio similares, consulte nuestras guías sobre voz IA para estaciones de carga de VE y voz IA para estacionamientos. Para venta minorista con autoservicio, voz IA para cajas de autopago cubre requisitos de hardware y accesibilidad similares. Para flujos de trabajo más amplios de producción de contenido de voz, clonación de voz para doblaje y herramientas de voz IA para creadores de contenido ofrecen contexto adicional.

Accesibilidad y cumplimiento normativo en el dispensador

El cumplimiento de la ADA para dispensadores de combustible tiene requisitos de audio específicos. Los mensajes de audio deben estar disponibles en cada paso de la transacción sin necesidad de que el cliente active un modo de accesibilidad. El audio debe reproducirse a través de una toma de auriculares de 3,5 mm estándar en el dispensador. El volumen debe ser ajustable por el cliente.

El requisito de la toma de auriculares es significativo desde el punto de vista de la producción: los mismos archivos de audio que se reproducen por el altavoz exterior también se reproducen a través de la salida de auriculares. Esto significa que el tratamiento de EQ exterior debe ser moderado — +2 dB en 2–4 kHz en lugar de +4 dB — para mejorar la inteligibilidad exterior sin resultar áspero a través de los auriculares.

Preguntas frecuentes

¿Qué es la IA de voz para surtidores de gasolina?

La IA de voz para surtidores es un sistema de síntesis de texto a voz integrado en los dispensadores de combustible con pago en bomba. Reproduce mensajes de audio programados en cada paso de la transacción — insertar tarjeta, seleccionar grado, levantar la boquilla, iniciar el repostaje, tomar el recibo — sin necesitar operadores en vivo que guíen al cliente a través de la secuencia de pago y repostaje.

¿Quién produce la voz en los surtidores de gasolina?

El audio de los surtidores lo produce el fabricante del dispensador o el equipo de marca de la petrolera. Gilbarco Veeder-Root y Wayne Fueling Systems son los dos fabricantes de hardware dominantes en América del Norte. El firmware de sus dispensadores reproduce archivos WAV cargados por el operador, generados con herramientas de voz IA o grabados con actores de voz según la generación del equipo.

¿Puede un generador de voz IA crear mensajes para surtidores?

Sí. Un generador de voz IA moderno permite programar toda la secuencia de transacción en la bomba y exportar archivos de audio en el formato WAV que requiere el firmware del dispensador. Es posible producir el mismo guión en inglés, español, portugués u otros idiomas desde un mismo flujo de trabajo, sin contratar actores de voz por separado para cada idioma.

¿Qué mensajes de audio necesita un surtidor de gasolina?

Un conjunto completo de audio para dispensadores incluye: saludo de bienvenida, solicitud de inserción de tarjeta o pago sin contacto, instrucción de PIN, oferta de lavado de auto, selección de grado (regular, plus, premium, diésel), instrucción de levantar la boquilla, confirmación de inicio de repostaje, fin de repostaje, oferta de recibo, cierre de agradecimiento y mensajes de error.

¿Cómo funcionan los mensajes multilingüe en los surtidores?

Los dispensadores multilingüe detectan el idioma preferido del cliente a través del terminal de pago, el sistema del operador o un selector de idioma en pantalla al inicio de la transacción. El firmware reproduce el archivo de audio correspondiente en cada paso. Los generadores de voz IA producen el conjunto completo de mensajes en cada idioma requerido desde los mismos guiones maestros.

¿Qué formato de audio utilizan los dispensadores de combustible?

La mayoría de los dispensadores Gilbarco Veeder-Root y Wayne Fueling Systems aceptan archivos WAV PCM de 16 bits a 8 kHz o 16 kHz. Las plataformas más recientes admiten 44,1 kHz. Consulte siempre la documentación del controlador de la instalación antes de producir la exportación final.

¿Cómo gestionan Shell, BP y Chevron la identidad de voz en las bombas?

Shell, BP, Chevron y Petrobras mantienen guías de audio de marca que especifican tono, ritmo e idioma del saludo para sus redes. Los sitios de propiedad corporativa siguen esas normas de cerca; los sitios franquiciados independientes suelen usar los mensajes predeterminados del fabricante. Los generadores de voz IA permiten que las redes de marca produzcan audio consistente en miles de sitios sin nuevas grabaciones para cada actualización de guión.

Conclusión

La IA de voz para surtidores no es infraestructura llamativa, pero es infraestructura que gestiona millones de interacciones con clientes cada día en redes de venta de combustible construidas sobre dispensadores Gilbarco Veeder-Root y Wayne Fueling Systems. Lograr que los mensajes sean correctos — claros, con una voz consistente, multilingüe cuando se requiere, conformes con la ADA y adaptados a los límites acústicos del altavoz del hardware — marca la diferencia entre una transacción que se completa sin problemas y una que termina con el cliente entrando a preguntar al cajero qué dijo el surtidor.

Shell, BP, Chevron y Petrobras han invertido en guías de audio de marca porque comprenden que la voz del surtidor es un punto de contacto de marca en cada transacción de repostaje. Si produce audio para surtidores — ya sea para un sitio de un solo operador o una flota multinacional — VoxBooster proporciona las herramientas de generación de voz IA para construir y mantener el conjunto completo de mensajes. La prueba gratuita de 3 días le permite generar una secuencia de transacción de muestra y exportarla en el formato WAV que requiere su hardware antes de comprometerse con una producción completa.

Prueba VoxBooster — 3 días gratis.

Clonación de voz en tiempo real, soundboard y efectos — donde ya hablas.

  • Sin tarjeta
  • ~30ms de latencia
  • Discord · Teams · OBS
Probar 3 días gratis