Gerador de Voz com IA para Bombas de Gasolina com Pagamento no Posto
A IA de voz para bombas de gasolina é a voz sintetizada que guia o cliente em cada etapa de um dispensador de combustível com pagamento na bomba: “Por favor, insira o seu cartão”, “Selecione o grau do combustível”, “Levante o bico e inicie o abastecimento”, “Por favor, retire o seu recibo”. Esses prompts vêm de um sistema de áudio integrado nos dispensadores Gilbarco Veeder-Root e Wayne Fueling Systems, as duas plataformas de hardware que dominam o mercado varejista de combustível na América do Norte. Este guia explica como esses prompts são construídos, como é o conjunto completo de áudio, como Shell, BP, Chevron e Petrobras abordam a identidade de voz de marca, e como produzir áudio profissional para bombas de gasolina com um gerador de voz IA moderno.
Resumo
- As bombas de gasolina com pagamento no posto utilizam IA de voz sintetizada para guiar o cliente — inserir cartão, selecionar grau, retirar recibo.
- Gilbarco Veeder-Root e Wayne Fueling Systems são os principais fabricantes de hardware; seu firmware reproduz arquivos WAV carregados pelo operador.
- Shell, BP, Chevron e Petrobras mantêm diretrizes de áudio de marca; postos franqueados variam.
- Bombas multilíngues (inglês/espanhol/português) são padrão em locais de alto tráfego no sul dos EUA, na América Latina e no Brasil.
- A produção de áudio requer correspondência com as especificações WAV de baixo bitrate do hardware embarcado do dispensador.
- O motor de voz IA do VoxBooster gera e exporta o conjunto completo de prompts em qualquer idioma, ajustado às especificações do hardware.
Por que as bombas de gasolina precisam de voz IA consistente
Ao se aproximar de qualquer dispensador de autoatendimento na América do Norte, a voz ouvida não é a gravação de um funcionário — é um sistema de prompts sintetizados integrado no hardware do dispensador. As razões práticas são evidentes. Uma rede de varejo de combustível pode operar milhares de postos em vários estados ou países. Uma única atualização de prompt — adicionando um novo método de pagamento, alterando um aviso de segurança ou renovando a saudação da marca — exige a substituição de arquivos de áudio em milhares de unidades. Isso só é gerenciável se o áudio foi gerado de forma consistente a partir de uma biblioteca de roteiros, e não em sessões de gravação avulsas com dubladores.
O outro fator é a precisão. Os prompts da bomba guiam o cliente por uma transação financeira real em um equipamento físico ao ar livre. Prompts ambíguos ou inaudíveis criam atrito: clientes que não entendem se a bomba aceitou o cartão, não identificam o bico correto ou perdem o aviso do recibo acabam indo ao caixa dentro da loja — o que frustra o propósito do pagamento na bomba.
Gilbarco Veeder-Root e Wayne Fueling Systems: As plataformas de hardware
Gilbarco Veeder-Root (empresa da Fortive) produz as linhas Encore, Edge e Passport. Seus dispensadores estão amplamente implantados em postos Chevron, BP e independentes. O sistema de áudio embarcado da Gilbarco reproduz arquivos WAV pré-carregados a partir da memória flash interna. O controlador da instalação — tipicamente um Passport da Gilbarco ou um PDV de terceiros integrado via API — determina quais prompts de áudio são ativados em cada estado da transação.
Wayne Fueling Systems (marca da Enovis) produz os dispensadores Ovation, Helix e iXPay. O hardware Wayne domina em muitos postos Shell, ExxonMobil e grandes redes. Os dispensadores Wayne também utilizam uma biblioteca de áudio de firmware com arquivos WAV, e a plataforma de gerenciamento em nuvem Wayne Nucleus permite que os operadores enviem atualizações de áudio remotamente para toda uma frota.
Ambas as plataformas possuem hardware legado em campo que aceita apenas WAV PCM a 8 kHz ou 16 kHz — uma taxa de amostragem herdada do hardware de dispensadores do início dos anos 1990. Hardware de nova geração suporta 44,1 kHz, o que melhora drasticamente a qualidade da voz. Ao produzir para frotas mistas, o mais seguro é gerar a 44,1 kHz e fazer downsample para 16 kHz nas unidades mais antigas.
| Característica | Gilbarco Veeder-Root | Wayne Fueling Systems |
|---|---|---|
| Modelos principais | Encore, Edge, Passport | Ovation, Helix, iXPay |
| Redes comuns | Chevron, BP, independentes | Shell, ExxonMobil, redes |
| Formato de áudio (legado) | WAV PCM 16 bits, 8–16 kHz | WAV PCM 16 bits, 8–16 kHz |
| Formato de áudio (novo) | WAV 44,1 kHz (Encore 700 S) | WAV 44,1 kHz (Helix) |
| Atualização remota | Controlador Passport | Wayne Nucleus cloud |
| Suporte multilíngue | Sim, um arquivo por idioma | Sim, um arquivo por idioma |
O conjunto completo de prompts de áudio para bombas de combustível
Um sistema de áudio bem projetado para pagamento na bomba cobre cada estado da transação. Abaixo, uma tabela de referência para um implantação completa em pt-BR:
| ID do prompt | Texto (português brasileiro) | Estado de ativação |
|---|---|---|
| BOAS_VINDAS | ”Bem-vindo. Por favor, insira ou aproxime o seu cartão.” | Aproximação do cliente |
| INSERIR_CARTAO | ”Por favor, insira o cartão na entrada.” | Cartão ainda não detectado |
| PAGAMENTO_APROXIMACAO | ”Aproxime o cartão ou o celular para pagar por aproximação.” | NFC ativado, sem cartão inserido |
| DIGITAR_SENHA | ”Por favor, digite sua senha e pressione Confirmar.” | Cartão com chip detectado |
| CEP_COBRANCA | ”Por favor, informe o CEP do seu endereço de cobrança.” | Verificação de cartão de crédito |
| LAVAGEM | ”Deseja adicionar uma lavagem do veículo hoje?” | Oferta após autorização |
| SELECAO_COMBUSTIVEL | ”Por favor, selecione o tipo de combustível.” | Autorização aprovada |
| LEVANTAR_BICO | ”Levante o bico e inicie o abastecimento.” | Tipo selecionado |
| INICIO_ABASTECIMENTO | ”Abastecimento iniciado.” | Sensor de fluxo do bico ativo |
| FIM_ABASTECIMENTO | ”Abastecimento concluído.” | Bico devolvido |
| OFERTA_RECIBO | ”Deseja recibo? Pressione Sim ou Não.” | Encerramento da transação |
| IMPRIMIR_RECIBO | ”Por favor, retire o seu recibo.” | Recibo imprimindo |
| SEM_RECIBO | ”Obrigado. Boa viagem.” | Sem recibo selecionado |
| CARTAO_RECUSADO | ”Seu cartão não foi aprovado. Por favor, tente com outro cartão.” | Autorização negada |
| FALHA_BOMBA | ”Esta bomba está temporariamente fora de serviço. Por favor, dirija-se ao caixa.” | Falha de hardware |
| ERRO_BICO | ”Bico não detectado. Pendure o bico e tente novamente.” | Falha do sensor de bico |
Shell, BP, Chevron e Petrobras: Diretrizes de áudio de marca
Shell mantém uma voz de marca global que enfatiza clareza e acessibilidade. Postos Shell de propriedade corporativa nos EUA usam uma voz feminina neutra com sotaque norte-americano moderado. As diretrizes de áudio da Shell especificam padrões mínimos de inteligibilidade medidos pelo índice STIPA (Speech Transmission Index for Public Address) no hardware de alto-falante ao ar livre.
BP (British Petroleum) usa uma voz igualmente neutra para sua rede nos EUA, frequentemente com entonação ligeiramente mais calorosa do que as redes concorrentes. A rede global da BP abrange regiões suficientes para que sua equipe de áudio mantenha variantes em inglês norte-americano, inglês britânico, alemão, holandês e vários outros mercados.
Chevron (que também opera postos Texaco em muitos mercados) adota uma abordagem mais funcional para o áudio da bomba — a voz é limpa e direta em vez de notavelmente calorosa ou marcada. O requisito bilíngue inglês/espanhol da Chevron em postos da Califórnia é um dos mais rigorosos no mercado norte-americano.
Petrobras opera a maior rede varejista de combustível da América Latina, com milhares de postos no Brasil. O áudio das bombas Petrobras é principalmente em português brasileiro (pt-BR), com um perfil fonético marcadamente diferente do português europeu — os sons vocálicos, a prosódia e os contornos de entonação são suficientemente distintos para que o uso de um modelo de voz PT-EU em postos brasileiros produza um resultado visivelmente antinatural. Geradores de voz IA que suportam pt-BR nativamente são essenciais para este mercado.
Áudio multilíngue para bombas: Inglês, Espanhol e Português
O requisito multilíngue mais comum no varejo de combustível norte-americano é inglês e espanhol. Em estados com grandes populações hispânicas — Califórnia, Texas, Flórida, Arizona, Novo México — os operadores enfrentam tanto pressão comercial quanto requisitos regulatórios para oferecer prompts em espanhol.
A escolha do registro para o espanhol em bombas de gasolina segue a mesma convenção dos sistemas IVR de companhias aéreas e bancos: o formal “usted” em vez do informal “tú”.
Os requisitos de português são mais especializados. O varejo de combustível nos EUA geralmente não exige português em escala, mas operadores no sul da Flórida (que tem uma grande comunidade brasileira) e em qualquer corredor de trânsito fronteiriço podem implantar pt-BR como terceiro idioma. Mais significativamente, qualquer operador implantando a Petrobras ou outras redes latino-americanas precisa de produção de voz genuína em pt-BR — não espanhol com mudança de vogais, não PT-EU, mas português brasileiro com acentuação e prosódia corretas.
O pipeline de detecção de idioma em uma bomba multilíngue funciona assim:
- O terminal de pagamento lê o BIN (Bank Identification Number) do cartão. Alguns emissores incluem metadados de idioma no BIN que permitem ao dispensador inferir o idioma preferido.
- A tela de toque exibe um seletor de idioma no início da transação — tipicamente como ícone de bandeira ou indicação “English / Español / Português”.
- O controlador da instalação direciona a escolha de idioma do cliente ao reprodutor de áudio do firmware.
- Se nenhuma seleção for feita dentro do tempo limite, o dispensador passa para o idioma padrão configurado pelo operador.
Produzir um conjunto de prompts em três idiomas — inglês, espanhol, português — significa três versões de cada prompt na tabela acima, aproximadamente 48–60 arquivos de áudio no total.
Engenharia de áudio para alto-falantes externos de dispensadores
O ambiente acústico em uma pista de posto de gasolina é hostil à clareza da fala. O ruído ambiente inclui:
- Ruído de tráfego: 65–80 dB SPL em uma via arterial movimentada
- Eco da cobertura: as superfícies metálicas ou de fibra de vidro criam reflexões iniciais que borram as consoantes
- Vento: rajadas de 15–30 km/h adicionam ruído de banda larga
- Ruído de motor: veículos do cliente em marcha lenta a 50–60 dB
O alto-falante do dispensador é tipicamente um cone de faixa completa pequeno (7–10 cm) em uma carcaça plástica selada, com resposta de frequência que cai abaixo de 200 Hz e acima de 8 kHz.
Passo 1 — Filtro passa-alta a 200 Hz
Aplique um filtro passa-alta Butterworth de 24 dB/oitava a 180–200 Hz. A energia abaixo desse limiar cria distorção dentro da carcaça em vez de som audível.
Passo 2 — Realce de presença a 2–4 kHz
A faixa de 2–4 kHz é onde vivem as consoantes mais importantes da fala. Um realce de +2 a +3 dB melhora significativamente a inteligibilidade em ambientes barulhentos.
Passo 3 — Normalização de picos
Aponte para picos a -3 dBFS com um limitador a -1 dBFS. Os reprodutores de áudio dos dispensadores geralmente usam níveis de ganância fixos no firmware.
Passo 4 — Formato de exportação
Hardware legado Gilbarco Veeder-Root e Wayne: WAV PCM 16 bits, 16 kHz (ou 8 kHz para as unidades mais antigas). Hardware de nova geração: WAV PCM 16 bits ou 24 bits, 44,1 kHz.
Esses passos de processamento são idênticos em princípio à otimização necessária para prompts de voz em estações de recarga de veículos elétricos e sistemas de PA em estacionamentos.
Fluxo de trabalho passo a passo para produção de prompts de voz para bombas
1. Construir o roteiro mestre
Crie um documento com cada prompt organizado por ID, estado de ativação, texto, idioma e notas. Para implantações bilíngues, adicione uma coluna por idioma.
2. Escolher um perfil de voz consistente
Selecione um único modelo de voz e aplique a mesma velocidade de locução e parâmetros de pausa em todos os prompts. Uma velocidade confortável para prompts de bombas é de 130–145 palavras por minuto.
3. Gerar e aplicar a cadeia de processamento para exterior
Gere cada prompt e aplique a cadeia de EQ descrita acima: passa-alta a 180–200 Hz, realce de presença a 2–4 kHz, normalização de picos a -3 dBFS, limitador a -1 dBFS. Exporte no formato exigido pelo hardware alvo.
4. Controle de qualidade em condições externas
Teste os arquivos exportados por meio de um alto-falante que se aproxime do hardware do dispensador em ambiente externo com ruído ambiente. Se as consoantes não forem claramente distinguíveis, revise o realce de presença e a velocidade de locução.
5. Controle de versão e manutenção
Os prompts de bombas exigem manutenção contínua. Um gerador de voz IA agiliza isso: atualize o roteiro, gere novamente os arquivos afetados, aplique a cadeia de processamento e envie ao controlador da instalação.
VoxBooster para produção de áudio de bombas de combustível
O motor de voz IA do VoxBooster gerencia a produção sistemática e de alto volume que as implantações de bombas exigem. Você programa cada prompt, escolhe entre vários perfis de voz, gera o áudio e exporta no formato WAV que seu hardware exige. Para implantações multilíngues — inglês, espanhol e português brasileiro como o trio mais comum na América do Norte e América Latina — o VoxBooster produz todas as variantes de idioma a partir da mesma biblioteca de roteiros.
Para contextos relacionados de produção de voz IA com requisitos de engenharia de áudio similares, consulte nossos guias sobre voz IA para estações de recarga de VE e voz IA para estacionamentos. Para varejo com autoatendimento, voz IA para caixas de autoatendimento abrange requisitos similares de hardware e acessibilidade. Para fluxos de trabalho mais amplos de produção de conteúdo de voz, clonagem de voz para dublagem e ferramentas de voz IA para criadores de conteúdo oferecem contexto adicional.
Acessibilidade e conformidade regulatória no dispensador
A conformidade com a ADA para dispensadores de combustível tem requisitos específicos de áudio. Os prompts de áudio devem estar disponíveis em cada etapa da transação sem exigir que o cliente ative um modo de acessibilidade. O áudio deve ser reproduzível por meio de uma tomada de fone de ouvido de 3,5 mm padrão no dispensador. O volume deve ser ajustável pelo cliente.
O requisito da tomada de fone de ouvido é significativo do ponto de vista da produção: os mesmos arquivos de áudio reproduzidos pelo alto-falante externo também são reproduzidos pela saída de fone de ouvido. Isso significa que o tratamento de EQ para ambiente externo deve ser moderado — +2 dB a 2–4 kHz em vez de +4 dB — para melhorar a inteligibilidade ao ar livre sem soar áspero por fones de ouvido.
A Lei Brasileira de Inclusão (Lei 13.146/2015) e as diretrizes de acessibilidade do INMETRO para equipamentos de venda automatizada possuem requisitos comparáveis para terminais de pagamento acessíveis — relevante para implantações Petrobras e outras redes brasileiras que operam sob regulação nacional.
Perguntas frequentes
O que é a IA de voz para bombas de gasolina?
A IA de voz para bombas é um sistema de síntese de texto em voz integrado em dispensadores de combustível com pagamento na bomba. Reproduz prompts de áudio programados em cada etapa da transação — inserir cartão, selecionar grau, levantar o bico, iniciar o abastecimento, retirar o recibo — sem precisar de atendentes ao vivo para orientar o cliente pela sequência de pagamento e abastecimento.
Quem produz a voz nas bombas de gasolina?
O áudio nas bombas é produzido pelo fabricante do dispensador ou pela equipe de marca da petrolífera. Gilbarco Veeder-Root e Wayne Fueling Systems são os dois principais fabricantes de hardware na América do Norte. O firmware de seus dispensadores reproduz arquivos WAV carregados pelo operador, gerados com ferramentas de voz IA ou gravados com dubladores dependendo da geração do equipamento.
Um gerador de voz com IA pode criar prompts para bombas de gasolina?
Sim. Um gerador de voz IA moderno permite programar toda a sequência de transação da bomba e exportar arquivos de áudio no formato WAV exigido pelo firmware do dispensador. É possível produzir o mesmo roteiro em inglês, espanhol, português ou outros idiomas a partir de um único fluxo de trabalho, sem contratar dubladores separados por idioma.
Quais prompts de áudio uma bomba de gasolina precisa?
Um conjunto completo de áudio para dispensadores inclui: saudação de boas-vindas, solicitação de inserção de cartão ou pagamento por aproximação, instrução de PIN, oferta de lavagem, seleção de grau (comum, aditivado, premium, diesel), instrução de levantar o bico, confirmação de início de abastecimento, abastecimento concluído, oferta de recibo, encerramento de agradecimento e mensagens de erro.
Como funcionam os prompts multilíngues nas bombas de gasolina?
Os dispensadores multilíngues detectam o idioma preferido do cliente pelo terminal de pagamento, sistema do operador ou seletor de idioma na tela no início da transação. O firmware reproduz o arquivo de áudio correspondente em cada etapa. Os geradores de voz IA produzem o conjunto completo de prompts em cada idioma exigido a partir dos mesmos roteiros mestres.
Qual formato de áudio os dispensadores de combustível utilizam?
A maioria dos dispensadores Gilbarco Veeder-Root e Wayne Fueling Systems aceita arquivos WAV PCM de 16 bits a 8 kHz ou 16 kHz. Plataformas mais recentes suportam 44,1 kHz. Sempre consulte a documentação do controlador da instalação antes de produzir a exportação final.
Como Shell, BP e Chevron gerenciam a identidade de voz nas bombas?
Shell, BP, Chevron e Petrobras mantêm diretrizes de áudio de marca que especificam tom de voz, ritmo e linguagem de saudação para suas redes. Postos próprios seguem esses padrões de perto; postos franqueados independentes costumam usar os prompts padrão do fabricante. Os geradores de voz IA permitem que redes de marca produzam áudio consistente em milhares de postos sem novas gravações a cada atualização de roteiro.
Conclusão
A IA de voz para bombas de gasolina não é uma infraestrutura glamorosa, mas é uma infraestrutura que lida com milhões de interações com clientes todos os dias em redes varejistas de combustível construídas sobre dispensadores Gilbarco Veeder-Root e Wayne Fueling Systems. Acertar nos prompts — claros, com uma voz consistente, multilíngues quando necessário, em conformidade com a legislação de acessibilidade e adaptados aos limites acústicos do hardware do alto-falante — é a diferença entre uma transação que se conclui sem problemas e uma que termina com o cliente indo ao caixa perguntar o que a bomba disse.
Shell, BP, Chevron e Petrobras investiram em diretrizes de áudio de marca porque entendem que a voz da bomba é um ponto de contato de marca em cada transação de abastecimento. Se você está produzindo áudio para bombas de gasolina — seja para um único operador ou uma frota multinacional — o VoxBooster fornece as ferramentas de geração de voz IA para construir e manter o conjunto completo de prompts. O período de avaliação gratuito de 3 dias permite gerar uma sequência de transação de amostra e exportá-la no formato WAV que o seu hardware requer antes de se comprometer com uma produção completa.