Los usuarios de WhatsApp envían aproximadamente 7 mil millones de mensajes de voz cada día (WhatsApp, 2022) - el mayor flujo de mensajería de voz del planeta, y aún la cifra oficial más reciente publicada por la empresa. Sumando el WeChat de Tencent, que mueve unos 45 mil millones de mensajes y 410 millones de llamadas de audio y video al día (Tencent), la voz grabada ya es un modo predeterminado de comunicación para miles de millones de personas. Aun así, la adopción es enormemente desigual: el 84 por ciento de la Gen Z envía notas de voz frente al 47 por ciento de los Baby Boomers (Preply, 2023), y mientras el 38 por ciento de las personas en los EAU prefiere los mensajes de audio, el 83 por ciento de los británicos aún prefiere el texto (YouGov, 2023). Este análisis consolida datos de YouGov, Preply, WhatsApp, Tencent, Juniper Research y otras 8 fuentes primarias para mapear quién envía notas de voz, dónde, cuánto duran y por qué el formato todavía divide opiniones.
TL;DR
- Los usuarios de WhatsApp envían cerca de 7 mil millones de mensajes de voz al día, su cifra oficial más reciente (WhatsApp, 2022)
- WeChat maneja aproximadamente 45 mil millones de mensajes y 410 millones de llamadas de audio y video al día (Tencent)
- El 67 por ciento de los estadounidenses, dos de cada tres, envía notas de voz (Preply, 2023)
- El 84 por ciento de la Gen Z usa notas de voz, frente al 47 por ciento de los Baby Boomers (Preply, 2023)
- Solo el 10 por ciento de los adultos de EE. UU. usaba notas de voz con regularidad a comienzos de 2026 (YouGov, February 2026)
- En 17 mercados, el 66 por ciento prefiere enviar texto y el 7 por ciento prefiere audio (YouGov, 2023)
- Los EAU lideran la preferencia por audio con el 38 por ciento; el Reino Unido es el más fiel al texto, con el 83 por ciento (YouGov, 2023)
- El 68 por ciento de las personas necesita escuchar una nota de voz más de una vez para entenderla (Preply, 2023)
- La nota de voz promedio dura unos 3 minutos, y el 44 por ciento la escucha al doble de velocidad (Sky Mobile, 2025)
- El 91 por ciento preferiría enviar una nota de voz antes que recibir una (Sky Mobile, 2025)
- El tráfico global de mensajería empresarial crecerá de 2 billones a casi 3 billones de mensajes para 2030 (Juniper Research, 2025)
- Se proyecta que el mercado de reconocimiento de voz alcance los 78.86 mil millones de dólares para 2033 (Coherent Market Insights, 2026)
1. Escala de Plataformas: La Voz Ya Es Infraestructura
La voz ya no es una función novedosa; es infraestructura. Solo WhatsApp transporta cerca de 7 mil millones de mensajes de voz al día, un volumen que empequeñece a cualquier app independiente de notas de voz y se inserta dentro de un flujo aún mayor de más de 100 mil millones de mensajes diarios en las plataformas de Meta. Cuando una sola función mueve miles de millones de grabaciones cada día, deja de ser una rareza y se convierte en un canal principal para el que los equipos de producto, marketing y soporte deben diseñar. La cifra fue anunciada por WhatsApp en 2022 y sigue siendo el dato público más reciente de la empresa, por lo que el volumen real en 2026 es muy probablemente mayor.
| Métrica | Valor | Fuente |
|---|---|---|
| Mensajes de voz enviados por día en WhatsApp | ~7 billion | WhatsApp/Meta, 2022 |
| Mensajes de texto enviados por día en WhatsApp | 100 billion+ | Meta, 2024 |
| Mensajes enviados por día en WeChat | ~45 billion | Tencent |
| Llamadas de audio y video por día en WeChat | ~410 million | Tencent |
| Usuarios activos mensuales de Weixin/WeChat (Q3 2025) | 1.414 billion | Tencent |
| Usuarios de Messenger en el mundo (Jan 2025) | 947 million | DataReportal/Meta |
| Videollamadas por día en Messenger | 150 million+ | Meta |
| Tráfico de Telegram que son mensajes de voz/video | 12% | Telegram |
Aviso de vigencia: los 45 mil millones de mensajes y 410 millones de llamadas de WeChat son las cifras diarias más citadas de Tencent y son anteriores a 2020; tómense como un piso, no un techo.
2. Adopción del Consumidor: Hábito, No Novedad
Las notas de voz pasaron de ser novedad a hábito hace años y se han asentado como un canal estable, aunque polarizador. Dos de cada tres estadounidenses (67 por ciento) envían notas de voz (Preply, 2023), y una encuesta separada encontró que el 62 por ciento ha enviado al menos una (Vox/YouGov, 2023) - dos encuestas independientes de 2023 con resultados a cinco puntos de diferencia entre sí. Pero el uso regular es más limitado que la adopción titular: solo el 10 por ciento de los adultos de EE. UU. usaba notas de voz con regularidad a comienzos de 2026, mientras que el 85 por ciento enviaba mensajes de texto varias veces por semana (YouGov, February 2026). El crecimiento también se ve a nivel de aplicaciones: Axios informó que las notas de voz en la app de citas Hinge crecieron un 37 por ciento interanual entre enero y febrero de 2023.
| Métrica | Valor | Fuente |
|---|---|---|
| Estadounidenses que envían notas de voz | 67% | Preply, 2023 |
| Estadounidenses que han enviado un mensaje de voz | 62% | Vox/YouGov, 2023 |
| Adultos de EE. UU. que usan notas de voz con regularidad (2026) | 10% | YouGov, Feb 2026 |
| Adultos de EE. UU. que dicen que las notas de voz “no aplican” (2026) | 41% | YouGov, Feb 2026 |
| Adultos de EE. UU. que envían texto varias veces por semana (2026) | 85% | YouGov, Feb 2026 |
| Estadounidenses que usaban notas de voz hace más de un año (2026) | 11% | YouGov, Feb 2026 |
| Notas de voz de Hinge, crecimiento interanual (Jan-Feb 2023) | +37% | Hinge/Axios, 2023 |
| Dicen que la mensajería ha reemplazado al menos algunas llamadas (2026) | 68% | YouGov, Feb 2026 |
Contexto: las encuestas de adopción de 2023 midieron el uso alguna vez, mientras que la cifra de YouGov de 2026 mide el uso regular, por lo que el 67 por ciento y el 10 por ciento no son contradictorios. Las notas de voz también compiten con otros canales - en la misma encuesta de febrero de 2026, el 58 por ciento de los estadounidenses seguía usando llamadas de voz con regularidad y el 21 por ciento usaba videollamadas (YouGov, February 2026).
3. Generaciones y Demografía: La Brecha Más Amplia en la Mensajería
La brecha entre generaciones en el uso de notas de voz es una de las más amplias en la comunicación digital. El 84 por ciento de la Gen Z usa notas de voz, casi el doble que el 47 por ciento de los Baby Boomers (Preply, 2023). Entre los adultos jóvenes, el hábito es semanal o diario: el 43 por ciento de los estadounidenses de 18 a 29 años envía mensajes de voz al menos semanalmente, frente a aproximadamente el 30 por ciento de todos los adultos (Vox/YouGov, 2023). La ironía es que los usuarios más asiduos también están entre los más molestos - el 31 por ciento de la Gen Z y el 37 por ciento de los Millennials reportan sentirse incomodados por las notas que reciben (Preply, 2023).
| Métrica | Valor | Fuente |
|---|---|---|
| Gen Z que usa notas de voz | 84% | Preply, 2023 |
| Millennials que usan notas de voz | 63% | Preply, 2023 |
| Gen X que usa notas de voz | 56% | Preply, 2023 |
| Baby Boomers que usan notas de voz | 47% | Preply, 2023 |
| Mujeres que envían mensajes de voz (vs 43% de los hombres) | 53% | Mobilesquared |
| Estadounidenses de 18-29 años que envían mensajes de voz semanalmente o más | 43% | Vox/YouGov, 2023 |
| Británicos de 18-24 años que nunca han enviado una nota de voz (2022) | 40% | YouGov, 2022 |
| Británicos de 18-24 años que envían notas de voz a diario (2022) | 12% | YouGov, 2022 |
Valor atípico: incluso entre los británicos de 18-24 años, la cohorte británica más afín a las notas de voz, el 40 por ciento nunca había enviado una (YouGov, 2022) - un recordatorio de que la juventud no garantiza la adopción en todas partes.
4. Región y Cultura: La División Texto-vs-Audio por País
Que una nota de voz se sienta normal o de mala educación depende en gran medida de la geografía. En 17 mercados, el 66 por ciento de las personas prefiere enviar texto y solo el 7 por ciento prefiere audio (YouGov, 2023) - pero el promedio esconde una dispersión enorme. En los EAU, el 38 por ciento prefiere los mensajes de audio, el porcentaje más alto de cualquier mercado encuestado, mientras que el Reino Unido es el más fiel al texto, con el 83 por ciento. India muestra la división con claridad: el 48 por ciento de los indios disfruta recibir notas de voz o las considera equivalentes al texto, frente a apenas el 18 por ciento de los británicos (YouGov, 2023).
| Métrica | Valor | Fuente |
|---|---|---|
| Preferencia global por enviar texto (17 mercados) | 66% | YouGov, 2023 |
| Preferencia global por enviar audio | 7% | YouGov, 2023 |
| Prefieren texto y audio por igual | 21% | YouGov, 2023 |
| Preferencia por mensajes de audio en los EAU (la más alta) | 38% | YouGov, 2023 |
| Preferencia del Reino Unido por texto sobre audio | 83% | YouGov, 2023 |
| Preferencia de EE. UU. por texto | 68% | YouGov, 2023 |
| Indios que disfrutan o consideran equivalentes las notas de voz y el texto | 48% | YouGov, 2023 |
| Adultos del Reino Unido que usan notas de voz con regularidad (2026) | 15% | YouGov, March 2026 |
Aviso de vigencia: la comparación entre 17 mercados corresponde a trabajo de campo de noviembre de 2023, el conjunto de datos entre países más reciente disponible públicamente. La cifra de uso regular en el Reino Unido proviene de una encuesta de YouGov de marzo de 2026, en la que el 89 por ciento de los adultos del Reino Unido enviaba mensajes con regularidad, frente al 50 por ciento que hacía llamadas de voz y el 24 por ciento que hacía videollamadas, y el 74 por ciento dijo que la mensajería había reemplazado al menos algunas llamadas telefónicas (YouGov, March 2026).
5. Fricción, Etiqueta y Duración
El rechazo a las notas de voz es en realidad un rechazo a su duración y a la incomodidad que generan. El 68 por ciento de las personas necesita escuchar una nota de voz más de una vez para entenderla del todo (Preply, 2023), y el 48 por ciento cree que grabar una supone más esfuerzo que escribir. La duración es el punto de fricción: la nota de voz promedio dura unos tres minutos, pero el 65 por ciento de los británicos considera que incluso una nota de un minuto es demasiado larga (Sky Mobile, 2025; YouGov, 2022). No sorprende que el 44 por ciento de los oyentes las escuche al doble de velocidad, y que los creadores conviertan cada vez más grabaciones divagantes en ediciones ajustadas o locuciones de texto a voz para cualquier contenido pensado para ser escuchado por una audiencia.
| Métrica | Valor | Fuente |
|---|---|---|
| Necesitan escuchar varias veces para entender una nota | 68% | Preply, 2023 |
| Creen que las notas de voz suponen más esfuerzo que escribir | 48% | Preply, 2023 |
| Dicen que las notas de voz transmiten mejor el tono que el texto | 61% | Preply, 2023 |
| Duración promedio de una nota de voz | ~3 minutes | Sky Mobile, 2025 |
| Escuchan las notas de voz al doble de velocidad | 44% | Sky Mobile, 2025 |
| Preferirían enviar antes que recibir una nota de voz | 91% | Sky Mobile, 2025 |
| Británicos que citan tener las manos libres como el principal beneficio | 76% | Sky Mobile, 2025 |
| Adultos del Reino Unido que pierden la paciencia a los 45 segundos (2022) | 48% | YouGov, 2022 |
Valor atípico: el 30 por ciento de los estadounidenses se siente molesto o incomodado al recibir una nota de voz, y el 41 por ciento le preocupa que alguien lo escuche mientras graba una (Preply, 2023).
6. Transcripción, IA y el Mercado Empresarial
La transcripción está desactivando en silencio la mayor queja sobre las notas de voz - que no se pueden hojear rápidamente. WhatsApp lanzó las transcripciones de mensajes de voz en el dispositivo en noviembre de 2024, y se proyecta que el mercado más amplio de reconocimiento de voz que impulsa estas funciones se triplique con creces, pasando de 22.66 mil millones de dólares en 2026 a 78.86 mil millones para 2033 (WhatsApp; Coherent Market Insights, 2026). A medida que el comercio y el soporte se trasladan al chat, se espera que el tráfico de mensajería empresarial suba de 2 billones de mensajes en 2025 a casi 3 billones para 2030 (Juniper Research, 2025), llevando la voz, el audio y la conversión automática de voz a texto cada vez más adentro de las conversaciones con clientes. Para los creadores, la misma tecnología que transcribe una nota puede generar una narración limpia mediante un generador de voz con IA.
| Métrica | Valor | Fuente |
|---|---|---|
| Lanzamiento de las transcripciones de voz en el dispositivo de WhatsApp | Nov 2024 | |
| Mercado de reconocimiento de voz (2026) | $22.66 billion | Coherent Market Insights, 2026 |
| Mercado de reconocimiento de voz (previsión 2033) | $78.86 billion | Coherent Market Insights, 2026 |
| CAGR del mercado de reconocimiento de voz (2026-2033) | 23.1% | Coherent Market Insights, 2026 |
| Mercado de reconocimiento de voz y habla (previsión 2030) | $23.11 billion | MarketsandMarkets, 2025 |
| Tráfico global de mensajería empresarial (2025) | 2 trillion msgs | Juniper Research, 2025 |
| Tráfico global de mensajería empresarial (previsión 2030) | ~3 trillion msgs | Juniper Research, 2025 |
| Trabajadores que dicen que las herramientas de mensajería mejoraron la productividad (2025) | 77% | Staffbase, 2025 |
Nota sobre la divergencia: el dimensionamiento del mercado depende en gran medida del alcance considerado. Coherent Market Insights valora el “reconocimiento de voz” en 22.66 mil millones de dólares en 2026, mientras que MarketsandMarkets delimita el “reconocimiento de voz y habla” en 23.11 mil millones para 2030 - un recordatorio de verificar qué cuenta cada firma antes de comparar totales.
Resumen: Notas de Voz y Mensajería de Voz en Cifras
| Métrica | Valor | Fuente |
|---|---|---|
| Mensajes de voz de WhatsApp por día | ~7 billion | WhatsApp/Meta, 2022 |
| Mensajes de WeChat por día | ~45 billion | Tencent |
| Llamadas de audio y video de WeChat por día | ~410 million | Tencent |
| Estadounidenses que envían notas de voz | 67% | Preply, 2023 |
| Estadounidenses que han enviado un mensaje de voz | 62% | Vox/YouGov, 2023 |
| Adultos de EE. UU. que usan notas de voz con regularidad (2026) | 10% | YouGov, Feb 2026 |
| Gen Z que usa notas de voz | 84% | Preply, 2023 |
| Baby Boomers que usan notas de voz | 47% | Preply, 2023 |
| Personas de 18-29 años que envían mensajes de voz semanalmente o más | 43% | Vox/YouGov, 2023 |
| Preferencia global por enviar texto (17 mercados) | 66% | YouGov, 2023 |
| Preferencia global por enviar audio | 7% | YouGov, 2023 |
| Preferencia por mensajes de audio en los EAU (la más alta) | 38% | YouGov, 2023 |
| Preferencia del Reino Unido por texto sobre audio | 83% | YouGov, 2023 |
| Adultos del Reino Unido que usan notas de voz con regularidad (2026) | 15% | YouGov, March 2026 |
| Duración promedio de una nota de voz | ~3 minutes | Sky Mobile, 2025 |
| Escuchan las notas de voz al doble de velocidad | 44% | Sky Mobile, 2025 |
| Preferirían enviar antes que recibir una nota de voz | 91% | Sky Mobile, 2025 |
| Notas de voz de Hinge, crecimiento interanual (2023) | +37% | Hinge/Axios, 2023 |
| Tráfico global de mensajería empresarial (2025) | 2 trillion msgs | Juniper Research, 2025 |
| Mercado de reconocimiento de voz (2026) | $22.66 billion | Coherent Market Insights, 2026 |
Metodología y Fuentes
Los datos se recopilaron de fuentes primarias - encuestas de consumo con nombre propio, divulgaciones de empresas e informes de investigación de mercado - con cifras de tamaño de mercado y adopción contrastadas entre firmas, y datos más antiguos señalados cuando no había públicamente disponible un número más reciente. Las cifras de volumen de plataformas son las divulgaciones oficiales más recientes de los operadores; cuando una cifra es anterior a 2024, se indica en la sección correspondiente.
- YouGov, How Americans communicate in 2026 (encuesta a 2,442 adultos de EE. UU., febrero de 2026) - link
- YouGov, How Brits communicate in 2026 (encuesta a 2,312 adultos del Reino Unido, marzo de 2026) - link
- YouGov, Do consumers prefer sending and receiving messages in audio or text form? (17 mercados, noviembre de 2023) - link
- YouGov, How many Britons like voice notes? (Reino Unido, 2022) - link
- Preply, Study Finds the Use of Voice Notes on the Rise (encuesta a 1,000 adultos de EE. UU., mayo de 2023) - link
- Vox / YouGov, encuesta sobre mensajes de voz (EE. UU., abril de 2023, divulgada vía NPR)
- Axios, Voice messages: sharing audio recordings becoming more popular (datos de la plataforma Hinge, abril de 2023) - link
- Mobilesquared, uso de mensajes de voz por género (divulgado vía Sound Branch)
- WhatsApp / Meta, anuncio de volumen de mensajes de voz (2022, vía TechCrunch) e Introducing Voice Message Transcripts (noviembre de 2024) - link
- Tencent, divulgaciones de uso de Weixin/WeChat (mensajes y llamadas por día; MAU Q3 2025)
- DataReportal / Meta, estadísticas de Messenger (enero de 2025)
- Telegram, divulgaciones de uso de la plataforma (proporción del tráfico que son mensajes de voz/video, vía recopilaciones de estadísticas de apps)
- Sky Mobile, investigación sobre notas de voz (2025, divulgada vía HuffPost UK) - link
- Juniper Research, Conversational Use Cases Fuel Global Messaging Boom (2025) - link
- Coherent Market Insights, Voice Recognition Market (2026) - link
- MarketsandMarkets, Speech and Voice Recognition Market (2025) - link
- Staffbase, 2025 International Employee Communication Impact Study - link
Última actualización: 5 de julio de 2026.
Revisamos y actualizamos esta página trimestralmente a medida que se publican nuevos datos.