Pengguna WhatsApp mengirim sekitar 7 miliar pesan suara setiap hari (WhatsApp, 2022) - aliran pesan suara terbesar di planet ini, dan masih menjadi angka resmi terbaru yang dipublikasikan perusahaan tersebut. Tambahkan WeChat milik Tencent, yang memindahkan sekitar 45 miliar pesan dan 410 juta panggilan audio dan video setiap hari (Tencent), maka suara yang direkam kini menjadi mode komunikasi baku bagi miliaran orang. Namun adopsinya sangat tidak merata: 84 persen Gen Z mengirim pesan suara dibandingkan 47 persen Baby Boomer (Preply, 2023), dan sementara 38 persen orang di UEA lebih suka pesan audio, 83 persen warga Inggris masih lebih suka teks (YouGov, 2023). Analisis ini menggabungkan data dari YouGov, Preply, WhatsApp, Tencent, Juniper Research, dan 8 sumber utama lainnya untuk memetakan siapa yang mengirim pesan suara, di mana, berapa lama, dan mengapa format ini masih memecah opini.
Ringkasan Singkat
- Pengguna WhatsApp mengirim sekitar 7 miliar pesan suara per hari, angka resmi terbarunya (WhatsApp, 2022)
- WeChat memproses sekitar 45 miliar pesan dan 410 juta panggilan audio dan video setiap hari (Tencent)
- 67 persen orang Amerika, dua dari tiga orang, mengirim pesan suara (Preply, 2023)
- 84 persen Gen Z menggunakan pesan suara, dibandingkan 47 persen Baby Boomer (Preply, 2023)
- Hanya 10 persen orang dewasa AS yang menggunakan pesan suara secara rutin pada awal 2026 (YouGov, February 2026)
- Di 17 pasar, 66 persen lebih suka mengirim teks dan 7 persen lebih suka audio (YouGov, 2023)
- UEA memimpin preferensi audio dengan 38 persen; Inggris paling loyal pada teks dengan 83 persen (YouGov, 2023)
- 68 persen orang perlu mendengar pesan suara lebih dari sekali untuk memahaminya (Preply, 2023)
- Rata-rata pesan suara berdurasi sekitar 3 menit, dan 44 persen mendengarkannya dengan kecepatan dua kali lipat (Sky Mobile, 2025)
- 91 persen lebih suka mengirim pesan suara daripada menerimanya (Sky Mobile, 2025)
- Lalu lintas pesan bisnis global akan tumbuh dari 2 triliun menjadi hampir 3 triliun pesan pada 2030 (Juniper Research, 2025)
- Pasar pengenalan suara diproyeksikan mencapai 78.86 miliar dolar pada 2033 (Coherent Market Insights, 2026)
1. Skala Platform: Suara Kini Menjadi Infrastruktur
Suara bukan lagi fitur baru; ia adalah infrastruktur. Hanya WhatsApp saja membawa sekitar 7 miliar pesan suara per hari, volume yang jauh melampaui aplikasi pesan suara mandiri mana pun dan berada dalam aliran yang lebih luas dari lebih 100 miliar pesan harian di seluruh platform Meta. Ketika satu fitur memindahkan miliaran rekaman setiap hari, fitur itu berhenti menjadi keanehan dan menjadi kanal utama yang harus dirancang oleh tim produk, pemasar, dan meja dukungan. Angka ini diumumkan oleh WhatsApp pada 2022 dan tetap menjadi angka publik terbaru perusahaan tersebut, sehingga volume sebenarnya pada 2026 sangat mungkin lebih tinggi.
| Metrik | Nilai | Sumber |
|---|---|---|
| Pesan suara WhatsApp dikirim per hari | ~7 billion | WhatsApp/Meta, 2022 |
| Pesan teks WhatsApp dikirim per hari | 100 billion+ | Meta, 2024 |
| Pesan WeChat dikirim per hari | ~45 billion | Tencent |
| Panggilan audio dan video WeChat per hari | ~410 million | Tencent |
| Pengguna aktif bulanan Weixin/WeChat (Q3 2025) | 1.414 billion | Tencent |
| Pengguna Messenger di seluruh dunia (Jan 2025) | 947 million | DataReportal/Meta |
| Panggilan video Messenger per hari | 150 million+ | Meta |
| Trafik Telegram yang berupa pesan suara/video | 12% | Telegram |
Penanda kebaruan: 45 miliar pesan dan 410 juta panggilan WeChat adalah angka harian yang paling banyak dikutip dari Tencent dan berasal dari sebelum 2020; anggaplah ini sebagai batas bawah, bukan batas atas.
2. Adopsi Konsumen: Kebiasaan, Bukan Hal Baru
Pesan suara beralih dari hal baru menjadi kebiasaan bertahun-tahun lalu dan telah menetap menjadi kanal yang stabil, meski memecah opini. Dua dari tiga orang Amerika (67 persen) mengirim pesan suara (Preply, 2023), dan jajak pendapat terpisah menemukan 62 persen pernah mengirim setidaknya satu (Vox/YouGov, 2023) - dua survei independen 2023 yang hasilnya hanya berselisih kurang dari lima poin. Namun penggunaan rutin lebih sempit daripada adopsi headline: hanya 10 persen orang dewasa AS yang menggunakan pesan suara secara rutin pada awal 2026, sementara 85 persen bertukar pesan teks beberapa kali seminggu (YouGov, February 2026). Pertumbuhan juga terlihat di tingkat aplikasi: Axios melaporkan bahwa pesan suara di aplikasi kencan Hinge meningkat 37 persen dari tahun ke tahun antara Januari dan Februari 2023.
| Metrik | Nilai | Sumber |
|---|---|---|
| Orang Amerika yang mengirim pesan suara | 67% | Preply, 2023 |
| Orang Amerika yang pernah mengirim pesan suara | 62% | Vox/YouGov, 2023 |
| Orang dewasa AS yang menggunakan pesan suara secara rutin (2026) | 10% | YouGov, Feb 2026 |
| Orang dewasa AS yang mengatakan pesan suara “tidak berlaku” bagi mereka (2026) | 41% | YouGov, Feb 2026 |
| Orang dewasa AS yang bertukar pesan teks beberapa kali seminggu (2026) | 85% | YouGov, Feb 2026 |
| Orang Amerika yang menggunakan pesan suara lebih banyak dibanding setahun sebelumnya (2026) | 11% | YouGov, Feb 2026 |
| Pesan suara Hinge, pertumbuhan tahun-ke-tahun (Jan-Feb 2023) | +37% | Hinge/Axios, 2023 |
| Mengatakan pesan teks telah menggantikan setidaknya sebagian panggilan telepon (2026) | 68% | YouGov, Feb 2026 |
Konteks: survei adopsi 2023 mengukur pernah-menggunakan, sementara angka YouGov 2026 mengukur penggunaan rutin, sehingga 67 persen dan 10 persen tidak bertentangan. Pesan suara juga bersaing dengan kanal lain - dalam survei Februari 2026 yang sama, 58 persen orang Amerika masih rutin menggunakan panggilan suara dan 21 persen menggunakan panggilan video (YouGov, February 2026).
3. Generasi dan Demografi: Kesenjangan Terlebar dalam Perpesanan
Kesenjangan pesan suara antar generasi adalah salah satu yang terlebar dalam komunikasi digital. 84 persen Gen Z menggunakan pesan suara, hampir dua kali lipat dari 47 persen Baby Boomer (Preply, 2023). Di kalangan dewasa muda, kebiasaan ini bersifat mingguan atau harian: 43 persen orang Amerika berusia 18-29 tahun mengirim pesan suara setidaknya seminggu sekali, dibandingkan sekitar 30 persen dari seluruh orang dewasa (Vox/YouGov, 2023). Ironisnya, pengguna terberat juga termasuk yang paling terganggu - 31 persen Gen Z dan 37 persen Milenial melaporkan merasa tidak nyaman dengan pesan yang masuk (Preply, 2023).
| Metrik | Nilai | Sumber |
|---|---|---|
| Gen Z yang menggunakan pesan suara | 84% | Preply, 2023 |
| Milenial yang menggunakan pesan suara | 63% | Preply, 2023 |
| Gen X yang menggunakan pesan suara | 56% | Preply, 2023 |
| Baby Boomer yang menggunakan pesan suara | 47% | Preply, 2023 |
| Perempuan yang mengirim pesan suara (dibandingkan 43% laki-laki) | 53% | Mobilesquared |
| Orang Amerika usia 18-29 yang mengirim pesan suara mingguan+ | 43% | Vox/YouGov, 2023 |
| Warga Inggris usia 18-24 yang belum pernah mengirim pesan suara (2022) | 40% | YouGov, 2022 |
| Warga Inggris usia 18-24 yang mengirim pesan suara harian (2022) | 12% | YouGov, 2022 |
Nilai anomali: bahkan di kalangan warga Inggris usia 18-24, kohort Inggris yang paling ramah terhadap pesan suara, 40 persen belum pernah mengirim pesan suara (YouGov, 2022) - pengingat bahwa usia muda tidak menjamin adopsi di mana pun.
4. Wilayah dan Budaya: Perbedaan Teks-vs-Audio Menurut Negara
Apakah pesan suara terasa normal atau tidak sopan sangat bergantung pada geografi. Di 17 pasar, 66 persen orang lebih suka mengirim teks dan hanya 7 persen yang lebih suka audio (YouGov, 2023) - tetapi rata-rata ini menyembunyikan sebaran yang sangat besar. Di UEA, 38 persen lebih suka pesan audio, proporsi tertinggi dari semua pasar yang disurvei, sementara Inggris paling loyal pada teks dengan 83 persen. India menunjukkan perbedaan ini dengan jelas: 48 persen orang India menyukai pesan suara atau menilainya setara dengan teks, dibandingkan hanya 18 persen warga Inggris (YouGov, 2023).
| Metrik | Nilai | Sumber |
|---|---|---|
| Preferensi global untuk mengirim teks (17 pasar) | 66% | YouGov, 2023 |
| Preferensi global untuk mengirim audio | 7% | YouGov, 2023 |
| Lebih suka teks dan audio secara setara | 21% | YouGov, 2023 |
| Preferensi UEA untuk pesan audio (tertinggi) | 38% | YouGov, 2023 |
| Preferensi Inggris untuk teks dibanding audio | 83% | YouGov, 2023 |
| Preferensi AS untuk teks | 68% | YouGov, 2023 |
| Orang India yang menyukai atau menilai pesan suara setara dengan teks | 48% | YouGov, 2023 |
| Orang dewasa Inggris yang menggunakan pesan suara secara rutin (2026) | 15% | YouGov, March 2026 |
Penanda kebaruan: perbandingan 17 pasar ini berasal dari riset lapangan November 2023, kumpulan data lintas negara terbaru yang tersedia untuk publik. Angka penggunaan rutin Inggris berasal dari survei YouGov Maret 2026, di mana 89 persen orang dewasa Inggris bertukar pesan secara rutin dibandingkan 50 persen yang melakukan panggilan suara dan 24 persen panggilan video, dan 74 persen mengatakan pesan teks telah menggantikan setidaknya sebagian panggilan telepon (YouGov, March 2026).
5. Gesekan, Etiket, dan Durasi
Reaksi negatif terhadap pesan suara sebenarnya adalah reaksi terhadap durasi dan ketidaknyamanannya. 68 persen orang perlu mendengarkan pesan suara lebih dari sekali untuk benar-benar memahaminya (Preply, 2023), dan 48 persen percaya merekam satu pesan membutuhkan lebih banyak usaha daripada mengetik. Durasi adalah titik pemicu utama: rata-rata pesan suara berdurasi sekitar tiga menit, namun 65 persen warga Inggris menganggap bahkan pesan berdurasi satu menit sudah terlalu panjang (Sky Mobile, 2025; YouGov, 2022). Tidak mengherankan jika 44 persen pendengar mempercepat dengan kecepatan dua kali lipat, dan para kreator semakin banyak mengubah rekaman yang bertele-tele menjadi suntingan yang ringkas atau sulih suara text-to-speech untuk apa pun yang ditujukan untuk didengarkan oleh audiens.
| Metrik | Nilai | Sumber |
|---|---|---|
| Perlu mendengarkan berkali-kali untuk memahami pesan | 68% | Preply, 2023 |
| Percaya pesan suara membutuhkan lebih banyak usaha daripada mengetik | 48% | Preply, 2023 |
| Mengatakan pesan suara menyampaikan nada bicara lebih baik daripada teks | 61% | Preply, 2023 |
| Rata-rata durasi pesan suara | ~3 minutes | Sky Mobile, 2025 |
| Mendengarkan pesan suara dengan kecepatan dua kali lipat | 44% | Sky Mobile, 2025 |
| Lebih suka mengirim daripada menerima pesan suara | 91% | Sky Mobile, 2025 |
| Warga Inggris yang menyebut bebas genggam sebagai manfaat utama | 76% | Sky Mobile, 2025 |
| Orang dewasa Inggris yang kehilangan kesabaran pada detik ke-45 (2022) | 48% | YouGov, 2022 |
Nilai anomali: 30 persen orang Amerika merasa terganggu atau tidak nyaman saat menerima pesan suara, dan 41 persen khawatir didengar orang lain saat merekamnya (Preply, 2023).
6. Transkripsi, AI, dan Pasar Bisnis
Transkripsi secara diam-diam meredakan keluhan terbesar tentang pesan suara - yaitu bahwa pesan itu tidak bisa dibaca sekilas. WhatsApp meluncurkan transkrip pesan suara di perangkat pada November 2024, dan pasar pengenalan suara yang lebih luas yang mendukung fitur semacam itu diproyeksikan lebih dari tiga kali lipat, dari 22.66 miliar dolar pada 2026 menjadi 78.86 miliar pada 2033 (WhatsApp; Coherent Market Insights, 2026). Seiring perdagangan dan dukungan pelanggan beralih ke chat, lalu lintas pesan bisnis diperkirakan naik dari 2 triliun pesan pada 2025 menjadi hampir 3 triliun pada 2030 (Juniper Research, 2025), menarik suara, audio, dan speech-to-text otomatis semakin dalam ke percakapan pelanggan. Bagi para kreator, alat yang sama yang mentranskripsi sebuah pesan juga dapat menghasilkan narasi bersih melalui generator suara AI.
| Metrik | Nilai | Sumber |
|---|---|---|
| Peluncuran transkrip suara WhatsApp di perangkat | Nov 2024 | |
| Pasar pengenalan suara (2026) | $22.66 billion | Coherent Market Insights, 2026 |
| Pasar pengenalan suara (proyeksi 2033) | $78.86 billion | Coherent Market Insights, 2026 |
| CAGR pasar pengenalan suara (2026-2033) | 23.1% | Coherent Market Insights, 2026 |
| Pasar pengenalan ucapan dan suara (proyeksi 2030) | $23.11 billion | MarketsandMarkets, 2025 |
| Lalu lintas pesan bisnis global (2025) | 2 trillion msgs | Juniper Research, 2025 |
| Lalu lintas pesan bisnis global (proyeksi 2030) | ~3 trillion msgs | Juniper Research, 2025 |
| Pekerja yang mengatakan alat perpesanan meningkatkan produktivitas (2025) | 77% | Staffbase, 2025 |
Catatan perbedaan: ukuran pasar sangat bergantung pada cakupannya. Coherent Market Insights menilai “pengenalan suara” sebesar 22.66 miliar dolar pada 2026, sementara MarketsandMarkets membatasi cakupan “pengenalan ucapan dan suara” sebesar 23.11 miliar pada 2030 - pengingat untuk memeriksa apa yang dihitung masing-masing perusahaan sebelum membandingkan totalnya.
Ringkasan: Pesan Suara dan Perpesanan Suara dalam Angka
| Metrik | Nilai | Sumber |
|---|---|---|
| Pesan suara WhatsApp per hari | ~7 billion | WhatsApp/Meta, 2022 |
| Pesan WeChat per hari | ~45 billion | Tencent |
| Panggilan audio dan video WeChat per hari | ~410 million | Tencent |
| Orang Amerika yang mengirim pesan suara | 67% | Preply, 2023 |
| Orang Amerika yang pernah mengirim pesan suara | 62% | Vox/YouGov, 2023 |
| Orang dewasa AS yang menggunakan pesan suara secara rutin (2026) | 10% | YouGov, Feb 2026 |
| Gen Z yang menggunakan pesan suara | 84% | Preply, 2023 |
| Baby Boomer yang menggunakan pesan suara | 47% | Preply, 2023 |
| Usia 18-29 yang mengirim pesan suara mingguan+ | 43% | Vox/YouGov, 2023 |
| Preferensi global untuk mengirim teks (17 pasar) | 66% | YouGov, 2023 |
| Preferensi global untuk mengirim audio | 7% | YouGov, 2023 |
| Preferensi UEA untuk pesan audio (tertinggi) | 38% | YouGov, 2023 |
| Preferensi Inggris untuk teks dibanding audio | 83% | YouGov, 2023 |
| Orang dewasa Inggris yang menggunakan pesan suara secara rutin (2026) | 15% | YouGov, March 2026 |
| Rata-rata durasi pesan suara | ~3 minutes | Sky Mobile, 2025 |
| Mendengarkan pesan suara dengan kecepatan dua kali lipat | 44% | Sky Mobile, 2025 |
| Lebih suka mengirim daripada menerima pesan suara | 91% | Sky Mobile, 2025 |
| Pesan suara Hinge, pertumbuhan tahun-ke-tahun (2023) | +37% | Hinge/Axios, 2023 |
| Lalu lintas pesan bisnis global (2025) | 2 trillion msgs | Juniper Research, 2025 |
| Pasar pengenalan suara (2026) | $22.66 billion | Coherent Market Insights, 2026 |
Metodologi dan Sumber
Data dikumpulkan dari sumber primer - survei konsumen bernama, pengungkapan perusahaan, dan laporan riset pasar - dengan angka ukuran pasar dan adopsi yang disilangkan antar-perusahaan, dan data yang lebih lama ditandai apabila angka yang lebih baru tidak tersedia untuk publik. Angka volume platform adalah pengungkapan resmi terbaru dari operatornya; jika sebuah angka berasal dari sebelum 2024, hal itu ditandai di bagian yang relevan.
- YouGov, How Americans communicate in 2026 (survei terhadap 2.442 orang dewasa AS, February 2026) - tautan
- YouGov, How Brits communicate in 2026 (survei terhadap 2.312 orang dewasa Inggris, March 2026) - tautan
- YouGov, Do consumers prefer sending and receiving messages in audio or text form? (17 pasar, November 2023) - tautan
- YouGov, How many Britons like voice notes? (Inggris, 2022) - tautan
- Preply, Study Finds the Use of Voice Notes on the Rise (survei terhadap 1.000 orang dewasa AS, May 2023) - tautan
- Jajak pendapat pesan suara Vox / YouGov (AS, April 2023, dilaporkan melalui NPR)
- Axios, Voice messages: sharing audio recordings becoming more popular (data platform Hinge, April 2023) - tautan
- Mobilesquared, penggunaan pesan suara berdasarkan gender (dilaporkan melalui Sound Branch)
- WhatsApp / Meta, pengumuman volume pesan suara (2022, melalui TechCrunch) dan Introducing Voice Message Transcripts (November 2024) - tautan
- Tencent, pengungkapan penggunaan Weixin/WeChat (pesan dan panggilan per hari; MAU Q3 2025)
- DataReportal / Meta, statistik Messenger (January 2025)
- Telegram, pengungkapan penggunaan platform (pangsa trafik dari pesan suara/video, melalui rangkuman statistik aplikasi)
- Riset Sky Mobile tentang pesan suara (2025, dilaporkan melalui HuffPost UK) - tautan
- Juniper Research, Conversational Use Cases Fuel Global Messaging Boom (2025) - tautan
- Coherent Market Insights, Voice Recognition Market (2026) - tautan
- MarketsandMarkets, Speech and Voice Recognition Market (2025) - tautan
- Staffbase, 2025 International Employee Communication Impact Study - tautan
Pembaruan terakhir: July 5, 2026.
Kami meninjau dan memperbarui halaman ini setiap kuartal seiring data baru dipublikasikan.