Pengubah Nada Suara: Ubah Pitch Suara Anda secara Real-Time

Pelajari cara kerja pengubah nada suara, mengapa koreksi formant penting untuk hasil alami, dan cara mengatur perubahan pitch real-time di Windows dalam hitungan menit.

Pengubah nada suara mengambil audio yang keluar dari mikrofon Anda dan menggeser frekuensi dasarnya — ke atas, ke bawah, atau di mana pun di antaranya — secara real-time. Baik Anda ingin terdengar lebih dalam untuk persona streaming, lebih tinggi untuk karakter game, atau sedikit berbeda untuk melindungi privasi Anda di lobi online, perubahan pitch adalah cara tercepat untuk sampai ke sana.

Tangkapannya adalah bahwa pitch saja hanya mengatakan setengah dari cerita. Ubah pitch tanpa menyentuh apa pun dan Anda mendapatkan sesuatu yang terdengar jelas diproses — setara vokal dengan tupai atau rekaman dalam gerakan lambat. Untuk mendapatkan hasil yang alami, Anda juga perlu memahami formant. Panduan ini mencakup keduanya, ditambah pengaturan langkah demi langkah untuk Windows.


TL;DR

  • Pengubah nada suara menggeser frekuensi dasar suara Anda ke atas atau ke bawah dalam semitone atau cents
  • Perubahan pitch tanpa koreksi formant terdengar buatan — selalu gunakan keduanya bersama untuk hasil yang terdengar alami
  • Perubahan pitch real-time berjalan di CPU apa pun pada latensi di bawah 15ms; tidak diperlukan GPU
  • VoxBooster menyediakan slider pitch dan formant independen, ditambah preset untuk kasus penggunaan umum
  • Pengaturan kurang dari lima menit di Windows 10/11: tidak ada driver audio virtual, tidak ada modul kernel
  • Kasus penggunaan: persona gaming, privasi suara Discord, karakter streaming, latihan musik, pembuatan konten

Apa Itu Pengubah Nada Suara?

Pengubah nada suara adalah perangkat lunak yang mencegat audio mikrofon dan menerapkan transformasi frekuensi sebelum mencapai aplikasi apa pun. Operasi matematika disebut perubahan pitch — meregangkan atau mengompresi bentuk gelombang dalam domain frekuensi untuk menaikkan atau menurunkan pitch yang dirasakan dari suara.

Hasilnya: Anda berbicara dengan suara normal Anda, dan setiap aplikasi yang membaca mikrofon Anda — Discord, Zoom, percakapan suara game, OBS, aplikasi perekaman — mendengar versi dengan pitch yang berbeda. Tidak ada pengeditan yang diperlukan. Tidak ada pemrosesan pasca. Perubahan terjadi dalam milidetik yang sama yang diperlukan suara Anda untuk melakukan perjalanan dari mulut Anda ke perangkat lunak.

Apa Perbedaan Antara Pitch dan Formant?

Mengapa perubahan pitch saja terdengar tidak alami, dan apa yang harus Anda lakukan?

Pitch adalah frekuensi dasar — nada dasar yang dihasilkan pita suara Anda. Formant adalah puncak resonan yang dilakukan saluran vokal Anda (tenggorokan, mulut, rongga hidung) di atas dasar itu. Resonansi tersebut adalah apa yang membuat suara terdengar seperti Anda daripada seperti orang lain yang berbicara pada pitch yang sama.

Ketika Anda mengubah pitch tanpa menyesuaikan formant, frekuensi dasar bergerak tetapi resonansi saluran vokal tetap berada di mana pun. Otak Anda dan otak pendengar mengharapkan keduanya berkorelasi — ketika tidak, hasilnya terdengar seperti tape yang dipercepat atau diperlambat, bukan seperti orang yang berbeda yang berbicara secara alami.

Koreksi formant melacak perubahan dan memindahkan resonansi secara proporsional, sehingga hasilnya terdengar seperti orang dengan suara yang benar-benar lebih tinggi atau lebih rendah, bukan seperti rekaman yang diproses. Pengubah pitch vokal yang baik selalu menampilkan kontrol keduanya secara independen. Ketika Anda mengubah pitch ke atas 4 semitone, Anda umumnya ingin memindahkan formant ke atas dengan jumlah yang serupa (meskipun tidak identik) — rasio pasti tergantung pada seberapa alami Anda menginginkan hasilnya terdengar dan karakteristik suara asli Anda.

Semitone, Cents, dan Tempat Memulai

Perubahan pitch diukur dalam semitone dan cent. Semitone adalah interval terkecil dalam musik Barat — langkah antara dua kunci piano yang berdekatan. Dua belas semitone membuat satu oktaf. Cent adalah seperseratus semitone, digunakan untuk penyesuaian halus yang tidak melampaui langkah yang dapat dirasakan.

Titik awal umum untuk berbagai kasus penggunaan pengubah pitch:

TujuanPergeseran pitchPergeseran formantCatatan
Sedikit lebih dalam (halus)-2 hingga -3 semitone-1 hingga -2 semitoneTerdengar alami, sulit dideteksi
Suara jelas lebih dalam-4 hingga -6 semitone-3 hingga -4 semitonePersona gaming, karakter streaming
Sedikit lebih tinggi+2 hingga +3 semitone+1 hingga +2 semitoneLebih lembut, terdengar lebih muda
Suara jelas lebih tinggi+4 hingga +6 semitone+3 hingga +4 semitoneSuara karakter, privasi
Dalam yang dibesar-besarkan (efek)-8 hingga -12 semitone0 (disengaja)Efek monster, demon — buatan adalah tujuannya
Tinggi yang dibesar-besarkan (efek)+8 hingga +12 semitone0 (disengaja)Efek tupai — buatan sesuai desain

Kolom tengah adalah tempat kebanyakan orang salah. Pergeseran formant dalam arah yang sama dengan pergeseran pitch hampir selalu langkah yang tepat untuk hasil yang alami. Rasionya bukan 1:1 — pergeseran pitch 4 semitone biasanya berpasangan dengan pergeseran formant 2-3 semitone, bukan 4. Nilai pastinya memerlukan beberapa detik pengujian A/B dengan suara spesifik Anda.

Bagaimana Pengubah Pitch Real-Time Bekerja Secara Teknis

Perubahan pitch real-time menggunakan salah satu dari dua algoritma utama: phase vocoder atau overlap-add domain waktu (TDOLA/PSOLA). Keduanya bekerja dengan:

  1. Menangkap jendela audio pendek dari mikrofon (biasanya 64-256 sampel)
  2. Menganalisis konten frekuensi jendela itu melalui FFT
  3. Menskalakan bin frekuensi ke atas atau ke bawah ke rasio pitch target
  4. Merekonstruksi sinyal domain waktu dari data frekuensi yang diubah
  5. Mengeluarkan hasilnya ke aliran audio

Seluruh siklus berjalan lebih cepat dari 10ms di CPU modern apa pun — inilah mengapa Anda tidak memerlukan GPU untuk perubahan pitch. Ini adalah operasi matematika ringan, bukan inferensi neural. Pengubah pitch vokal dari tipe ini menambahkan latensi sekitar 5-15ms, yang tidak terlihat dalam percakapan.

Pergeseran formant berjalan sebagai lintasan kedua pada sinyal yang diubah pitch, menerapkan transformasi amplop spektral yang memindahkan puncak resonan terlepas dari dasar. Beberapa alat (termasuk VoxBooster) menjalankan kedua lintasan secara bersamaan dalam satu pipa daripada berurutan, yang menghindari penumpukan latensi tambahan.

Cara Mengatur Pengubah Pitch Suara Real-Time di Windows

Langkah-langkah berikut berlaku untuk VoxBooster di Windows 10 atau 11. Pengaturan membutuhkan waktu kurang dari lima menit.

  1. Unduh dan instal VoxBooster dari voxbooster.com/download. Jalankan penginstal — tidak ada restart yang diperlukan, tidak ada driver kernel yang diinstal.
  2. Luncurkan VoxBooster. Pada peluncuran pertama, wizard perutean audio meminta Anda untuk mengonfirmasi mikrofon Anda. Pilih mikrofon fisik nyata yang biasanya Anda gunakan.
  3. Buka panel Efek. Klik grup preset “Pitch & Formant”, atau arahkan ke slider manual jika Anda menginginkan kontrol penuh.
  4. Atur pergeseran pitch Anda. Seret slider Pitch atau ketik nilai dalam semitone. Nilai negatif menurunkan pitch; nilai positif menaikkannya.
  5. Atur pergeseran formant Anda. Mulai dengan kira-kira setengah nilai pergeseran pitch (misalnya, jika pitch adalah +4, coba formant pada +2). Berbicara kalimat dan sesuaikan sampai terdengar alami daripada diproses.
  6. Buka Discord, game, atau aplikasi lain apa pun. Biarkan input mikrofon disetel ke mikrofon nyata normal Anda di setiap aplikasi. VoxBooster memproses di tingkat audio Windows — aplikasi melihat mikrofon biasa Anda dan mendengar output yang diubah. Tidak ada perubahan per-aplikasi yang diperlukan.
  7. Simpan sebagai preset jika Anda berencana menggunakan kembali pengaturan. Preset dimuat secara instan melalui hotkey, sehingga Anda dapat beralih antara suara alami Anda dan persona yang diubah pitch dalam sesi.

Untuk panduan perutean dan pemecahan masalah yang diperpanjang, panduan pengaturan Discord pengubah suara mencakup setiap kasus tepi termasuk percakapan suara game dan penangkapan OBS simultan.

Kasus Penggunaan Pengubah Nada Suara

Gaming dan Discord

Penggunaan paling umum dari pengubah pitch real-time adalah privasi suara dan pemeliharaan persona dalam lobi gaming dan server Discord. Pergeseran 3-5 semitone di kedua arah dengan koreksi formant yang cocok cukup untuk membuat Anda tidak dikenal sambil terdengar sepenuhnya alami — tidak diproses. Rekan satu tim Anda mendengar suara yang sedikit berbeda; tidak satu pun dari mereka akan tahu kecuali Anda memberi tahu mereka.

Untuk roleplay karakter di server RPG, game papan di Discord, atau percakapan suara dalam game RPG, pergeseran yang lebih dramatis menciptakan identitas vokal yang berbeda tanpa mencapai latensi kloning AI. Lihat panduan pengubah suara untuk game untuk catatan perutean khusus game.

Streaming dan Pembuatan Konten

Streamer menggunakan perubahan pitch untuk mempertahankan konsistensi ketika suara alami mereka bervariasi di seluruh sesi panjang (kelelahan, suhu sekitar, hidrasi semuanya mempengaruhi pitch). Menetapkan koreksi pitch halus 1-2 semitone ke atas dengan koreksi formant halus dapat menyelaraskan varian tersebut tanpa terdengar diproses. Pergeseran lebih berat menciptakan persona streaming — suara karakter yang berbeda yang diasosiasikan audiens dengan format konten tertentu.

VoxBooster memungkinkan Anda menumpuk perubahan pitch dengan efek pengubah suara lainnya, sehingga suara yang diubah pitch juga dapat membawa pemrosesan karakter tambahan (reverb, kompresi, modulasi ringan) dalam satu preset.

Latihan Musik dan Penulisan Lagu

Musisi menggunakan pengubah pitch real-time untuk berlatih bernyanyi harmoni dengan diri mereka sendiri, untuk memeriksa bagaimana melodi terdengar dalam kunci yang berbeda sebelum berkomitmen pada transposisi, atau untuk menjelajahi bagaimana lirik duduk di register yang tidak dapat dengan nyaman dijangkau suara alami mereka. Pada latensi di bawah 15ms, penundaan pemantauan tidak terdengar melalui headphone.

Ini berbeda dari koreksi pitch (autotune), yang menyentakkan pitch Anda ke nada terdekat. Pengubah pitch menggeser seluruh sinyal dengan interval tetap; itu tidak mengoreksi intonasi. Jika Anda menginginkan perilaku koreksi, itu adalah alat yang berbeda. Untuk perubahan pitch sebagai alat kreatif atau eksplorasi secara real-time, pergeseran berbasis DSP adalah pendekatan yang tepat.

Privasi Suara

Tidak semua orang yang ingin mengubah pitch suara membangun persona. Dalam game multipemain kompetitif, de-anonimisasi suara adalah kekhawatiran nyata — beberapa pemain merekam dan menganalisis audio suara. Pergeseran konsisten 3-4 semitone dengan koreksi formant membuat identifikasi suara dari rekaman jauh lebih sulit tanpa membuat Anda terdengar notiseably diproses dalam percakapan.

Bagaimana Pengubah Pitch VoxBooster Dibandingkan dengan Alat Lain

Beberapa alat menawarkan perubahan pitch suara. Mereka berbeda dalam cara mereka menerapkan kontrol formant, di mana mereka memproses audio, dan apa yang mereka merlukan untuk pengaturan.

Voicemod menawarkan pergeseran pitch dalam perpustakaan efeknya, tetapi kontrol formant terbatas pada nilai yang terikat preset daripada slider independen. Jika rasio formant preset tidak sesuai dengan suara Anda, hasilnya terdengar buatan dan ada tempat tinggal terbatas tanpa membeli paket tambahan.

Clownfish Voice Changer menyediakan pergeseran pitch dasar tetapi tidak ada koreksi formant sama sekali. Hasilnya pada pergeseran di atas 3 semitone terlihat tidak alami — ini bekerja untuk tujuan efek komik tetapi bukan untuk pemeliharaan persona suara yang realistis.

Alat pitch Audacity sangat baik untuk pengeditan audio offline tetapi tidak beroperasi secara real-time. Anda merekam terlebih dahulu, memproses file, dan mengekspor. Jika kasus penggunaan Anda adalah obrolan suara langsung, gaming, atau streaming, Audacity adalah alat yang salah untuk tugas spesifik ini.

VoxBooster menyediakan slider pitch dan formant independen dengan pratinjau real-time, tidak ada instalasi driver virtual, dan pemrosesan latensi rendah lokal di bawah 15ms untuk perubahan pitch berbasis DSP. Arsitektur tanpa driver kernel berarti bekerja dengan andal di Windows 10 dan 11 tanpa peringatan kompatibilitas, masalah penandatanganan driver, atau ketidakstabilan sistem sesekali yang dapat diperkenalkan driver audio kernel. Ini juga mendukung perubahan suara AI dan perubahan pitch dalam antarmuka yang sama, sehingga Anda dapat menggunakan kedua mode tanpa beralih aplikasi.

Untuk perbandingan lebih mendalam tentang kapan pergeseran pitch DSP mengalahkan kloning AI dan sebaliknya, panduan pergeseran pitch vs pengubah suara AI mencakup trade-off secara detail.

Pergeseran Pitch untuk Tujuan Suara Tertentu

Terdengar Lebih Dalam

Turunkan slider pitch 3-5 semitone dan turunkan formant 2-3 semitone. Berbicara perlahan dan biarkan pergeseran melakukan pekerjaannya — tergesa-gesa ucapan Anda menghilangkan kealamiahan. Pergeseran -4 semitone menempatkan suara pria tipikal ke dalam rentang yang terdengar berwenang; -6 atau lebih mulai terdengar seperti efek karakter daripada suara alami.

Terdengar Lebih Tinggi atau Lebih Feminin

Naikkan pitch 4-6 semitone dan formant 2-3 semitone. Pergeseran formant sangat penting di sini — tanpa itu, pergeseran pitch tinggi terdengar seperti tape yang dipercepat. Dengan itu, suara terdengar seperti karakter vokal yang secara genuine lebih ringan. Jika Anda bertujuan untuk suara yang meyakinkan yang terdengar feminin, menggabungkan pergeseran pitch dan formant dengan kloning suara AI VoxBooster menghasilkan hasil yang lebih alami daripada pergeseran pitch DSP saja — dengan biaya latensi yang lebih tinggi.

Suara Karakter dan Efek

Untuk efek kartun yang dibesar-besarkan — sangat tinggi atau sangat rendah — ketidakcocokan formant dan pitch disengaja. Atur pitch ke -10 semitone dan biarkan formant tidak berubah untuk efek monster lambat. Atur pitch ke +10 dan biarkan formant tidak berubah untuk hasil tupai. Efek ini bekerja dengan tepat karena terdengar buatan. Kebuatannya adalah intinya.

Kesalahan Umum Saat Menggunakan Pengubah Pitch Suara

Mengubah pitch tanpa menyesuaikan formant. Ini adalah alasan tunggal paling umum mengapa suara yang diubah pitch terdengar diproses daripada alami. Selalu gunakan kontrol keduanya bersama.

Pergeseran terlalu jauh terlalu cepat. Lebih dari 6-7 semitone di kedua arah memerlukan koreksi formant yang signifikan dan masih terdengar kurang alami daripada pergeseran yang lebih kecil. Jika Anda memerlukan suara yang sangat berbeda, kloning suara AI menangani transformasi yang lebih besar lebih meyakinkan.

Menjalankan perangkat audio virtual yang Anda tidak butuhkan. Banyak panduan lama memberi tahu Anda untuk menginstal VB-CABLE atau perangkat audio virtual serupa. VoxBooster tidak memerlukan ini — itu memproses audio di tingkat yang lebih rendah. Menambahkan perangkat tidak perlu memperkenalkan latensi ekstra dan merupakan titik kegagalan lainnya.

Tidak menguji sebelum sesi. Pengaturan pitch dan formant yang terdengar tepat di ruangan yang tenang dapat terdengar berbeda ketika gain mikrofon gaming ditingkatkan. Uji pada tingkat mikrofon sesi aktual Anda, bukan pada tingkat desktop.

Menggunakan pergeseran pitch ketika kloning AI akan melayani lebih baik. Jika tujuan Anda adalah persona yang meyakinkan yang terdengar seperti orang yang sama sekali berbeda, kloning suara AI akan menghasilkan hasil yang jauh lebih alami pada jumlah pergeseran apa pun. Periksa halaman harga untuk rencana yang mencakup akses klon AI penuh.

Pertanyaan yang Sering Diajukan

Apa itu pengubah nada suara? Pengubah nada suara adalah perangkat lunak yang menggeser frekuensi dasar suara Anda ke atas atau ke bawah secara real-time. Perangkat ini mencegat input mikrofon, menerapkan algoritma perubahan pitch, dan mengeluarkan audio yang dimodifikasi. Kualitas bervariasi berdasarkan apakah alat juga menyesuaikan formant agar sesuai dengan pitch baru.

Apa perbedaan antara pitch dan formant? Pitch adalah frekuensi dasar — seberapa tinggi atau rendah suatu nada terdengar. Formant adalah puncak resonan di saluran vokal yang memberikan suara karakteristik timbre dan warna. Perubahan pitch saja tanpa koreksi formant terdengar tidak alami dan kartun.

Berapa semitone yang harus saya ubah untuk terdengar seperti gender yang berlawanan? Titik awal kasar adalah 4-6 semitone ke atas untuk pergeseran maskulin-ke-feminin, atau 4-6 semitone ke bawah untuk feminin-ke-maskulin. Koreksi formant sangat penting pada rentang tersebut — perubahan pitch saja tanpa penyesuaian formant akan terdengar buatan.

Bisakah pengubah pitch real-time bekerja di Discord dan game? Ya. Alat seperti VoxBooster memproses audio di tingkat driver Windows, sehingga Discord, percakapan suara game, OBS, dan aplikasi lain apa pun yang membaca mikrofon Anda akan mendengar output yang diubah pitch tanpa konfigurasi per-aplikasi.

Apa perbedaan antara cents dan semitones dalam perubahan pitch? Semitone adalah satu langkah dalam skala musik kromatis — interval antara dua kunci piano yang berdekatan. Cent adalah seperseratus semitone. Semitone digunakan untuk perubahan pitch kasar; cent memungkinkan penyesuaian halus dalam semitone tanpa lompatan yang terdengar.

Apakah perubahan pitch berfungsi di CPU tanpa GPU? Ya. Perubahan pitch dan perubahan formant adalah operasi DSP, bukan inferensi neural — mereka berjalan di CPU modern apa pun pada latensi di bawah 15ms. Anda hanya membutuhkan GPU jika menjalankan kloning suara AI di atas perubahan pitch.

Bagaimana pengubah pitch vokal berbeda dengan pengubah suara AI? Pengubah pitch vokal menggeser frekuensi suara yang ada. Pengubah suara AI mensintesis ulang konten ucapan Anda dalam timbre suara target yang sama sekali berbeda. Pengubah pitch lebih cepat (di bawah 15ms) dan bekerja di perangkat keras apa pun; kloning AI terdengar lebih alami tetapi memerlukan lebih banyak daya pemrosesan.

Kesimpulan

Pengubah nada suara adalah salah satu alat audio real-time paling mudah diakses yang tersedia — berjalan di CPU apa pun, menambah latensi di bawah 15ms, dan tidak memerlukan perangkat keras khusus. Perbedaan antara hasil yang terdengar alami dan hasil yang terdengar diproses tergantung pada kontrol formant. Dapatkan pergeseran formant yang tepat dan perubahan 4 semitone tidak dapat dideteksi; abaikan itu dan pergeseran yang sama terdengar seperti efek kartun.

VoxBooster memberi Anda slider pitch dan formant independen, perpustakaan preset untuk kasus penggunaan umum, dan opsi untuk menumpuk kloning suara AI di atas pergeseran DSP ketika Anda memerlukan transformasi yang lebih dramatis. Tidak ada driver kernel untuk diinstal, tidak ada perangkat audio virtual untuk dikonfigurasi — bekerja dengan Discord, percakapan suara game, OBS, dan aplikasi Windows lainnya yang membaca mikrofon.

Unduh VoxBooster di voxbooster.com/download dan coba gratis selama tiga hari, tidak diperlukan kartu kredit. Pengaturan membutuhkan waktu kurang dari lima menit, dan tampilan latensi memberi tahu Anda dengan tepat apa yang disampaikan perangkat keras Anda.

Coba VoxBooster — uji coba gratis 3 hari.

Kloning suara real-time, soundboard, dan efek — di mana pun kamu sudah biasa bicara.

  • Tanpa kartu kredit
  • ~30ms latensi
  • Discord · Teams · OBS
Coba gratis 3 hari