Pergeseran Formant Dijelaskan: Perubahan Suara Alami

Pelajari cara pergeseran formant membuat pengubah suara AI terdengar meyakinkan. Pahami resonansi saluran vokal, pelestarian formant, dan cara menyesuaikan hasil yang alami.

Pergeseran Formant Dijelaskan: Perubahan Suara Alami

Pengubah suara AI yang hanya menggerakkan pitch terdengar palsu dalam tiga detik. Rahasia sebenarnya di balik transformasi suara yang meyakinkan adalah pergeseran formant - menyesuaikan frekuensi resonan yang menentukan karakter akustik saluran vokal Anda, independen dari pitch. Setelah Anda memahami cara kerja formant, Anda akan langsung mendengar apa yang dilakukan pengubah suara murah, dan Anda akan tahu persis tombol mana yang harus dicapai ketika transformasi Anda sendiri terdengar diproses.

Tulisan ini mencakup fisika di balik formant dalam bahasa yang jelas, mengapa pergeseran pitch tanpa kontrol formant terdengar seperti chipmunk atau pita yang diperlambat, bagaimana pengubah suara AI modern menangani formant dibandingkan dengan alat DSP yang lebih lama, dan cara menggunakan kontrol formant VoxBooster untuk mendapatkan hasil yang paling alami.


TL;DR

  • Formant adalah puncak frekuensi resonan yang dihasilkan oleh bentuk saluran vokal Anda - mereka menentukan bunyi vokal dan karakter suara.
  • Pergeseran pitch saja menggerakkan frekuensi fundamental tetapi meninggalkan formant di tempat, menciptakan efek “kartun” yang tidak alami.
  • Pergeseran formant menyesuaikan amplop spektral terpisah dari pitch, yang membuat transformasi suara terdengar seperti orang yang benar-benar berbeda.
  • Rasio ideal pergeseran pitch terhadap pergeseran formant bergantung pada tujuan transformasi: penyamar halus, suara karakter, atau penyeberangan gender penuh.
  • Pengubah suara AI membuat model lintasan formant secara terus-menerus, menghasilkan hasil yang lebih halus daripada DSP pembengkokan spektral tetap.
  • VoxBooster memiliki slider pitch dan formant independen, plus kloning suara AI yang menangani formant secara otomatis.

Apa Itu Formant?

Pita suara Anda menghasilkan suara dengung dengan frekuensi fundamental - itulah pitch Anda. Tetapi dengung mentah itu hampir tidak dapat dikenali sebagai suara. Apa yang membentuknya menjadi vokal yang dapat dikenali, tekstur emosional, dan warna personal adalah resonansi ruang di atas laring Anda: tenggorokan, mulut, bibir, dan rongga hidung bersama-sama membentuk saluran vokal.

Saluran vokal adalah tabung dengan bentuk yang kompleks dan terus berubah. Seperti rongga resonan apa pun, ia memiliki frekuensi resonan alami - pita frekuensi di mana gelombang suara saling memperkuat daripada membatalkan. Puncak dalam spektrum output ini disebut formant, dan mereka dinomori dari terendah ke tertinggi: F1, F2, F3, dan seterusnya.

F1 dan F2 melakukan sebagian besar pekerjaan persepsi. Vokal dalam “heed” memiliki F1 rendah dan F2 sangat tinggi. Vokal dalam “hod” memiliki F1 dan F2 di kisaran menengah tetapi lebih dekat bersama-sama. Otak Anda menggunakan kedua puncak itu untuk mengidentifikasi vokal hampir secara instan, itulah mengapa formant kadang-kadang digambarkan sebagai “sidik jari” vokal. Untuk membaca lebih lanjut tentang teori akustik, artikel Wikipedia tentang formant adalah titik awal yang solid, dan artikel tentang saluran vokal memberikan konteks anatomis.

F3 dan di atas berkontribusi pada warna personal - kualitas yang memungkinkan Anda mengenali suara teman di telepon sebelum mereka mengucapkan nama mereka. F3 sangat berkorelasi dengan panjang saluran vokal dan anatomis individu.

Mengapa Panjang Saluran Vokal Penting

Orang dengan saluran vokal yang lebih panjang memiliki formant yang berjarak lebih rendah dalam spektrum. Inilah mengapa, rata-rata, pria memiliki formant yang lebih rendah daripada wanita, dan orang dewasa memiliki formant yang lebih rendah daripada anak-anak - bukan karena pitch saja, tetapi karena panjang saluran fisik. Seorang pria enam kaki dan seorang wanita lima kaki mungkin sesekali mencapai pitch musik yang sama, tetapi formant mereka akan tetap berada di posisi spektral yang sepenuhnya berbeda.

Hubungan antara ukuran tubuh, panjang saluran, dan posisi formant bukan hanya omong kosong akademis. Itu adalah seluruh alasan mengapa mengubah pitch saja terdengar salah. Ketika Anda memperlambat rekaman untuk menurunkan pitch, Anda juga memperlambat setiap transisi formant - membuat vokal terdengar panjang dan lamban, seperti rekaman yang diputar dengan kecepatan yang salah. Ketika Anda mempercepat, formant tetap proporsional di tempat tetapi sekarang terasa terlalu tinggi dan terlalu rapat, menghasilkan artefak chipmunk yang familiar.

Suara nyata yang beroperasi pada pitch yang berbeda sebenarnya memiliki formant yang dihasilkan oleh konfigurasi saluran vokal yang berbeda. Posisi formant bergeser, tetapi bukan dalam proporsi linier sederhana ke pitch. Transformasi suara yang baik harus membuat model hubungan itu.

Pergeseran Pitch vs. Pergeseran Formant

Di sinilah sebagian besar pengubah suara murah jatuh. Pergeseran pitch mudah: kalikan atau bagi konten frekuensi sinyal audio, kompensasikan waktu untuk menghindari terdengar seperti perubahan pita, selesai. Hasilnya adalah suara Anda dengan fundamental yang dinaikkan atau diturunkan, tetapi amplop spektral - bentuk keseluruhan respons frekuensi - identik dengan suara asli Anda.

Pergeseran formant, di sisi lain, menggerakkan amplop spektral sambil meninggalkan struktur pitch yang mendasari saja (atau menyesuaikannya secara terpisah). Ini bekerja dengan menganalisis spektrum jangka pendek audio, memperkirakan amplop (kurva halus yang menghubungkan puncak harmonik), membengkokkan amplop itu naik atau turun dalam frekuensi, kemudian mensintesis ulang sinyal.

Perbedaan dalam praktik:

TeknikApa yang bergerakApa yang tetapArtefak Tipikal
Pergeseran pitch sajaFrekuensi fundamentalAmplop spektral / formantChipmunk (naik) atau gerakan lambat (turun)
Pergeseran formant sajaAmplop spektralPitch fundamentalTerdengar seperti orang yang berbeda berbicara dengan pitch asli Anda
Keduanya, rasio benarKeduanya, cocokTransformasi meyakinkan ke tipe suara yang berbeda
Keduanya, rasio salahKeduanya, tidak cocokSuara yang diproses, robotis, atau berongga

“Rasio yang benar” sangat bergantung pada transformasi yang Anda coba capai. Menggeser pitch naik 4 semitone dan formant naik 15-20% adalah perkiraan kasar dari apa yang terjadi ketika orang yang lebih tinggi berbicara pada pitch yang sama dengan orang yang lebih pendek. Tetapi hubungan aktual adalah nonlinier dan tergantung suara, itulah di mana model AI memiliki keuntungan signifikan dibanding rantai DSP tetap.

Pelestarian Formant: Kasus Penggunaan Lain

Tidak setiap manipulasi formant tentang transformasi. Pelestarian formant - kemampuan untuk menahan formant konstan sementara pitch berubah - sama pentingnya dalam skenario tertentu.

Ketika penyanyi pitch-correct suara mereka atau mentransposisi pertunjukan, pergeseran pitch naif mengubah vokal mereka menjadi sesuatu yang tidak dapat dikenali pada ekstrem. Pelestarian formant menjaga kualitas vokal stabil bahkan saat nada berubah. Ini adalah standar dalam perangkat lunak pitch correction profesional.

Untuk pengubah suara, pelestarian penting ketika Anda menginginkan penyesuaian halus: menyetel suara Anda sedikit lebih hangat atau lebih cerah tanpa mengubah identitas warna Anda, atau mengkompensasi mikrofon yang menambah kekerasan dalam kisaran frekuensi tertentu. Ini juga berguna untuk mencocokkan ritme karakter spesifik tanpa membuat diri Anda tidak dapat dikenali selama streaming langsung.

Slider formant VoxBooster beroperasi di sekitar nol - memindahkannya positif menggeser formant naik (lebih cerah, kualitas saluran yang lebih kecil), memindahkannya negatif menggesernya ke bawah (lebih gelap, kualitas saluran yang lebih besar). Membiarkannya di nol dengan hanya pitch yang disesuaikan memberikan Anda efek chipmunk jika Anda mendorong terlalu jauh. Mengunci keduanya bersama dengan rasio yang dikalibrasi memberikan Anda transformasi. Menyesuaikan formant saja memberikan Anda pemahat warna halus.

Bagaimana Alat DSP Tradisional Menangani Formant

Pengubah suara klasik menggunakan teknik yang disebut LPC (Linear Predictive Coding) atau estimasi amplop cepstral untuk mengekstrak amplop spektral dari bingkai audio pendek, membengkokkan amplop itu dengan pengali tetap, kemudian merekonstruksi audio. Alat seperti MorphVOX dan versi awal Voicemod menggunakan varian pendekatan ini.

Ini bekerja dengan cukup baik pada jumlah pergeseran sedang pada vokal yang berkelanjutan. Masalahnya muncul di tepinya:

Konsonan dan transisi. Amplop spektral selama frikatif (suara “s” atau “f”) atau ledakan berhenti tidak memiliki struktur yang sama dengan vokal. Menerapkan pembengkokan amplop yang dioptimalkan vokal ke konsonan atau mengaburkan konsonan atau menghasilkan artefak.

Pidato cepat. Analisis bingkai LPC mengasumsikan sinyal hampir stasioner dalam setiap jendela pendek. Pidato cepat dengan transisi formant cepat menantang asumsi itu, menghasilkan artefak “berbuih” yang terdengar.

Pengali tetap. Pengali pergeseran formant tunggal yang diterapkan secara seragam di seluruh spektrum tidak cocok dengan bagaimana saluran vokal nyata berperilaku. Formant nyata tidak semuanya bergeser dengan rasio yang sama ketika konfigurasi saluran vokal berubah.

Keterbatasan ini tidak fatal - banyak streamer menggunakan changer berbasis DSP tradisional dengan sukses - tetapi mereka berarti mendapatkan hasil alami memerlukan penyesuaian hati-hati, dan beberapa transformasi tidak dapat dicapai dengan bersih.

Bagaimana Pengubah Suara AI Menangani Formant Berbeda

Pengubah suara AI modern - dan di sinilah teknologi benar-benar maju - tidak memperkirakan dan membengkokkan amplop spektral dalam pengertian tradisional. Sebaliknya, mereka menggunakan jaringan saraf yang dilatih pada dataset besar ucapan manusia untuk mempelajari struktur statistik karakteristik suara, termasuk bagaimana formant bergerak selama ucapan alami.

Pada waktu runtime, model memproses audio masuk dan menghasilkan output yang mencerminkan karakteristik formant suara target, daripada menerapkan transformasi matematika tetap ke formant masuk. Perbedaan praktis adalah:

Penanganan konsonan. Karena model telah mempelajari cara suara nyata menghasilkan konsonan, ia menanganinya lebih alami daripada pembengkokan spektral generik.

Adaptasi berkelanjutan. Alih-alih menganalisis bingkai tetap secara independen, model berulang atau berbasis perhatian dapat menggunakan konteks dari bingkai sekitarnya, membuat transisi antara fonem lebih halus.

Formant yang sesuai target. Ketika mengkloning suara tertentu, model saraf menghasilkan formant yang sesuai dengan apa yang sebenarnya dilakukan oleh suara orang itu, daripada apa yang diprediksi formula pergeseran generik.

Komprominya adalah biaya komputasi dan latensi. Konversi suara saraf lebih menuntut daripada LPC. Mendapatkannya di bawah 10ms round-trip pada perangkat keras konsumen adalah masalah teknik nyata. Pipeline berbasis low-latency audio capture VoxBooster mencapai latensi audio sub-10ms dengan memproses pada thread audio dengan ukuran buffer yang hati-hati, menjaga pemrosesan saraf pada thread latar belakang khusus dan pra-buffering hasilnya - pilihan desain yang sangat penting untuk penggunaan langsung di Discord atau comms dalam game.

Pergeseran Formant untuk Tujuan Perubahan Suara Spesifik

Transformasi Penyeberangan Gender

Ini adalah transformasi yang paling umum diinginkan orang dari pengubah suara, dan juga yang paling sulit dilakukan dengan meyakinkan. Transformasi male-to-female yang meyakinkan memerlukan pergeseran formant naik sekitar 15-25% sambil juga menaikkan pitch - tetapi jumlah pastinya tergantung pada suara Anda, target Anda, dan konten fonetik dari apa yang Anda katakan.

Kesalahan umum adalah menaikkan pitch tanpa menyentuh formant, kemudian bertanya-tanya mengapa itu terdengar jelas diproses. Kesalahan umum kedua adalah menggunakan nilai preset yang dikalibrasi untuk tipe suara yang berbeda. Jika Anda memiliki suara pria yang lebih dalam dari rata-rata, preset yang dirancang untuk suara pria kisaran menengah masih akan terdengar mati.

Mulai dengan pergeseran formant kecil (5-10%) dan dengarkan. Suara pria cenderung memiliki F1 sekitar 500 Hz dan F2 sekitar 1500 Hz untuk vokal netral. Suara wanita memiliki F1 lebih dekat 700 Hz dan F2 sekitar 2000 Hz. Memindahkan formant naik 20-25% membawa Anda ke wilayah yang tepat. Kemudian sesuaikan pitch - biasanya Anda akan memerlukan pergeseran pitch yang lebih sedikit daripada yang Anda pikirkan, karena pergeseran formant sudah melakukan banyak pekerjaan persepsi.

Suara Karakter

Suara robot, karakter alien, demon, dan efek serupa sering kali menggunakan pergeseran formant dengan cara yang sengaja memecahkan model saluran vokal alami - itulah intinya. Menggeser formant secara dramatis ke bawah menciptakan efek “demon besar” stereotipikal. Pergeseran naik ekstrem dengan penurunan pitch ringan menciptakan tekstur yang sangat tidak manusiawi yang terasa mekanis atau ekstrawaktu.

Untuk referensi, lihat posting terkait tentang efek suara robot dan efek suara radio untuk teknik pemrosesan pelengkap yang berpasangan dengan baik dengan pekerjaan formant.

Penyamar Halus atau Penyembunyian Privasi

Tidak setiap kasus penggunaan adalah transformasi dramatis. Beberapa streamer ingin berbicara dengan cara yang dapat dikenali secara jelas oleh audiens mereka tetapi tidak dapat dikaitkan dengan suara nyata mereka. Pergeseran formant kecil (5-10%) dikombinasikan dengan penyesuaian pitch sedang (2-4 semitone) sudah cukup untuk membuat perangkat lunak identifikasi suara gagal tanpa membuat Anda terdengar jelas diproses untuk pendengar manusia.

Koreksi Pitch Tanpa Perubahan Warna

Jika Anda menggunakan fitur koreksi pitch VoxBooster untuk tetap pada nada selama interlude yang dinyanyikan atau untuk podcast pada pitch yang lebih resonan, mengaktifkan pelestarian formant menjaga vokal Anda alami sementara pitch menyesuaikan. Ini adalah teknik yang sama yang digunakan oleh penyiar profesional untuk memindahkan pitch bicara mereka yang biasa tanpa melatih laring mereka.

Menggunakan Kontrol Formant di VoxBooster

Slider formant di panel efek suara VoxBooster dinyatakan dalam semitone, cocok dengan unit slider pitch untuk pasangan intuitif. Berikut adalah alur kerja praktis:

  1. Buka VoxBooster dan pilih mode Voice Effects dari sidebar.
  2. Atur pergeseran pitch baseline untuk transformasi yang Anda inginkan - katakan, +4 semitone untuk suara yang lebih ringan.
  3. Dengan pitch yang ditetapkan, pindahkan slider formant perlahan ke atas. Dengarkan dengan headphone jika memungkinkan. Anda akan mendengar suara bergeser dari “versi pitch-shifted saya” menuju “orang yang berbeda.”
  4. Sweet spot untuk perubahan pitch +4 semitone yang terdengar alami biasanya sekitar +2 hingga +3 semitone pergeseran formant. Rasionya bukan 1:1 karena formant berskala proporsional dengan panjang saluran, bukan linier dengan semitone musik.
  5. Jika Anda menggunakan mode kloning suara AI, model saraf memilih formant secara otomatis. Slider offset formant kemudian bertindak sebagai penyesuaian fine-tuning halus di atas output model - berguna jika suara target terdengar sedikit mati dalam kisaran vokal tertentu.

Untuk pengguna OBS, VoxBooster mendaftarkan sebagai perangkat audio virtual standar. Anda memilihnya sebagai sumber mikrofon di pengaturan OBS, dan audio yang digeser formant merutekan persis seperti input mikrofon lainnya. Tidak ada plugin yang diperlukan di sisi OBS. Lihat posting how-to-use-voice-changer-on-discord untuk setup Discord yang setara - prinsip routing identik.

Anda juga dapat memeriksa halaman fitur VoxBooster untuk daftar lengkap efek real-time yang bekerja bersama pergeseran formant, dan halaman fitur pengubah suara untuk spesifikasi teknis lengkap.

Kesalahan Umum dan Cara Memperbaikinya

Pergeseran formant tanpa mendengarkan dengan headphone. Bleed speaker dan akustik ruangan menyembunyikan artefak yang diperkenalkan pemrosesan formant. Apa yang terdengar baik melalui speaker sering terdengar jelas diproses melalui headphone, yang merupakan cara audiens streaming Anda mendengar Anda.

Menggunakan preset tanpa mengkalibrasi untuk suara Anda. Preset dibangun pada suara “tipikal” di dataset pengembang. Jika suara Anda tidak tipikal - resonansi tidak biasa, aksen, jangkauan pitch - Anda akan mendapatkan hasil yang lebih baik menghabiskan lima menit mengkalibrasi secara manual daripada mengikuti preset.

Terlalu banyak pergeseran dalam satu arah. Pergeseran formant adalah efek yang kuat. Pergeseran 20% sudah transformasi yang signifikan. Bergerak ke 40% mulai menghasilkan artefak berongga, mirip tabung karena Anda telah mendorong formant ke wilayah frekuensi di mana mereka berinteraksi dengan buruk dengan seri harmonik.

Mengabaikan interaksi dengan penekan bising. Filter penekan bising, termasuk penekan bawaan VoxBooster, beroperasi pada sinyal sebelum atau sesudah rantai efek tergantung pada routing Anda. Jika penekan bising upstream pergeseran formant, smearing spektral dari penekan dapat menurunkan estimasi formant. Jika downstream, penekan mungkin makan beberapa konten frekuensi tinggi sinyal yang digeser formant. Bereksperimen dengan urutan jika Anda menggunakan keduanya.

Mengharapkan kloning AI menjadi pengganti untuk menyetel rantai efek. Kloning suara AI menangani formant untuk Anda, tetapi output model masih dipengaruhi oleh kualitas suara masuk Anda, respons frekuensi mikrofon Anda, dan bising latar belakang. Sinyal bersih masuk ke model menghasilkan transformasi yang jauh lebih bersih daripada rekaman berisik atau beresonansi ruangan.

Apa yang Membuat Suara Terdengar Seperti Orang Tertentu?

Ini adalah pertanyaan yang lebih dalam daripada yang tampak sekilas, dan relevan untuk memahami apa yang sebenarnya dilakukan pengubah suara AI. Mengidentifikasi pembicara dari suara mereka melibatkan:

  • Jangkauan frekuensi fundamental dan variasi (melodi berbicara mereka)
  • Frekuensi formant dan lintasan dinamis mereka (bentuk vokal mereka)
  • Parameter kualitas suara: keroncongan, kekerasan, nasalitas, derajat penutupan lipatan vokal
  • Ritme, laju, dan prosodi (cara mereka menjeda dan menekankan)
  • Karakteristik resonansi dari rongga hidung dan sinus

Pergeseran pitch dan formant sederhana dapat memperkirakan dua yang pertama. Yang ketiga dan keempat memerlukan pemrosesan yang lebih canggih - membuat model distribusi statistik fitur-fitur ini untuk suara target, yang dilakukan konversi suara saraf. Prosodi (yang keempat) biasanya tidak diubah sama sekali oleh pengubah suara, itulah mengapa pola bicara Anda tetap dapat dikenali sendiri bahkan ketika semuanya lainnya ditransformasi.

Memahami ini membantu menetapkan ekspektasi yang realistis. Pengubah suara dapat mengubah cara Anda berbunyi. Itu tidak dapat mengubah cara Anda berbicara. Kombinasi transformasi suara dengan mimikri prosodis yang disengaja adalah apa yang menghasilkan imitasi paling meyakinkan - tetapi bagian kedua memerlukan praktik, bukan perangkat lunak.

Untuk pembaca yang tertarik pada ilmu akustik yang lebih dalam, makalah klasik ini oleh Gunnar Fant tentang akustik saluran vokal adalah referensi dasar, dan dokumentasi perangkat audio virtual OBS mencakup cara kerja routing audio virtual di tingkat OS.

Pertanyaan yang Sering Diajukan

Apa itu pergeseran formant dalam pengubah suara?

Pergeseran formant menggerakkan frekuensi resonan saluran vokal Anda - puncak dalam spektrum suara Anda yang menentukan bunyi vokal dan karakter warna - tanpa harus mengubah pitch. Ini adalah apa yang membuat transformasi suara terdengar seperti orang yang berbeda daripada hanya versi Anda yang dipercepat atau diperlambat.

Apakah pergeseran formant sama dengan pergeseran pitch?

Tidak. Pergeseran pitch menaikkan atau menurunkan frekuensi fundamental suara Anda, seperti nada musik naik atau turun. Pergeseran formant mengubah karakteristik rongga resonan - independen dari pitch. Melakukan keduanya bersama-sama, dengan rasio yang tepat, adalah apa yang menghasilkan transformasi suara yang meyakinkan.

Mengapa pergeseran pitch saja terdengar tidak alami?

Ketika Anda menggeser pitch suara tanpa menyesuaikan formant, puncak resonan tetap berada di posisi spektral yang sama sementara fundamental bergerak. Hasilnya terdengar seperti chipmunk kartun atau rekaman gerakan lambat, karena tidak ada suara manusia nyata yang berperilaku seperti itu. Suara alami memiliki formant yang berskala dengan panjang saluran vokal.

Apa itu pelestarian formant dan kapan saya menginginkannya?

Pelestarian formant menjaga frekuensi resonan asli Anda bahkan ketika pitch Anda berubah. Anda menginginkannya ketika Anda bernyanyi atau berbicara dan perlu tetap pada pitch tanpa terdengar diproses. Aplikasi paduan suara menggunakannya banyak. Dalam konteks pengubah suara, pelestarian berguna ketika Anda menginginkan penyetelan halus tanpa mengubah karakter warna.

Bagaimana pengubah suara AI menangani formant berbeda dari alat yang lebih lama?

Alat DSP tradisional menggeser formant sebagai pembengkokan amplop spektral tetap. Pengubah suara AI modern menganalisis suara secara terus-menerus dan menerapkan model saraf yang memprediksi lintasan formant alami untuk suara target, menghasilkan transisi yang lebih halus dan lebih mirip kehidupan bahkan selama pidato cepat dan ledakan konsonan.

Apakah VoxBooster memiliki kontrol formant?

Ya. VoxBooster mengekspos slider pergeseran formant di panel efek suara, independen dari slider pitch. Anda dapat memindahkannya bersama-sama atau terpisah. Untuk mode kloning suara AI, model saraf menangani formant secara otomatis tetapi Anda masih dapat menyesuaikan offset formant untuk menyempurnakan output.

Apakah menggunakan pergeseran formant akan menyebabkan masalah dengan anti-cheat atau deteksi suara dalam game?

Tidak. Pergeseran formant adalah operasi DSP audio standar yang diterapkan pada aliran audio sebelum mencapai mikrofon virtual. VoxBooster menggunakan low-latency audio capture dan mendaftarkan perangkat audio virtual standar - game dan sistem anti-cheat melihat masukan mikrofon normal, bukan kait level driver.

Kesimpulan

Pergeseran formant adalah perbedaan antara perubahan suara yang membuat orang bertanya “apakah Anda menggunakan pengubah suara?” dan yang membuat orang bertanya “apakah itu suara asli Anda?” Pergeseran pitch tanpa kesadaran formant terdengar seperti trik studio. Pitch dan formant bersama-sama, disesuaikan dengan rasio yang tepat untuk tujuan transformasi Anda, terdengar seperti orang yang berbeda.

Jika Anda serius tentang pekerjaan suara - streaming, pembuatan konten, privasi, atau hanya bereksperimen - layak menghabiskan malam benar-benar memahami apa yang dilakukan formant, kemudian menerapkan pemahaman itu pada setup Anda daripada mengikuti preset. Kontrol tidak rumit setelah Anda memiliki model mental.

VoxBooster memberi Anda slider independen untuk keduanya, plus kloning suara AI yang menangani pemetaan formant secara otomatis untuk transformasi suara target. Uji coba 3 hari gratis sudah cukup untuk menjalankan setiap alur kerja yang dijelaskan di posting ini.

Download VoxBooster - uji coba gratis 3 hari, tidak ada kartu kredit yang diperlukan.

Coba VoxBooster — uji coba gratis 3 hari.

Kloning suara real-time, soundboard, dan efek — di mana pun kamu sudah biasa bicara.

  • Tanpa kartu kredit
  • ~30ms latensi
  • Discord · Teams · OBS
Coba gratis 3 hari