Yerel olarak, gerçek zamanlı çalışan ses klonlama yazılımı.

Windows için sinir ağı ses dönüşümü. Pitch shift edilmiş senin değil, farklı bir kişi gibi ses çıkarır.

Ses klonlama ne demektir (ve ne demez)

Ses klonlama yazılımı, kadans, vurgu ve söylediklerinizi korurken konuşmanızı farklı bir sesle yeniden sentezler. Sadece sesinizi filtreleyen bir ses efektinden temelde farklıdır. Pitch shift edilmiş «Şeytan» efekti hala filtreli sen gibi ses verir. Klonlanmış Theo Strand tamamen farklı bir kişi gibi ses verir.

Gerçek zamanlı ses klonlamanın üç teknik eşiği vardır:

  1. Canlı çağrılar için yeterince düşük gecikme — uçtan uca 600 ms altında, ideal olarak 400 ms altında.
  2. Kimlik korunumu — çıktı belirli bir hedef gibi ses vermelidir, genel değil.
  3. Gizlilik — ses verileri biyometrik olduğundan yerel işleme önemli.

VoxBooster üçünü de karşılar.

VoxBooster’da nasıl çalışıyor

Uygulamayı başlat, Voice Clone sekmesini aç ve altı yerleşik sentetik kişiden birini seç. Real-time’ı aç. Konuşmaya başla. Mikrofon akışın yaklaşık 500 ms gecikme ile hedef sesi üreten bir sinir ağı modelinden geçer (hafif kalite ödünü ile 250 ms’ye yapılandırılabilir).

Çıktı mikrofonunu kullanan uygulamaya doğrudan akar — Discord, Zoom, Teams, OBS, oyun sesli sohbeti, tarayıcı çağrıları, her ne ise. Yapılandırılacak sanal cihaz yok, savaşılacak yönlendirme yok.

Sesler

VoxBooster en yaygın ses arketiplerini kapsayan altı önceden eğitilmiş kişi ile gelir:

  • Marcus Blake — orta aralık erkek, sıcak, anlatıcı tarzı.
  • Elena Vox — kontralto kadın, sakin, podcast için hazır.
  • Ray Calder — yaşlı erkek, boğuk, dünyadan yorgun.
  • Jin Park — high-energy erkek, genç.
  • Nia Holt — alto kadın, kendinden emin, komuta verici.
  • Theo Strand — derin bas erkek, kötü adam / noir başrol.

Altısı da %100 sentetik. Hiçbiri gerçek bir kişinin ses verisine dayanmıyor — yani stream VOD’larında veya içeriğinde kişilik hakları sorunu yok.

Donanım gereksinimleri

  • Windows 10 veya 11, 64-bit.
  • CPU: modern dört çekirdekli işlemci. Voice Clone tek başına CPU’da çalışabilir.
  • GPU: isteğe bağlı ama tavsiye edilir. DirectML uyumlu herhangi bir GPU (NVIDIA, AMD veya Intel entegre) gecikmeyi ~500 ms’den ~250 ms’ye düşürür.
  • RAM: çalışma sırasında 4 GB boş.
  • Mikrofon: Windows’un tanıdığı herhangi bir şey.

Gizlilik

Tüm ses klonlama boru hattı bilgisayarında çalışır. Ses akışın makineyi asla terk etmez. İstesek bile ses verilerini almak için bir API uç noktamız yok.

Bu bir pazarlama iddiası değil — Windows istemcisinin nasıl inşa edildiğine dair yapısal bir gerçek.

Bulut tabanlı ses AI’sı ile karşılaştırma

VoxBoosterBulut ses hizmetleri
Gecikme250–500 ms800 ms – 3 s
GizlilikYalnızca yerelSes yüklenir
MaliyetSabit abonelikSaniye başına faturalama
ÇevrimdışıÇalışırBaşarısız
Hız limitleriYokVar

Dene

Üç gün bedava, tam ses kütüphanesi, kredi kartı yok. VoxBooster’ı indir.