Jeśli chcesz wiedzieć, jak zmienić swój głos, masz dwie uczciwe drogi: zmień go cyfrowo za pomocą zmieniającego głosu w czasie rzeczywistym lub zmień go naturalnie poprzez oddychanie i technikę. Ten przewodnik obejmuje oba, z praktycznym skupieniem się na modyfikacji cyfrowej, ponieważ to sprawia, że uzyskujesz głośniejszy, wyższy lub zupełnie inny głos w minutach zamiast miesięcy.
Niezależnie od tego, czy grasz, streamujesz, chronisz swoją prywatność, budujesz postać czy ułatwiasz dostęp, narzędzia do modyfikacji głosu stały się naprawdę dobre. Poniżej znajduje się kompletny, praktyczny przewodnik po tym, jak każde podejście działa i kiedy go używać.
TL;DR
- Cyfrowa modyfikacja głosu to szybka ścieżka: dostosuj tonację i formanty razem lub załaduj predefiniowany profil i gotowe w minutach
- Sam tonacja brzmi mechanicznie; tonacja plus formanty to kombinacja, która brzmi wiarygodnie
- Predefiniowane profile (głośniejszy, wyższy, postać) pomijają ręczne tuning i można je przełączać skrótami klawiszowymi w trakcie rozmowy
- Konwersja głosu opracowana sztuczną inteligencją daje najbardziej naturalny rezultat, ale dodaje więcej opóźnienia niż efekty parametryczne
- Wytocz wyjście na wirtualny mikrofon, aby używać zmodyfikowanego głosu na Discord, w grach i na streamach
- Naturalna technika (oddech, tonacja, tempo, rezonans) działa bez narzędzi i dobrze łączy się z oprogramowaniem
- VoxBooster uruchamia wszystko lokalnie w systemie Windows bez sterownika jądra i 3-dniowej pełnej wersji próbnej
Co oznacza modyfikacja głosu?
Modyfikacja głosu oznacza zmianę jego brzmienia, albo poprzez cyfrowe przetwarzanie audio w czasie rzeczywistym, albo poprzez zmianę tego, jak fizycznie go wytwarzasz. Modyfikacja cyfrowa zmienia tonację i rezonans traktu wokalnego lub ponownie syntetyzuje mowę modelem. Modyfikacja naturalna zmienia twój oddech, rezonans i nawyki mówienia. Oba mają na celu ten sam wynik: głos, który brzmi inaczej niż twój domyślny.
Powód, dla którego to działa, sprowadza się do fizyki. Twój głos jest wytwarzany przez dwa systemy pracujące razem: larynks, który generuje podstawową częstotliwość zwaną tonacją, oraz traktus wokalny (gardło, usta i jamę nosową), które formuje ten surowy ton poprzez częstotliwości rezonansowe zwane formantami. Zmień relację między nimi a głos brzmi inaczej. To prawda bez względu na to, czy zmiana zachodzi w oprogramowaniu czy w twoim gardle.
Jeśli chcesz podstawowej nauki, artykuły Wikipedia na temat ludzkiego głosu i formantów wyjaśniają akustykę jasno.
Ścieżka 1: Cyfrowa modyfikacja głosu (główny cel)
Modyfikacja cyfrowa to to, od czego większość ludzi zaczyna, ponieważ jest szybka, odwracalna i nie wymaga żadnego treningu fizycznego. Zmieniacza głosu w czasie rzeczywistym znajduje się między twoim mikrofonem a dowolnym używanym programem, transformując audio podczas mówienia.
Elementy składowe są takie same w każdym poważnym narzędziu: tonacja, formanty, efekty i konwersja głosu opracowana sztuczną inteligencją. Zrozumienie tych czterech daje pełną kontrolę nad twoim brzmieniem. Poniższe sekcje przeprowadzają cię przez każdą z nich, a następnie pokazują, jak wytocić wynik na wirtualny mikrofon, aby Discord, gry i streamy słyszały twój zmodyfikowany głos.
Cztery elementy składowe modyfikacji głosu
Tonacja
Tonacja to przycisk w górę lub w dół. Obniżenie jej sprawia, że brzmisz głębiej; podniesienie jej sprawia, że brzmisz lżej lub wyżej. Zwykle mierzy się ją w półtonach. Przesunięcie o kilka półtonów jest subtelne; duże przesunięcie daje ewidentnie stylizowane głosy, takie jak głębokie złoczyństwo lub piskliwy rysunek animowany.
Haczyk: tonacja sama w sobie pozostawia formanty na miejscu, więc duże przesunięcie brzmi jak ta sama osoba przeziębiona lub na helu. To jest to, gdzie przychodzi druga kontrola.
Formanty
Definicja: Formanty to rezonansowe szczyty w widmie częstotliwości mowy, wytwarzane przez kształt i długość twojego traktu wokalnego. Pierwsze dwa (F1 i F2) mają największe znaczenie perceptualne; określają jakość samogłosek i postrzeganą wielkość mówcy. Krótsze trakty wokalne wytwarzają wyższe formanty, dlatego mniejsze i wyższe głosy brzmią tak, jak brzmią.
Modyfikacja formantów zmienia postrzeganą wielkość głosu niezależnie od tonacji. Przesuń formanty w dół wraz z tonacją i głębokie brzmienie brzmi jak pochodzące od fizycznie większej osoby, a nie spowolniającego nagrania. To jest pojedyncze najważniejsze sterowanie, aby uczynić modyfikację wiarygodną zamiast robotyczną.
Efekty
Efekty to łańcuchy przetwarzania ułożone na szczycie tonacji i formantów: EQ, rewerberacja, zniekształcenie, modulacja, echo, filtry radiowe i tak dalej. To jest to, jak budujesz głosy postaci, robota, demona, spikera, obcego lub retro walkie-talkie. Efekty nie próbują brzmieć jak rzeczywisty człowiek; mają być stylizowane i to jest to, gdzie zabawa się zaczyna.
Konwersja głosu opracowana sztuczną inteligencją
Konwersja głosu opracowana sztuczną inteligencją ponownie syntetyzuje twoją mowę przy użyciu modelu neuronowego zamiast stosowania transformacji matematycznych. Zamiast dostrajania tonacji i formantów, rekonstruuje twoje słowa w barwie wytrenowanego docelowego głosu. Rezultat to najbardziej naturalnie brzmiąca modyfikacja dostępna, szczególnie na spółgłoskach i przejściach, i wszystko to działa lokalnie na twoim komputerze w VoxBooster. Kompromisem jest opóźnienie: ponowna synteza dodaje więcej opóźnienia niż efekty parametryczne, więc lśni dla nagranego zawartości i działa, z małą karą wygody, do live chatu.
Jak zmienić swój głos za pomocą VoxBooster: Krok po kroku
Oto praktyczny, ponumerowany przepływ pracy do cyfrowej modyfikacji głosu w czasie rzeczywistym.
- Zainstaluj i otwórz VoxBooster. Pobierz go tutaj i uruchom na Windows 10 lub 11. Wszystko działa na twoim własnym komputerze.
- Wybierz wejście mikrofonu. Wybierz swój rzeczywisty, fizyczny mikrofon jako źródło, aby aplikacja miała czysty dźwięk do pracy.
- Włącz tłumienie szumu. Włącz wbudowane zmniejszanie szumu. Czystsze wejście oznacza czystszą, bardziej stabilną modyfikację, szczególnie dla konwersji głosu opracowanej sztuczną inteligencją.
- Wybierz swoją metodę. Dla natychmiastowych rezultatów przejdź do predefiniowanego profilu (następna sekcja). Dla kontroli ręcznej otwórz panel efektów i kontynuuj poniżej.
- Ustaw tonację. Dla głębokim głosem obniż go o kilka półtonów; dla wyższego głosu podnieś go. Zablokuj to zanim dotkniesz czegokolwiek innego.
- Dopasuj formanty. Przesuń kontrolę formantów w tym samym kierunku co tonacja. Głeboki głos: przesunięcie formantów w dół. Wyższy głos: przesunięcie ich w górę. Dostosuj w małych krokach, dopóki głos nie brzmi jak rzeczywista osoba, a nie przetworzone nagranie.
- Dodaj efekty, jeśli chcesz postać. Dodaj rewerberację, zniekształcenie lub filtr radiowy dla stylizowanych głosów. Pomiń to dla naturalnie brzmiącego ludzkiego modyfikacji.
- Lub przełącz się na konwersję głosu opracowaną sztuczną inteligencją. Otwórz panel konwersji głosu, wybierz docelowy głos i włącz tryb real-time dla najbardziej naturalnej transformacji.
- Monitoruj wyjście. Odsłuchaj przez słuchawki zanim pójdziesz na żywo, aby złapać wszelkie artefakty i dostroić.
- Wytocz do wirtualnego mikrofonu. Wyślij zmodyfikowane wyjście do wirtualnego mikrofonu (omówionego poniżej) i wybierz go w Discord, twojej grze lub oprogramowaniu streamingowym.
Dwie praktyczne zasady sprawiają, że tuning jest łatwiejszy: zawsze ustaw tonację pierwszą i formanty drugie oraz zawsze modyfikuj w umiarkowanych ilościach. Ustawienia ekstremalne to to, co sprawia, że głos brzmi ewidentnie fałszywie.
Korzystanie z predefiniowanych profili: Głośniejszy, wyższy i głosy postaci
Ręczne tuning daje ci największą kontrolę, ale predefiniowane profile dają ci dobry wynik od razu. Predefiniowany profil to zapisana kombinacja tonacji, formantów i efektów zaprojektowana dla określonego wyniku.
- Predefiniowane profile głośniejszego głosu stosują przesunięcie tonacji i formantów w dół razem, więc brzmisz pełniej i bardziej rezonantnie bez artefaktów helu lub spowolniającej taśmy.
- Predefiniowane profile wyższego głosu robią odwrotnie dla lżejszego, jaśniejszego głosu.
- Predefiniowane profile postaci stoją efekty dla robotów, potworów, spikera, obcych i wiele więcej, gotowe do użycia bez ręcznego tuningu.
Prawdziwą zaletą predefiniowanych profili jest przełączanie skrótów klawiszowych. Powiąż predefiniowany profil ze skrótem klawiatury i możesz wejść w głębokie złoczyńskie głos na jedną linię, uruchomić głos postaci dla żartu, a następnie wrócić do normalnego głosu, wszystko w trakcie rozmowy lub streamu. Połącz to z soundboardem do klipów i efektów dźwiękowych wyzwalanych z tych samych skrótów klawiszowych i masz pełną konfigurację live’owego performance. Dla streamerów integruje się to z OBS poprzez ten sam potok audio.
Kierowanie zmodyfikowanego głosu do Discord, gier i streamów
Modyfikacja audio to tylko połowa pracy. Druga połowa to dostanie tego zmodyfikowanego głosu do aplikacji, które go potrzebują. Dzieje się to poprzez wirtualny mikrofon: urządzenie audio oprogramowania, które inne aplikacje traktują jak rzeczywisty mikrofon.
Koncepcja jest prosta. Zmieniacza głosu przetwarza twój rzeczywisty mikrofon, a następnie wysyła wynik do wirtualnego mikrofonu. W Discord, twojej grze lub oprogramowaniu streamingowym wybierasz ten wirtualny mikrofon jako urządzenie wejściowe i słyszy zmodyfikowany głos zamiast surowego.
Z VoxBooster to jest jeszcze prostsze, ponieważ przetwarzanie odbywa się na poziomie sesji Windows. Każda aplikacja widzi zmodyfikowany dźwięk jako pochodzący z twojego normalnego mikrofonu, więc w większości przypadków w ogóle nie musisz ręcznie konfigurować wirtualnego kabla. Krótka wersja dla Discord:
- Włącz tryb real-time w VoxBooster.
- Otwórz Discord, następnie Ustawienia, następnie Głos i wideo.
- Zostaw urządzenie wejściowe ustawione na twój rzeczywisty mikrofon.
- Mów. Discord automatycznie odbiera zmodyfikowany głos.
Ta sama logika ma zastosowanie do gier, aplikacji spotkań i narzędzi streamingowych. Ponieważ nie ma sterownika jądra zaangażowanego, to podejście nie koliduje z systemami antycheatowymi i nie przerywa się po aktualizacjach Windows tak, jak czasami robią to sterowniki audio w trybie jądra.
Typy modyfikacji głosu w skrócie
| Typ modyfikacji | Co robi z głosem | Najlepszy przypadek użycia |
|---|---|---|
| Zmiana tonacji | Podnosi lub obniża podstawową częstotliwość | Szybko głośniejszy lub wyższy głos, efekty stylizowane |
| Zmiana formantów | Zmienia postrzeganą wielkość traktu wokalnego | Wiarygodne zmiany płci lub wielkości wraz z tonacją |
| Predefiniowany profil głośniejszego | Połączona zmiana tonacji i formantów w dół | Brzmienie pełniej i bardziej autorytatywnie |
| Predefiniowany profil wyższego | Połączona zmiana tonacji i formantów w górę | Lżejszy, jaśniejszy lub młodszy brzmiejący głos |
| Efekty postaci | Ułożone EQ, rewerberacja, zniekształcenie, filtry | Roboty, potwory, spikerzy, persony streamingowe |
| Konwersja głosu opracowana sztuczną inteligencją | Ponownie syntetyzuje mowę jako docelowy głos | Najbardziej naturalna transformacja, nagrany konten |
| Tłumienie szumu | Usuwa szum tła z wejścia | Czystszą modyfikację i jaśniejszy dźwięk na żywo |
Ścieżka 2: Naturalna modyfikacja głosu
Oprogramowanie nie jest jedynym sposobem. Możesz naprawdę zmienić jak brzmisz używając samej techniki i warto to rozumieć nawet jeśli planujesz użyć zmieniającego głosu, ponieważ oba podejścia się wzajemnie wzmacniają.
Naturalna modyfikacja opiera się na kilku filarach:
- Wsparcie oddychania. Mówienie z zaangażowaną przeponą zamiast płytkiego oddychania przez gardło sprawia, że głos jest bardziej stabilny, pełny i bardziej autorytatywny. To jest podstawa, którą budują wytrenowani mówcy.
- Tonacja. Świadome ustalone twojej naturalnej tonacji mówienia nieco niżej lub wyżej niż domyślnie zmienia to, jak się wyrażasz. Małe, trwałe zmiany utrzymują się przez długą rozmowę; wymuszanie ekstremalnej tonacji napina głos.
- Rezonans. Kierowanie wibracji w stronę klatki piersiowej daje pełniejszy, niższy dźwięk; kierowanie go w stronę głowy i twarzy daje lżejszy, jaśniejszy. Możesz przesuwać to celowo z praktyką.
- Tempo. Spowolnienie i dodanie celowych pauz odczytuje się jako spokojniejsze i bardziej pewne. Zmiany tempa zmieniają percepcję tyle samo co zmiany tonacji.
Te techniki wymagają praktyki mierzonej w tygodniach, nie minutach, i każdy głos ma fizyczne ograniczenia. Ale nie dodają opóźnienia, nie wymagają narzędzi i co ważne, poprawiają również modyfikację cyfrową. Gdy twój głos wejściowy już porusza się w kierunku, w którym go chcesz, zmieniacza głosu ma mniej pracy do zrobienia i wynik brzmi bardziej jak rzeczywista osoba i mniej jak przetworzony nagranie. Ćwiczenie rezonansu klatki piersiowej przed dodaniem zmienionej tonacji i formantów w dół, na przykład, daje znacznie bardziej przekonujący głębokie brzmienie niż samo oprogramowanie.
Typowe przypadki użycia dla modyfikacji głosu
- Gry. Dopasuj postać do twojej osoby na ekranie, dodaj dramatyzm do wezwania rajdu lub utrzymaj anonimowość w publicznych lobby.
- Prywatność. Mów w publicznych czatach głosowych bez transmisji twojego rzeczywistego głosu, przydatne dla każdego, kto ceni bycie osobą niepodlegającą online.
- Tworzenie zawartości. Daj streamowi lub wideo spójny sygnaturowy głos, lub wygłaszaj wiele postaci sam bez zatrudniania dodatkowego talentu.
- Postacie i odgrywanie ról. Ożyw NPC, złoczyńców i stworzenia w sesjach stołowych, aktorstwie głosowym i fikcji interaktywnej.
- Dostępność. Połącz modyfikację z zamianie tekstu na mowę i tłumieniem szumu, aby mówienie i bycie wyraźnie słyszanym było łatwiejsze dla więcej ludzi.
We wszystkich tych, uczciwa rada jest taka sama: używaj umiarkowanych ustawień, monitoruj wyjście i ujawniaj modyfikację, gdy kontekst tego wymaga.
Często zadawane pytania
Jaki jest najszybszy sposób na modyfikację głosu w czasie rzeczywistym?
Zainstaluj zmieniacza głosu w czasie rzeczywistym, wybierz predefiniowany profil, taki jak głośniejszy lub wyższy, i włącz tryb real-time. Twój głos jest modyfikowany zanim dotrze do Discord, gier lub oprogramowania streamingowego. Nie są potrzebne umiejętności edycji audio i cała konfiguracja zajmuje tylko kilka minut w systemie Windows.
Czy mogę zmienić swój głos bez żadnego oprogramowania?
Tak. Zmiana sposobu oddychania, tonacji mówienia, rezonansu i tempa naprawdę zmienia to, jak brzmisz. Te naturalne techniki wymagają praktyki i mają fizyczne ograniczenia, ale nie wymagają narzędzi i dodają zerowych opóźnień. Sprawiają również, że modyfikacja cyfrowa jest bardziej przekonująca, gdy łączysz oba podejścia.
Jaka jest różnica między tonacją a formantem podczas modyfikacji głosu?
Tonacja to podstawowa częstotliwość, którą produkuje larynks. Formanty to częstotliwości rezonansowe kształtowane przez traktus wokalny. Przesunięcie tylko tonacji brzmi sztucznie, ponieważ formanty pozostają na miejscu. Przesunięcie formantów wraz z tonacją zmienia postrzeganą wielkość głosu, co sprawia, że modyfikacja brzmi wiarygodnie.
Czy modyfikacja głosu spowoduje zauważalne opóźnienie w rozmowie?
Podstawowa modyfikacja tonacji i formantów dodaje tylko kilka milisekund, niezauważalne w rozmowie. Konwersja głosu opracowana sztuczną inteligencją ponownie syntetyzuje twoją mowę i dodaje więcej opóźnienia, mniej więcej od ćwierć sekundy do pół sekundy. Do live’owego chatu głosowego modyfikacja parametryczna jest wygodniejsza; do nagranego kontenu opóźnienie konwersji nie ma znaczenia.
Jak wysłać swój zmodyfikowany głos do Discord lub gry?
Wytocz wyjście zmieniającego głosu na wirtualny mikrofon, a następnie wybierz ten mikrofon jako wejście w aplikacji. Z VoxBooster przetwarzanie na poziomie sesji oznacza, że każda aplikacja słyszy zmodyfikowany głos z twojego normalnego mikrofonu, więc zwykle nie musisz ręcznie konfigurować wirtualnego kabla w systemie Windows.
Czy legalne jest modyfikowanie głosu online?
W codziennych kontekstach, takich jak gry, streaming, prywatność i twórczość, modyfikacja głosu jest legalna. Używanie zmodyfikowanego głosu do podszywania się pod rzeczywistą osobę w celu oszustwa lub wprowadzenia w błąd nie jest. Ujawnij modyfikację, gdy kontekst zależy od uczciwości, takiej jak dziennikarstwo lub komunikacja biznesowa.
Czy mogę zmienić swój głos, aby brzmieć jak określona postać?
Tak. Predefiniowane profile postaci łączą tonację, formanty i efekty do budowania robotów, potworów i spikera. Konwersja głosu opracowana sztuczną inteligencją idzie dalej, mapując twoją mowę do wytrenowanego docelowego głosu dla naturalnego rezultatu. Oba działają lokalnie w VoxBooster i możesz powiązać je ze skrótami klawiszowymi dla natychmiastowego przełączania.
Podsumowanie
Krótka odpowiedź na to, jak zmienić swój głos: zainstaluj zmieniacza głosu w czasie rzeczywistym, przesuń tonację i formanty razem lub załaduj predefiniowany profil, wytocz wynik na wirtualny mikrofon i gotowe w minutach. To obejmuje zdecydowaną większość tego, czego ludzie naprawdę chcą, od głębokim głosu gry do pełnej persony postaci.
Dłuższa odpowiedź to to, że masz rzeczywiste wybory. Modyfikacja parametryczna to pracownik o niskim opóźnieniu dla live chatu głosowego. Konwersja głosu opracowana sztuczną inteligencją to naturalna brzmienie opcja dla nagranego kontenu. Predefiniowane profile i skróty klawiszowe sprawiają, że live przełączanie jest bez wysiłku. A naturalna technika, chociaż wolniejsza do nauki, nie wymaga narzędzi i cicho poprawia wszystko inne.
Jeśli chcesz spróbować ścieżkę cyfrową, VoxBooster jest bezpłatny przez trzy dni bez wymaganych kart kredytowych i możesz zobaczyć pełną listę funkcji i plany na stronie cenowej. Lub dalej czytaj blog dla głębokich przewodników dotyczących określonych głosów i ustawień.