Deep Voice Changer: ทําให้เสียงของคุณลึกกว่าและใหญ่ขึ้น
Voice changer ลึกทำได้มากกว่าการลากแถบเลื่อนลง - ทำได้ถูกต้อง มันจะเปลี่ยนทั้งระดับเสียงและลักษณะสั่นพ้องของเสียงของคุณ ดังนั้นผลลัพธ์จึงฟังเหมือนคนที่ใหญ่ขึ้นและมีอำนาจมากขึ้น ไม่ใช่เทปเล่นที่ความเร็วผิด ไม่ว่าคุณจะต้องการสร้างบุคลิกการสตรีมมิ่ง เพิ่มน้ำหนักให้กับการบรรยาย คงอยู่โดยไม่เปิดเผยตัวตนในแชทเสียง หรือเพียงแค่ทดลองกับเสียงของคุณ คู่มือนี้จะแนะนำกลไกการทำงาน DSP จริง การตั้งค่าที่สำคัญ และการตั้งค่าแบบสมบูรณ์ทีละขั้นตอนโดยใช้ VoxBooster
TL;DR
- Pitch shift เพียงอย่างเดียว (ไม่มีการปรับเปลี่ยน formant) ฟังเพื่อและเหมือนหุ่นยนต์ - คุณต้องใช้ทั้งสอง
- ทำให้ลึกตามธรรมชาติที่ดีที่สุด: -3 ถึง -4 semitones pitch, -15 ถึง -25% formant
- สำหรับเสียงลึกสุดขั้วและเป็นแบบ: -5 ถึง -7 semitones + formant shift + low shelf EQ
- VoxBooster กำหนดเส้นทางเสียงที่ประมวลผลแล้วผ่านไมโครโฟนเสมือน low-latency audio capture - ทำงานบน Discord, OBS และทุกเกม
- Latency ต่ำกว่า 10ms หมายความว่าเสียงของคุณจะอยู่ในการซิงค์ระหว่างการโทรสดและการสตรีมมิ่ง
- ลองใช้งานฟรี 3 วัน ไม่ต้องใช้บัตรเครดิต
Deep Voice Changer ทำอะไรจริง ๆ?
ก่อนที่จะแตะปุ่มเลื่อน ก็ควรเข้าใจว่าซอฟต์แวร์จำเป็นต้องจัดการกับพารามิเตอร์ใด - เพราะสองพารามิเตอร์ที่สำคัญ (pitch และ formant) มักจะทำให้เกิดความสับสน และความสับสนนั้นนำไปสู่เสียงที่ขุ่นและเทียมซึ่งทำให้ voice changers มีชื่อเสียงไม่ดี
Pitch: ความถี่พื้นฐาน
เสียงที่มีเสียงทุกเสียงที่คุณออกมามี ความถี่พื้นฐาน - อัตราที่เสียงของคุณสั่น สำหรับเสียงพูดของชายผู้ใหญ่ปกติ มันจะอยู่ที่ประมาณ 85 ถึง 180 Hz สำหรับเสียงผู้หญิงผู้ใหญ่ปกติ มันจะอยู่ระหว่าง 165 ถึง 255 Hz เมื่อ voice changer ลึกเปลี่ยน pitch ลงมา มันจะลดความถี่พื้นฐานนี้ - ย้ายโน้ตดนตรีที่เสียงของคุณอยู่ลงบนตราด
การเปลี่ยน semitone หนึ่ง ตรงกับการคูณความถี่ด้วยประมาณ 0.944 ดังนั้นหากคุณพูดที่ 150 Hz และเปลี่ยนลง 4 semitones เสียงที่ประมวลผลจะลงจอดประมาณ 119 Hz - ลึกเข้าไปในอาณาเขตของเสียงการออกอากาศชายที่ลึก
Formants: ลักษณะช่องเสียง
Formants คือยอดสั่นพ้องที่สร้างขึ้นโดยรูปร่างและความยาวของช่องเสียงของคุณ - ปาก คออยห์ และเอกซ์นั่น พวกเขานั่งอยู่เหนือความถี่พื้นฐานและกำหนดเสียงสระที่คุณสร้างขึ้น รวมทั้ง ‘สี’ โดยรวมและขนาดที่รู้สึกของเสียงของคุณ ช่องเสียงที่ยาวกว่า (ตามที่พบในคนที่สูงกว่า) สร้าง formants ที่ต่ำกว่า และนั่นคือเหตุผลที่เสียงที่ลึกกว่ามักฟังเหมือนใหญ่ขึ้นจากกายภาพ
เมื่อคุณเปลี่ยน pitch ลงโดยไม่สัมผัส formants ระดับพื้นฐานลดลง แต่สิ่งสั่นพ้องของช่องเสียงก็คงอยู่ ไมของคุณได้ยินความไม่ตรงกันนี้ว่าไม่เป็นธรรมชาติ - pitch พูด ‘คน deep’ แต่ resonance พูด ‘คนเล็ก’ ผลลัพธ์ฟังเหมือน chipmunk กำลังวิ่งย้อนหลัง: เพื่อ, plasticky และไม่น่าเชื่อถือ
เลื่อน formants ลงพร้อมกับ pitch และสองเบาะแสจะจัดแนว เสียงของคุณฟังเหมือนว่ามันมาจากร่างกายที่ใหญ่ขึ้นจริง ๆ
ทำไม Pitch-Only ถึงฟังผิด (และ Formant Linking ซ่อมได้อย่างไร)
นี่คือความผิดพลาดที่เกือบทุกมือใหม่ทำ พวกเขาพบ preset เสียงลึก ปั่น pitch slider ถึง -6 หรือ -8 semitones และสงสัยว่าทำไมมันฟังเหมือนวิทยุเสีย มากกว่า movie villain
ปัญหาไม่ใช่จำนวน pitch - มันคือความไม่ตรงกัน formant การวิจัยเสียงเกี่ยวกับการรับรู้เสียงแสดงให้เห็นว่าผู้ฟังประเมินปลายทั้งสองพร้อมกัน เมื่อทั้งสองแตกต่างกัน เสียงจะอ่านเป็นประมวลผลแม้ว่าผู้ฟังไม่สามารถตั้งชื่อเหตุผล
Formant linking (บางครั้งเรียกว่า ‘formant tracking’ หรือ ‘vocal tract scaling’) แก้ไขสิ่งนี้โดยการเลื่อน formants ในสัดส่วนกับการเปลี่ยนแปลง pitch คุณภาพซอฟต์แวร์ voice changer มากมายนำเสนอสิ่งนี้เป็นลิงก์อัตโนมัติหรือเลื่อน formant แยกต่างหาก VoxBooster ให้คุณควบคุมอิสระของทั้งสอง ซึ่งเป็นวิธีการที่ถูกต้อง - ทำให้ลึกตามธรรมชาติต้องการการเลื่อน formant ที่เล็กกว่าเล็กน้อยกว่าการเปลี่ยน pitch และบางกรณีการใช้งาน (เช่นเสียง monster) ต้องการการลด formant ที่เกินจริงนอกเหนือจากสิ่ง pitch เรียก
จุดเริ่มต้นที่ใช้ได้จริง: สำหรับการเปลี่ยน pitch -1 semitone ลดฟอร์แมนต์ประมาณ 3 ถึง 5 เปอร์เซ็นต์ อัตราส่วนนั้นลอกเลียนแบบความสัมพันธ์เสียงเพลงระหว่างความยาวของเสียงและความยาวของช่องเสียงในการเปลี่ยนเสียงตามธรรมชาติ
การตั้งค่าที่เหมาะสมสำหรับเสียงลึกตามธรรมชาติ
ทำให้ลึกตามธรรมชาติ - สิ่งที่ฟังเหมือนคนจริงแตกต่างกันแทนการ์ตูน - ต้องมีการทดำเนิน การตั้งค่าด้านล่างเป็นจุดเริ่มต้น ปรับเปลี่ยนตามเสียงต้นฉบับของคุณ
การตั้งค่าอนุรักษ์นิยม: อำนาจเล็ก ๆ
นี่คืออุดมคติสำหรับการนำเสนอ บรรยาย และสถานการณ์ที่คุณต้องการน้ำหนักโดยไม่ดึงดูดความสนใจไปที่การประมวลผล
- Pitch: -2 ถึง -3 semitones
- Formant: -10 ถึง -18%
- Low shelf EQ: +2 ถึง +3 dB ที่ 100 Hz, Q เท่ากับ 0.7
- Reverb: ไม่มีหรือห้องสั้น ๆ (pre-delay 10ms, decay 0.3s)
ที่การตั้งค่าเหล่านี้ ผู้ฟังส่วนใหญ่จะไม่ระบุเสียงว่าเป็นประมวลผล - พวกเขาจะเพียงรับรู้เสียงที่ลึกกว่าปกติ
การตั้งค่าตรงกลาง: Gaming Persona / Streaming Character
นี่คือช่วงที่ใช้โดย streamers ส่วนใหญ่ที่สร้าง persona on-screen ที่แตกต่าง เสียงฟังแตกต่างกันอย่างชัดเจนจากธรรมชาติ แต่ยังคงเป็นมนุษย์
- Pitch: -4 ถึง -5 semitones
- Formant: -20 ถึง -28%
- Low shelf EQ: +3 ถึง +4 dB ที่ 80 Hz
- Mild chorus: ความลึก 10%, อัตรา 0.5 Hz (เพิ่มความกว้างเล็กน้อยและขนาดที่รู้สึก)
คุณจะสังเกตเห็นว่าเสียงฟังใหญ่ขึ้นมากและน่าประทับใจกว่าโดยไม่สูญเสียความชัดเจนของพยัญชนะ Plosives (b, p, d, t) ยังคงชัดเจน ซึ่งมีความสำคัญสำหรับการโทร gaming
การตั้งค่าสุดขั้ว: Monster, Villain, Narrator
นี่คือเนื้อหาแบบจัดแต่งทรงผม - creepypasta narration ตัวละครเจ้าชู่ gimmick VTuber เนื้อหาสยองขวัญ
- Pitch: -6 ถึง -8 semitones
- Formant: -30 ถึง -40%
- Low shelf EQ: +4 ถึง +5 dB ที่ 70 Hz โดยมีการตัด high shelf ด้านบน 8 kHz เพื่อลดความหยาบ
- Short reverb: decay 0.6 ถึง 0.8 วินาที ในการตั้งค่าห้องขนาดใหญ่
ที่ค่าเหล่านี้ ความชัดเจนจะเริ่มลดลง - โดยเฉพาะอย่างยิ่งสำหรับ sibilants (s, z, sh) ชะลอวิธีพูดของคุณลงนิดหน่อยและออกเสียงชัดเจนมากขึ้นเมื่อใช้การตั้งค่าสุดขั้ว
ตารางเปรียบเทียบการตั้งค่า
| กรณีการใช้งาน | Pitch Shift | Formant Shift | Low Shelf EQ | Reverb |
|---|---|---|---|---|
| Narration ละเอียด / อำนาจ | -2 ถึง -3 st | -10 ถึง -18% | +2 dB @ 100 Hz | ไม่มี |
| Streaming persona | -4 ถึง -5 st | -20 ถึง -28% | +3 dB @ 80 Hz | ห้องสั้น |
| ตัวละครเกม | -3 ถึง -4 st | -18 ถึง -24% | +2 dB @ 90 Hz | ไม่มี |
| เสียง villain / monster | -6 ถึง -8 st | -30 ถึง -40% | +4 dB @ 70 Hz | ห้องขนาดใหญ่ |
| แชทเสียงไม่เปิดเผยตัวตน | -3 ถึง -5 st | -15 ถึง -25% | +2 dB @ 100 Hz | ไม่มี |
st = semitones ค่า EQ ทั้งหมดเป็นเสียงบูสต์ใน dB ปรับตามรสชาติตามการตอบสนองความถี่ต่ำของไมโครโฟนของคุณ
ทีละขั้นตอน: การตั้งค่าเสียงลึกใน VoxBooster
นี่คือการตั้งค่าที่สมบูรณ์จากการติดตั้งไปจนถึงการใช้งานสด ใน Discord หรือซอฟต์แวร์สตรีมมิ่งของคุณ
ขั้นตอนที่ 1 - ติดตั้งและเปิด
ดาวน์โหลด VoxBooster จาก /download และเรียกใช้โปรแกรมติดตั้ง VoxBooster ลงทะเบียนไมโครโฟนเสมือน low-latency audio capture ที่เรียกว่า ‘VoxBooster Virtual Mic’ ระหว่างการติดตั้ง ไม่มีการติดตั้งไดรเวอร์เคอร์เนล และไม่จำเป็นต้องเริ่มระบบใหม่
ขั้นตอนที่ 2 - ตั้งค่าไมโครโฟนอินพุตของคุณ
เปิด VoxBooster ไปที่ Settings → Audio Devices และเลือกไมโครโฟนกายภาพของคุณเป็นแหล่งอินพุต หากคุณใช้อินเตอร์เฟสเสียง ให้เลือกอินพุท low-latency audio capture ของอินเตอร์เฟสแทนตัวแปร MME หรือ DirectSound - low-latency audio capture ให้เส้นทาง latency ต่ำสุดผ่านลูกโซ่สัญญาณ
ขั้นตอนที่ 3 - เปิดแผง Voice Effects
คลิกแท็บ Voice Effects คุณจะเห็นแถบเลื่อน pitch, แถบเลื่อน formant และช่องลูกโซ่เอฟเฟกต์ไม่บังคับด้านล่าง สำหรับเสียงลึก คุณทำงานหลักกับ pitch และ formant - ปล่อยให้ส่วนที่เหลือปิดเพื่อเริ่มต้น
ขั้นตอนที่ 4 - ใช้ Pitch และ Formant
ตั้งแถบเลื่อน pitch ไปที่ค่า semitone เป้าหมายของคุณ เริ่มด้วย -3 และพูดตามธรรมชาติ - ฟังกลับผ่านหูฟังของคุณ (เปิดใช้งานการตรวจสอบที่ Settings → Monitor Input) ปรับจนกว่าเสียงจะอยู่ที่ตำแหน่งที่คุณต้องการ
จากนั้นลดแถบเลื่อน formant ลง เริ่มที่ -15% และเพิ่มการลดลงแบบค่อยเป็นค่อยไปขณะพูด ณ จุดหนึ่ง เสียงจะเริ่มฟังเต็มไปด้วยและเป็นธรรมชาติมากขึ้น เลยเกณฑ์หนึ่ง มันจะเริ่มฟังไม่เป็นมนุษย์ ค้นหาจุดหวาน สำหรับเสียงและกรณีการใช้งานของคุณ
ขั้นตอนที่ 5 - เพิ่ม EQ (ไม่บังคับ แต่แนะนำ)
คลิกปุ่ม + ในลูกโซ่เอฟเฟกต์และเพิ่มโมดูล EQ ใช้เสียงบูสต์ low shelf ที่ +2 ถึง +3 dB รอบ 80 ถึง 100 Hz นี่เพิ่มน้ำหนักที่รู้สึกและเสียงที่อกของ resonance หากไมโครโฟนของคุณมีเบส - heavy เรียบร้อยแล้ว ให้ข้ามนี้หรือใช้เสียงบูสต์ที่เล็กกว่า
อย่าเพิ่มด้านล่าง 60 Hz - พิสัยนั้นส่วนใหญ่เป็นเสียงนอฟนของห้อง และจะทำให้เสียงฟังขุ่นมากกว่าลึก
ขั้นตอนที่ 6 - ส่งไปยังแอปของคุณ
ใน Discord: ไปที่ User Settings → Voice & Video → Input Device และเลือก ‘VoxBooster Virtual Mic’ ใน OBS: เพิ่มแหล่ง Audio Input Capture และตั้งเป็น ‘VoxBooster Virtual Mic’ สำหรับเกม ให้ไปที่การตั้งค่าเสียงในเกมและเลือก VoxBooster Virtual Mic เป็นอินพุตไมโครโฟนของคุณ
นั่นคือการตั้งค่าแบบสมบูรณ์ VoxBooster ประมวลผลเสียงด้วย latency ที่เพิ่มเติมต่ำกว่า 10ms ดังนั้นเสียงและวิดีโอจึงยังคงซิงค์แม้บนเหล้า
มันทำงานแบบเรียลไทม์หรือมี Latency ที่เห็นได้ชัด?
การประมวลผลแบบเรียลไทม์เป็นข้อกำหนดที่จำเป็นสำหรับ voice changers ที่ใช้ในการสื่อสารสด Latency ใด ๆ ที่สูงกว่าประมาณ 30ms เริ่มรู้สึกเหมือนเสียงสะท้อน เกิน 50ms จึงกลายเป็นที่เห็นจริง
VoxBooster ครอบแครง latency ที่เพิ่มเติมต่ำกว่า 10ms สำหรับการประมวลผล pitch และ formant Latency รอบท้องจริงของคุณขึ้นอยู่กับฮาร์ดแวร์เสียงและขนาดบัฟเฟอร์ - ขนาดบัฟเฟอร์ที่เล็กกว่าจะลด latency ด้วยค่าใช้จ่ายของโหลด CPU ที่สูงกว่า บนเครื่อง Windows 10 mid-range ที่มีอินเตอร์เฟสเสียงมาตรฐานที่ตั้งเป็นบัฟเฟอร์ 128-sample การประมวลผลเสียงลึกแบบเรียลไทม์ทั่วไปจะทำงานประมาณ 15 ถึง 25ms รอบท้องทั้งหมด ต่ำกว่าเกณฑ์การบานออกของการรับรู้อย่างมาก
เพื่อการเปรียบเทียบ โหมดเรียลไทม์ของ Voicemod มักนั่งที่ 30 ถึง 50ms ขึ้นอยู่กับความซับซ้อนของเอฟเฟกต์ และ MorphVOX Pro สามารถ push สูงกว่านั้นใน presets ที่หนักกว่า เส้นทาง low-latency audio capture-native ของ VoxBooster รักษาการประมวลผลให้แน่น
กรณีการใช้งานสำหรับ Deep Voice Changer
Gaming Personas
ผู้เล่นจำนวนมากสร้าง audio identities ที่แตกต่างกันสำหรับเกม roleplay หรือการแข่งขัน เสียงที่ลึกกว่าจะอ่านเป็นคำสั่งมากขึ้นในการสื่อสารของทีม - การวิจัยในด้านจิตวิทยาสังคมพบอย่างสม่ำเสมอว่าเสียงที่มีระดับต่ำกว่าถูกมองว่ามีอำนาจและครอบงำมากขึ้นในบริบทการสื่อสารกลุ่ม เสียง gaming persona ที่นั่งที่ -3 ถึง -4 semitone ต่ำกว่าเสียงตามธรรมชาติของคุณด้วยการชดเชย formant ให้คุณมีความได้เปรียบนั้น โดยไม่ฟังเทียมสังเคราะห์
ดูเพิ่มเติมที่: วิธีใช้ voice changer บน Discord และคำแนะนำทั่วไปเกี่ยวกับ voice changers latency ต่ำ สำหรับบริบทการตั้งค่าเพิ่มเติม
Streaming และ VTubing
ตัวละคร streaming ได้รับประโยชน์จากความสม่ำเสมอของเสียง: ผู้ชมของคุณสร้างการเชื่อมโยงระหว่างตัวละครของคุณและเสียงของคุณ เสียงที่ประมวลผลแล้วล็อกตัวตนนั้นแม้ว่าคุณจะสตรีมมิ่งในหลายวันและเสียงตามธรรมชาติของคุณแตกต่างจากความเหน็ดเหนื่อยหรือปวดศีรษะ นอกจากนี้ยังเพิ่มชั้นการแยกระหว่างเสียงส่วนตัวของคุณและ persona streaming ของคุณ ซึ่งผู้สร้างจำนวนมากต้องการ
Voice-Over และการบรรยาย
สำหรับการบรรยายสไตล์เอกสาร วิดีโอคำอธิบาย หรืองานหนังสือเสียง การเปลี่ยน pitch -2 ถึง -3 semitone ที่มีการควบคุมด้วยการชดเชย formant สามารถปรับให้เรียบเสียงที่บางหรือจมูกในธรรมชาติโดยไม่ทำให้ผลลัพธ์ฟังเป็นการประมวลผล คุณหลัก ให้เก็บการเปลี่ยนแปลงไว้เล็กพอที่ผู้ฟังจะสนใจเนื้อหา ไม่ใช่เสียง
ความเป็นส่วนตัวในการสื่อสารออนไลน์
เสียงคือชีวมิเตอร์ - ติดกันอยู่เลย ระดับและรูปแบบการพูดที่สม่ำเสมอสามารถระบุตัวคุณได้ทั่วแพลตฟอร์มแม้ไม่มีข้อมูลการรับรองตัวตนอื่น ๆ การเปลี่ยนระดับเสียงและ formant โดยจำนวนที่ปานกลาง (แม้แต่ -2 semitone และ -12% formant) จะสร้างระยะห่างเสียงเพียงพอเพื่อขัดขวางการจดจำเสียงสุ่มอย่างมีนัยสำคัญขณะยังคงรักษาความชัดเจนของธรรมชาติ
นี่คือกรณีการใช้งานความเป็นส่วนตัวที่ถูกต้องตามกฎหมาย โดยเฉพาะอย่างยิ่งที่เกี่ยวข้องกับนักข่าว นักเคลื่อนไหว นักวิจัย และใครก็ตามที่เข้าร่วมชุมชนที่พวกเขาไม่ต้องการเชื่อมโยงกับตัวตนออฟไลน์ของพวกเขา
โครงการสร้างสรรค์และงานตัวละคร
เนื้อหาสยองขวัญ podcast ฟิกชัน tabletop RPG actual plays เสียง game master - ทั้งหมดนี้ได้รับประโยชน์จากความสามารถในการสร้างเสียงตัวละครที่ลึกและแตกต่างกันตามความต้องการ แทนที่จะรักษาเสียงวิวเล้ว voice deepener ช่วยให้คุณประหยัดตัวละครนานหลายชั่วโมง โดยไม่มีความเหน็ดเหนื่อยเสียง
AI Voice Cloning vs. DSP Deepening: อะไรคือความแตกต่าง?
VoxBooster นำเสนอเอฟเฟกต์เสียง DSP ดั้งเดิม (pitch shift, formant shift, ลูกโซ่ EQ) และการโคลนเสียง AI แนวทางพื้นฐานที่แตกต่างกันเพื่อการแปลงเสียง
DSP deepening จัดการเสียงของคุณเองแบบเรียลไทม์โดยใช้อัลกอริธึมการประมวลผลสัญญาณ เอาต์พุตยังคงฟังเหมือนคุณ เพียงแค่เปลี่ยนแปลง Latency ต่ำมาก (ต่ำกว่า 10ms) และการประมวลผลเป็นแบบ deterministic - อินพุตเดียวกันจะสร้างเอาต์พุตเดียวกันเสมอ
AI voice cloning ใช้การแปลงเสียง neural เพื่อแมปเสียงของคุณไปยังโมเดลเสียงที่ได้รับการฝึกอบรม เอาต์พุตฟังเหมือนคนที่แตกต่างกันจริง ๆ ไม่ใช่เวอร์ชันเลื่อนของคุณ Latency สูงกว่า (โดยปกติ 80 ถึง 200ms ขึ้นอยู่กับฮาร์ดแวร์และโมเดล) และคุณภาพขึ้นอยู่กับข้อมูลการฝึกอบรมของโมเดล
สำหรับเอฟเฟกต์เสียงลึกระหว่างการเล่นเกมสดหรือการโทร Discord DSP เกือบจะเป็นตัวเลือกที่ดีกว่า - ความแตกต่าง latency มีนัยสำคัญเพียงพอที่จะมีผลต่อคุณภาพการสื่อสาร AI voice cloning เหมาะสำหรับเนื้อหา pre-recorded streaming ที่ซิงค์เสียง-วิดีโอน้อยสำคัญ หรือกรณีที่คุณต้องการตัวตนที่แตกต่างกันโดยสิ้นเชิง แทนที่จะเป็นเวอร์ชันลึกของตัวเอง
หน้า voice changer features และ voice effects ของ VoxBooster อธิบายโหมดทั้งสองโดยละเอียด
ความผิดพลาดทั่วไปและวิธีแก้ไข
Pitch มากเกินไป formant ไม่เพียงพอ เสียงฟังเพื่อหรือยาง ซ่อม: ลด formant จนกว่าการสั่นพ้องจะตรงกับความลึกของ pitch
Low shelf EQ boost หนักเกินไป เสียงฟังเพื่อเพื่อและสูญเสีย definition ต่ำกว่า 200 Hz ซ่อม: ให้ low shelf boost ต่ำกว่า +4 dB และ high-pass filter ที่ 60 Hz เพื่อตัดเสียงนอฟนของห้อง
Monitoring บน ขณะพูด หากคุณเปิดใช้งานการตรวจสอบอินพุตด้วย latency ที่เห็นได้ สมองของคุณจะพยายามชดเชยสิ่งสะท้อนโดยการเปลี่ยนวิธีที่คุณพูด - เสียงจึงกลายเป็นเครียดและไม่สม่ำเสมอ ซ่อม: ใช้การตรวจสอบ zero-latency หรือปิด ไว้ใจการตั้งค่าของคุณและฟังกลับบนการบันทึก
เลือก preset สุดขั้วโดยไม่ปรับแต่งเสียงของคุณ Presets ได้รับการสอบเทียมบนเสียงตัวอย่าง - มักเป็นจุดกึ่งกลางเอกจน โครงสร้าง formant ตามธรรมชาติของเสียง อัตราการพูด และความถี่พื้นฐานของคุณจะแตกต่างกัน เริ่มจาก preset เสมอ จากนั้นปรับ pitch และ formant ให้ตรงกับเสียงตามธรรมชาติของคุณก่อน ก่อนเพิ่มเอฟเฟกต์อื่น
หมดพื้นที่ CPU การซ้อน 5 หรือ 6 เอฟเฟกต์พร้อมกันสามารถทำให้เกิด dropouts คลิก หรือ artifact ประมวลผลบนฮาร์ดแวร์ที่เก่ากว่า ซ่อม: ใช้โหมด low-latency ของ VoxBooster ลดขนาดบัฟเฟอร์เป็น 256 ตัวอย่าง และปิดซอฟต์แวร์หนักเสียงอื่น ๆ ดูคำแนะนำของเราเกี่ยวกับ การตั้งค่า voice changer low-latency สำหรับขั้นตอนการหาปัญหาที่ละเอียด
Deep เท่าไหร่คือเกินไป?
มีจุดที่การเปลี่ยนแปลง pitch ลงและ formant เริ่มทำงานต่อต้านคุณ ความชัดเจนลดลง: สระกลายเป็นคลุมเครือ พยัญชนะสูญเสีย cues ออก ผู้ฟังต้องทำงานหนักกว่าเพื่อแยกวิเคราะห์สิ่งที่คุณพูด ความเหน็ดเหนื่อยตั้งค่าอย่างรวดเร็วบนด้านผู้ฟัง และบนด้านผู้พูด คุณอาจเริ่มโดยไม่สม่ำเสมอมากขึ้น ซึ่งทำให้เสียงที่ประมวลผลฟังมีการกำหนดเสียง
กฎหลักที่ดี: หากผู้พูดภาษาอังกฤษเจ้าหนาวีดีดีดีดีดีดีดีดี ‘บิต’ จาก ‘เดือย’ ในเสียงที่ประมวลผลที่ดังเสียงสนทนา คุณได้เลยห่างไกลเกินไป ดึงการตั้งค่ากลับมาจนกว่าเสียงจะลึกและน่าประทับใจ แต่ยังคงชัดเจน
เพดาน acoustics สำหรับ deepening สุดขั้วโดยไม่สูญเสียความชัดเจนคือ roughly -7 semitones ด้วย formants scaled สัดส่วนโลก เลยอีกหนึ่ง คุณอยู่ในดินแดนเนื้อหาสยองขวัญ ซึ่งดีหากนั่นคือจุดประสงค์ - เพียง ไม่ใช่สำหรับการสื่อสารประจำวัน
การเปรียบเทียบเครื่องมือเสียงลึก
สำหรับความสมบูรณ์ นี่คือวิธีการตัวเลือกหลักไปตามสัดส่วน:
VoxBooster: เลื่อน pitch และ formant อิสระ routing latency ต่ำ low-latency audio capture ลูกโซ่ EQ และเอฟเฟกต์ AI voice cloning mode พร้อม DSP Windows 10/11 ลองใช้ฟรี 3 วัน DSP latency ต่ำกว่า 10ms
Voicemod: ไลบรารี preset ที่ดี ตรวจสอบ Discord ที่ดี แต่ latency real-time สูงกว่า และเบอร์ฟรีถูก จำกัด อย่างมาก ไม่มีการควบคุม formant อิสระในอิน UI พื้นฐาน
MorphVOX Pro: Windows app ยาว - จักรวาล ควบคุม formant ยุติธรรม latency สูงขึ้นบนเอฟเฟกต์ที่ซับซ้อน UI เก่า ดีสำหรับผู้ใช้ที่ต้องการการประมวลผล offline-only โดยไม่มีการสมัครสมาชิก
Clownfish Voice Changer: ฟรี การติดตั้งระดับระบบ latency ขั้นต่ำ แต่คุณภาพ DSP จำกัด และไม่มี formant shifting ทำงานในทุก apps แต่คุณภาพเสียงสำหรับเอฟเฟกต์เสียงลึกต่ำกว่า visibly
สำหรับการแจกแจงอย่างสมบูรณ์ โปรดดูการเปรียบเทียบ voice changers ที่ดีที่สุดสำหรับ PC ของเรา
คำถามที่พบบ่อย
Deep voice changer คืออะไร?
Deep voice changer เป็นซอฟต์แวร์ที่ลดระดับเสียงและปรับเปลี่ยนสิ่งสั่นพ้องของ formant ของเสียงของคุณแบบเรียลไทม์ ทำให้ดูเต็มไปด้วยและมีอำนาจมากขึ้น โปรแกรมนี้กำหนดเส้นทางเสียงที่ประมวลผลแล้วผ่านไมโครโฟนเสมือน ดังนั้นแอปใด ๆ - Discord, OBS, games - จึงรับมันเป็นอินพุตไมค์ปกติ
ฉันควรเปลี่ยนระดับเสียงลงกี่เซมิโทนเพื่อให้ฟังลึกกว่า?
สำหรับเอฟเฟกต์การทำให้ลึกตามธรรมชาติ ให้เปลี่ยนระดับเสียงระหว่าง -2 ถึง -5 semitones เลยจุด -6 หรือ -7 เสียงจะเริ่มฟังขุ่นหรือตลกขบขัน ต่ำเว้นแต่ formants ก็เปลี่ยนไปด้วย ผลลัพธ์ที่น่าเชื่อถือมากที่สุดสำหรับการใช้งานในแต่ละวันอยู่ในช่วง -3 ถึง -4 semitones โดยมีการลด formant ประมาณ -15 ถึง -25 เปอร์เซ็นต์
ทำไมเสียงลึกของฉันจึงฟังเหมือนมีเสียงหรือเหมือนหุ่นยนต์?
การเปลี่ยนแปลงระดับเสียงลงโดยไม่ปรับเปลี่ยน formant เป็นสาเหตุทั่วไปที่สุด Formants เป็นความถี่ที่สั่นพ้องของช่องเสียงของคุณ - พวกมันกำหนด ‘สี’ ของเสียงของคุณ เมื่อคุณลดระดับเสียงแต่ปล่อยให้ formants ไม่เปลี่ยนแปลง เสียงจะฟังเพื่อและไม่เป็นธรรมชาติ ลดฟอร์แมนต์พร้อมกับระดับเสียงเพื่อแก้ไข
Deep voice changer ทำงานบน Discord หรือไม่?
ใช่. ซอฟต์แวร์เช่น VoxBooster ติดตั้งไมโครโฟนเสมือน low-latency audio capture คุณเลือกไมโครโฟนเสมือนนั้นในการตั้งค่าอินพุต Discord และ Discord จะรับเสียงลึกที่ประมวลผลแล้วโดยตรง ไม่จำเป็นต้องมีเครื่องมือการกำหนดเส้นทางเพิ่มเติม
การใช้ voice deepener จะทำให้ฉันถูกแบนในเกมหรือไม่?
VoxBooster ลงทะเบียนเป็นไมโครโฟนเสมือน Windows มาตรฐานโดยใช้ low-latency audio capture - ไม่มี kernel driver ไม่มี process injection ระบบ anti-cheat ปฏิบัติต่อมันเหมือนกับอุปกรณ์เสียงอื่น ๆ ความเสี่ยงมีประสิทธิผลเป็นศูนย์ แม้ว่าคุณควรตรวจสอบเงื่อนไขของแต่ละเกมหากคุณใช้ AI voice cloning
ฉันสามารถเพิ่มเบสและ reverb ด้านบนการเปลี่ยนระดับเสียงเพื่อให้ได้เอฟเฟกต์ที่ลึกกว่าหรือไม่?
ใช่ และมันใช้งานได้ดี เพิ่ม low shelf EQ ประมาณ 80-150 Hz เพิ่มน้ำหนัก ในขณะที่ short room reverb หรือ mild chorus เพิ่มขนาด อย่างไรก็ตาม ให้เก็บเอฟเฟกต์ไว้เล็กน้อย - การซ้อนตัวกรองมากเกินไปจะลดความชัดเจน ให้ความสำคัญกับการปรับปรุงระดับเสียงและ formant ก่อน จากนั้นเพิ่มเอฟเฟกต์หนึ่งหรือสองอย่างที่เสริม
อะไรคือความแตกต่างระหว่าง pitch shift และ formant shift ในการทำให้เสียงลึก?
Pitch shift ลดความถี่พื้นฐาน - โน้ตดนตรีที่เสียงของคุณอยู่ Formant shift ลดยอดสั่นพ้องของช่องเสียงของคุณ ซึ่งกำหนดขนาดที่รู้สึกและเสียงกึ่งที่อกของคุณ การลดระดับเสียงเพียงอย่างเดียวฟังเหมือนกล: การลด formant พร้อมกับระดับเสียงสร้างเสียงที่ลึกกว่าและใหญ่ขึ้นอย่างน่าเชื่อถือ
บทสรุป
ได้รับเสียงที่ลึกและน่าเชื่อถือจริง ๆ จากตัวลึกเสียงเป็นปัญหาพารามิเตอร์สอง: pitch down บวก formant ลง ระดับเสียงควบคุมที่ที่เสียงของคุณอยู่บนเครื่องชั่งดนตรี formants ควบคุมขนาดและ resonance ของร่างกายที่สร้างเสียง เล็บทั้งสอง เพิ่มเบา low shelf EQ และผลลัพธ์ยืนหยัดต่อการฟังที่เคร่งครัด
VoxBooster จัดการทั้งหมดนี้ผ่านลูกโซ่สัญญาณ low-latency audio capture-native ที่มี latency ที่เพิ่มเติมต่ำกว่า 10ms การควบคุม pitch และ formant อิสระ EQ chainable และชั้นวาง EQ ไมโครโฟนเสมือนที่ทุก Windows app นำมาโดยไม่มีการตั้งค่าเพิ่มเติม ไม่ว่าคุณจะใช้มันสำหรับ persona streaming gaming comms narration หรือเพียงเพื่อดูว่าเสียงของคุณฟังเหมือนไร กับ 40 Hz resonance ที่อกเพิ่มเติม - ฟรีไปลอง
ดาวน์โหลด VoxBooster และเริ่มการลองใช้งานฟรี 3 วันเพื่อทดลองกับการตั้งค่าทุกอย่างที่ครอบคลุมในคำแนะนำนี้โดยไม่ต้องเสีย