Deep Voice Changer: ทําให้เสียงของคุณลึกกว่าและใหญ่ขึ้น

เรียนรู้วิธีการทํางานของ voice changer ลึก - เปลี่ยนระดับเสียง การปรับแต่ง formant และการตั้งค่าทีละขั้นตอนเพื่อให้เสียงที่เต็มไปด้วยและลึกกว่าสําหรับการเล่นเกม การสตรีมมิ่ง และการบรรยาย

Deep Voice Changer: ทําให้เสียงของคุณลึกกว่าและใหญ่ขึ้น

Voice changer ลึกทำได้มากกว่าการลากแถบเลื่อนลง - ทำได้ถูกต้อง มันจะเปลี่ยนทั้งระดับเสียงและลักษณะสั่นพ้องของเสียงของคุณ ดังนั้นผลลัพธ์จึงฟังเหมือนคนที่ใหญ่ขึ้นและมีอำนาจมากขึ้น ไม่ใช่เทปเล่นที่ความเร็วผิด ไม่ว่าคุณจะต้องการสร้างบุคลิกการสตรีมมิ่ง เพิ่มน้ำหนักให้กับการบรรยาย คงอยู่โดยไม่เปิดเผยตัวตนในแชทเสียง หรือเพียงแค่ทดลองกับเสียงของคุณ คู่มือนี้จะแนะนำกลไกการทำงาน DSP จริง การตั้งค่าที่สำคัญ และการตั้งค่าแบบสมบูรณ์ทีละขั้นตอนโดยใช้ VoxBooster


TL;DR

  • Pitch shift เพียงอย่างเดียว (ไม่มีการปรับเปลี่ยน formant) ฟังเพื่อและเหมือนหุ่นยนต์ - คุณต้องใช้ทั้งสอง
  • ทำให้ลึกตามธรรมชาติที่ดีที่สุด: -3 ถึง -4 semitones pitch, -15 ถึง -25% formant
  • สำหรับเสียงลึกสุดขั้วและเป็นแบบ: -5 ถึง -7 semitones + formant shift + low shelf EQ
  • VoxBooster กำหนดเส้นทางเสียงที่ประมวลผลแล้วผ่านไมโครโฟนเสมือน low-latency audio capture - ทำงานบน Discord, OBS และทุกเกม
  • Latency ต่ำกว่า 10ms หมายความว่าเสียงของคุณจะอยู่ในการซิงค์ระหว่างการโทรสดและการสตรีมมิ่ง
  • ลองใช้งานฟรี 3 วัน ไม่ต้องใช้บัตรเครดิต

Deep Voice Changer ทำอะไรจริง ๆ?

ก่อนที่จะแตะปุ่มเลื่อน ก็ควรเข้าใจว่าซอฟต์แวร์จำเป็นต้องจัดการกับพารามิเตอร์ใด - เพราะสองพารามิเตอร์ที่สำคัญ (pitch และ formant) มักจะทำให้เกิดความสับสน และความสับสนนั้นนำไปสู่เสียงที่ขุ่นและเทียมซึ่งทำให้ voice changers มีชื่อเสียงไม่ดี

Pitch: ความถี่พื้นฐาน

เสียงที่มีเสียงทุกเสียงที่คุณออกมามี ความถี่พื้นฐาน - อัตราที่เสียงของคุณสั่น สำหรับเสียงพูดของชายผู้ใหญ่ปกติ มันจะอยู่ที่ประมาณ 85 ถึง 180 Hz สำหรับเสียงผู้หญิงผู้ใหญ่ปกติ มันจะอยู่ระหว่าง 165 ถึง 255 Hz เมื่อ voice changer ลึกเปลี่ยน pitch ลงมา มันจะลดความถี่พื้นฐานนี้ - ย้ายโน้ตดนตรีที่เสียงของคุณอยู่ลงบนตราด

การเปลี่ยน semitone หนึ่ง ตรงกับการคูณความถี่ด้วยประมาณ 0.944 ดังนั้นหากคุณพูดที่ 150 Hz และเปลี่ยนลง 4 semitones เสียงที่ประมวลผลจะลงจอดประมาณ 119 Hz - ลึกเข้าไปในอาณาเขตของเสียงการออกอากาศชายที่ลึก

Formants: ลักษณะช่องเสียง

Formants คือยอดสั่นพ้องที่สร้างขึ้นโดยรูปร่างและความยาวของช่องเสียงของคุณ - ปาก คออยห์ และเอกซ์นั่น พวกเขานั่งอยู่เหนือความถี่พื้นฐานและกำหนดเสียงสระที่คุณสร้างขึ้น รวมทั้ง ‘สี’ โดยรวมและขนาดที่รู้สึกของเสียงของคุณ ช่องเสียงที่ยาวกว่า (ตามที่พบในคนที่สูงกว่า) สร้าง formants ที่ต่ำกว่า และนั่นคือเหตุผลที่เสียงที่ลึกกว่ามักฟังเหมือนใหญ่ขึ้นจากกายภาพ

เมื่อคุณเปลี่ยน pitch ลงโดยไม่สัมผัส formants ระดับพื้นฐานลดลง แต่สิ่งสั่นพ้องของช่องเสียงก็คงอยู่ ไมของคุณได้ยินความไม่ตรงกันนี้ว่าไม่เป็นธรรมชาติ - pitch พูด ‘คน deep’ แต่ resonance พูด ‘คนเล็ก’ ผลลัพธ์ฟังเหมือน chipmunk กำลังวิ่งย้อนหลัง: เพื่อ, plasticky และไม่น่าเชื่อถือ

เลื่อน formants ลงพร้อมกับ pitch และสองเบาะแสจะจัดแนว เสียงของคุณฟังเหมือนว่ามันมาจากร่างกายที่ใหญ่ขึ้นจริง ๆ

ทำไม Pitch-Only ถึงฟังผิด (และ Formant Linking ซ่อมได้อย่างไร)

นี่คือความผิดพลาดที่เกือบทุกมือใหม่ทำ พวกเขาพบ preset เสียงลึก ปั่น pitch slider ถึง -6 หรือ -8 semitones และสงสัยว่าทำไมมันฟังเหมือนวิทยุเสีย มากกว่า movie villain

ปัญหาไม่ใช่จำนวน pitch - มันคือความไม่ตรงกัน formant การวิจัยเสียงเกี่ยวกับการรับรู้เสียงแสดงให้เห็นว่าผู้ฟังประเมินปลายทั้งสองพร้อมกัน เมื่อทั้งสองแตกต่างกัน เสียงจะอ่านเป็นประมวลผลแม้ว่าผู้ฟังไม่สามารถตั้งชื่อเหตุผล

Formant linking (บางครั้งเรียกว่า ‘formant tracking’ หรือ ‘vocal tract scaling’) แก้ไขสิ่งนี้โดยการเลื่อน formants ในสัดส่วนกับการเปลี่ยนแปลง pitch คุณภาพซอฟต์แวร์ voice changer มากมายนำเสนอสิ่งนี้เป็นลิงก์อัตโนมัติหรือเลื่อน formant แยกต่างหาก VoxBooster ให้คุณควบคุมอิสระของทั้งสอง ซึ่งเป็นวิธีการที่ถูกต้อง - ทำให้ลึกตามธรรมชาติต้องการการเลื่อน formant ที่เล็กกว่าเล็กน้อยกว่าการเปลี่ยน pitch และบางกรณีการใช้งาน (เช่นเสียง monster) ต้องการการลด formant ที่เกินจริงนอกเหนือจากสิ่ง pitch เรียก

จุดเริ่มต้นที่ใช้ได้จริง: สำหรับการเปลี่ยน pitch -1 semitone ลดฟอร์แมนต์ประมาณ 3 ถึง 5 เปอร์เซ็นต์ อัตราส่วนนั้นลอกเลียนแบบความสัมพันธ์เสียงเพลงระหว่างความยาวของเสียงและความยาวของช่องเสียงในการเปลี่ยนเสียงตามธรรมชาติ

การตั้งค่าที่เหมาะสมสำหรับเสียงลึกตามธรรมชาติ

ทำให้ลึกตามธรรมชาติ - สิ่งที่ฟังเหมือนคนจริงแตกต่างกันแทนการ์ตูน - ต้องมีการทดำเนิน การตั้งค่าด้านล่างเป็นจุดเริ่มต้น ปรับเปลี่ยนตามเสียงต้นฉบับของคุณ

การตั้งค่าอนุรักษ์นิยม: อำนาจเล็ก ๆ

นี่คืออุดมคติสำหรับการนำเสนอ บรรยาย และสถานการณ์ที่คุณต้องการน้ำหนักโดยไม่ดึงดูดความสนใจไปที่การประมวลผล

  • Pitch: -2 ถึง -3 semitones
  • Formant: -10 ถึง -18%
  • Low shelf EQ: +2 ถึง +3 dB ที่ 100 Hz, Q เท่ากับ 0.7
  • Reverb: ไม่มีหรือห้องสั้น ๆ (pre-delay 10ms, decay 0.3s)

ที่การตั้งค่าเหล่านี้ ผู้ฟังส่วนใหญ่จะไม่ระบุเสียงว่าเป็นประมวลผล - พวกเขาจะเพียงรับรู้เสียงที่ลึกกว่าปกติ

การตั้งค่าตรงกลาง: Gaming Persona / Streaming Character

นี่คือช่วงที่ใช้โดย streamers ส่วนใหญ่ที่สร้าง persona on-screen ที่แตกต่าง เสียงฟังแตกต่างกันอย่างชัดเจนจากธรรมชาติ แต่ยังคงเป็นมนุษย์

  • Pitch: -4 ถึง -5 semitones
  • Formant: -20 ถึง -28%
  • Low shelf EQ: +3 ถึง +4 dB ที่ 80 Hz
  • Mild chorus: ความลึก 10%, อัตรา 0.5 Hz (เพิ่มความกว้างเล็กน้อยและขนาดที่รู้สึก)

คุณจะสังเกตเห็นว่าเสียงฟังใหญ่ขึ้นมากและน่าประทับใจกว่าโดยไม่สูญเสียความชัดเจนของพยัญชนะ Plosives (b, p, d, t) ยังคงชัดเจน ซึ่งมีความสำคัญสำหรับการโทร gaming

การตั้งค่าสุดขั้ว: Monster, Villain, Narrator

นี่คือเนื้อหาแบบจัดแต่งทรงผม - creepypasta narration ตัวละครเจ้าชู่ gimmick VTuber เนื้อหาสยองขวัญ

  • Pitch: -6 ถึง -8 semitones
  • Formant: -30 ถึง -40%
  • Low shelf EQ: +4 ถึง +5 dB ที่ 70 Hz โดยมีการตัด high shelf ด้านบน 8 kHz เพื่อลดความหยาบ
  • Short reverb: decay 0.6 ถึง 0.8 วินาที ในการตั้งค่าห้องขนาดใหญ่

ที่ค่าเหล่านี้ ความชัดเจนจะเริ่มลดลง - โดยเฉพาะอย่างยิ่งสำหรับ sibilants (s, z, sh) ชะลอวิธีพูดของคุณลงนิดหน่อยและออกเสียงชัดเจนมากขึ้นเมื่อใช้การตั้งค่าสุดขั้ว

ตารางเปรียบเทียบการตั้งค่า

กรณีการใช้งานPitch ShiftFormant ShiftLow Shelf EQReverb
Narration ละเอียด / อำนาจ-2 ถึง -3 st-10 ถึง -18%+2 dB @ 100 Hzไม่มี
Streaming persona-4 ถึง -5 st-20 ถึง -28%+3 dB @ 80 Hzห้องสั้น
ตัวละครเกม-3 ถึง -4 st-18 ถึง -24%+2 dB @ 90 Hzไม่มี
เสียง villain / monster-6 ถึง -8 st-30 ถึง -40%+4 dB @ 70 Hzห้องขนาดใหญ่
แชทเสียงไม่เปิดเผยตัวตน-3 ถึง -5 st-15 ถึง -25%+2 dB @ 100 Hzไม่มี

st = semitones ค่า EQ ทั้งหมดเป็นเสียงบูสต์ใน dB ปรับตามรสชาติตามการตอบสนองความถี่ต่ำของไมโครโฟนของคุณ

ทีละขั้นตอน: การตั้งค่าเสียงลึกใน VoxBooster

นี่คือการตั้งค่าที่สมบูรณ์จากการติดตั้งไปจนถึงการใช้งานสด ใน Discord หรือซอฟต์แวร์สตรีมมิ่งของคุณ

ขั้นตอนที่ 1 - ติดตั้งและเปิด

ดาวน์โหลด VoxBooster จาก /download และเรียกใช้โปรแกรมติดตั้ง VoxBooster ลงทะเบียนไมโครโฟนเสมือน low-latency audio capture ที่เรียกว่า ‘VoxBooster Virtual Mic’ ระหว่างการติดตั้ง ไม่มีการติดตั้งไดรเวอร์เคอร์เนล และไม่จำเป็นต้องเริ่มระบบใหม่

ขั้นตอนที่ 2 - ตั้งค่าไมโครโฟนอินพุตของคุณ

เปิด VoxBooster ไปที่ Settings → Audio Devices และเลือกไมโครโฟนกายภาพของคุณเป็นแหล่งอินพุต หากคุณใช้อินเตอร์เฟสเสียง ให้เลือกอินพุท low-latency audio capture ของอินเตอร์เฟสแทนตัวแปร MME หรือ DirectSound - low-latency audio capture ให้เส้นทาง latency ต่ำสุดผ่านลูกโซ่สัญญาณ

ขั้นตอนที่ 3 - เปิดแผง Voice Effects

คลิกแท็บ Voice Effects คุณจะเห็นแถบเลื่อน pitch, แถบเลื่อน formant และช่องลูกโซ่เอฟเฟกต์ไม่บังคับด้านล่าง สำหรับเสียงลึก คุณทำงานหลักกับ pitch และ formant - ปล่อยให้ส่วนที่เหลือปิดเพื่อเริ่มต้น

ขั้นตอนที่ 4 - ใช้ Pitch และ Formant

ตั้งแถบเลื่อน pitch ไปที่ค่า semitone เป้าหมายของคุณ เริ่มด้วย -3 และพูดตามธรรมชาติ - ฟังกลับผ่านหูฟังของคุณ (เปิดใช้งานการตรวจสอบที่ Settings → Monitor Input) ปรับจนกว่าเสียงจะอยู่ที่ตำแหน่งที่คุณต้องการ

จากนั้นลดแถบเลื่อน formant ลง เริ่มที่ -15% และเพิ่มการลดลงแบบค่อยเป็นค่อยไปขณะพูด ณ จุดหนึ่ง เสียงจะเริ่มฟังเต็มไปด้วยและเป็นธรรมชาติมากขึ้น เลยเกณฑ์หนึ่ง มันจะเริ่มฟังไม่เป็นมนุษย์ ค้นหาจุดหวาน สำหรับเสียงและกรณีการใช้งานของคุณ

ขั้นตอนที่ 5 - เพิ่ม EQ (ไม่บังคับ แต่แนะนำ)

คลิกปุ่ม + ในลูกโซ่เอฟเฟกต์และเพิ่มโมดูล EQ ใช้เสียงบูสต์ low shelf ที่ +2 ถึง +3 dB รอบ 80 ถึง 100 Hz นี่เพิ่มน้ำหนักที่รู้สึกและเสียงที่อกของ resonance หากไมโครโฟนของคุณมีเบส - heavy เรียบร้อยแล้ว ให้ข้ามนี้หรือใช้เสียงบูสต์ที่เล็กกว่า

อย่าเพิ่มด้านล่าง 60 Hz - พิสัยนั้นส่วนใหญ่เป็นเสียงนอฟนของห้อง และจะทำให้เสียงฟังขุ่นมากกว่าลึก

ขั้นตอนที่ 6 - ส่งไปยังแอปของคุณ

ใน Discord: ไปที่ User Settings → Voice & Video → Input Device และเลือก ‘VoxBooster Virtual Mic’ ใน OBS: เพิ่มแหล่ง Audio Input Capture และตั้งเป็น ‘VoxBooster Virtual Mic’ สำหรับเกม ให้ไปที่การตั้งค่าเสียงในเกมและเลือก VoxBooster Virtual Mic เป็นอินพุตไมโครโฟนของคุณ

นั่นคือการตั้งค่าแบบสมบูรณ์ VoxBooster ประมวลผลเสียงด้วย latency ที่เพิ่มเติมต่ำกว่า 10ms ดังนั้นเสียงและวิดีโอจึงยังคงซิงค์แม้บนเหล้า

มันทำงานแบบเรียลไทม์หรือมี Latency ที่เห็นได้ชัด?

การประมวลผลแบบเรียลไทม์เป็นข้อกำหนดที่จำเป็นสำหรับ voice changers ที่ใช้ในการสื่อสารสด Latency ใด ๆ ที่สูงกว่าประมาณ 30ms เริ่มรู้สึกเหมือนเสียงสะท้อน เกิน 50ms จึงกลายเป็นที่เห็นจริง

VoxBooster ครอบแครง latency ที่เพิ่มเติมต่ำกว่า 10ms สำหรับการประมวลผล pitch และ formant Latency รอบท้องจริงของคุณขึ้นอยู่กับฮาร์ดแวร์เสียงและขนาดบัฟเฟอร์ - ขนาดบัฟเฟอร์ที่เล็กกว่าจะลด latency ด้วยค่าใช้จ่ายของโหลด CPU ที่สูงกว่า บนเครื่อง Windows 10 mid-range ที่มีอินเตอร์เฟสเสียงมาตรฐานที่ตั้งเป็นบัฟเฟอร์ 128-sample การประมวลผลเสียงลึกแบบเรียลไทม์ทั่วไปจะทำงานประมาณ 15 ถึง 25ms รอบท้องทั้งหมด ต่ำกว่าเกณฑ์การบานออกของการรับรู้อย่างมาก

เพื่อการเปรียบเทียบ โหมดเรียลไทม์ของ Voicemod มักนั่งที่ 30 ถึง 50ms ขึ้นอยู่กับความซับซ้อนของเอฟเฟกต์ และ MorphVOX Pro สามารถ push สูงกว่านั้นใน presets ที่หนักกว่า เส้นทาง low-latency audio capture-native ของ VoxBooster รักษาการประมวลผลให้แน่น

กรณีการใช้งานสำหรับ Deep Voice Changer

Gaming Personas

ผู้เล่นจำนวนมากสร้าง audio identities ที่แตกต่างกันสำหรับเกม roleplay หรือการแข่งขัน เสียงที่ลึกกว่าจะอ่านเป็นคำสั่งมากขึ้นในการสื่อสารของทีม - การวิจัยในด้านจิตวิทยาสังคมพบอย่างสม่ำเสมอว่าเสียงที่มีระดับต่ำกว่าถูกมองว่ามีอำนาจและครอบงำมากขึ้นในบริบทการสื่อสารกลุ่ม เสียง gaming persona ที่นั่งที่ -3 ถึง -4 semitone ต่ำกว่าเสียงตามธรรมชาติของคุณด้วยการชดเชย formant ให้คุณมีความได้เปรียบนั้น โดยไม่ฟังเทียมสังเคราะห์

ดูเพิ่มเติมที่: วิธีใช้ voice changer บน Discord และคำแนะนำทั่วไปเกี่ยวกับ voice changers latency ต่ำ สำหรับบริบทการตั้งค่าเพิ่มเติม

Streaming และ VTubing

ตัวละคร streaming ได้รับประโยชน์จากความสม่ำเสมอของเสียง: ผู้ชมของคุณสร้างการเชื่อมโยงระหว่างตัวละครของคุณและเสียงของคุณ เสียงที่ประมวลผลแล้วล็อกตัวตนนั้นแม้ว่าคุณจะสตรีมมิ่งในหลายวันและเสียงตามธรรมชาติของคุณแตกต่างจากความเหน็ดเหนื่อยหรือปวดศีรษะ นอกจากนี้ยังเพิ่มชั้นการแยกระหว่างเสียงส่วนตัวของคุณและ persona streaming ของคุณ ซึ่งผู้สร้างจำนวนมากต้องการ

Voice-Over และการบรรยาย

สำหรับการบรรยายสไตล์เอกสาร วิดีโอคำอธิบาย หรืองานหนังสือเสียง การเปลี่ยน pitch -2 ถึง -3 semitone ที่มีการควบคุมด้วยการชดเชย formant สามารถปรับให้เรียบเสียงที่บางหรือจมูกในธรรมชาติโดยไม่ทำให้ผลลัพธ์ฟังเป็นการประมวลผล คุณหลัก ให้เก็บการเปลี่ยนแปลงไว้เล็กพอที่ผู้ฟังจะสนใจเนื้อหา ไม่ใช่เสียง

ความเป็นส่วนตัวในการสื่อสารออนไลน์

เสียงคือชีวมิเตอร์ - ติดกันอยู่เลย ระดับและรูปแบบการพูดที่สม่ำเสมอสามารถระบุตัวคุณได้ทั่วแพลตฟอร์มแม้ไม่มีข้อมูลการรับรองตัวตนอื่น ๆ การเปลี่ยนระดับเสียงและ formant โดยจำนวนที่ปานกลาง (แม้แต่ -2 semitone และ -12% formant) จะสร้างระยะห่างเสียงเพียงพอเพื่อขัดขวางการจดจำเสียงสุ่มอย่างมีนัยสำคัญขณะยังคงรักษาความชัดเจนของธรรมชาติ

นี่คือกรณีการใช้งานความเป็นส่วนตัวที่ถูกต้องตามกฎหมาย โดยเฉพาะอย่างยิ่งที่เกี่ยวข้องกับนักข่าว นักเคลื่อนไหว นักวิจัย และใครก็ตามที่เข้าร่วมชุมชนที่พวกเขาไม่ต้องการเชื่อมโยงกับตัวตนออฟไลน์ของพวกเขา

โครงการสร้างสรรค์และงานตัวละคร

เนื้อหาสยองขวัญ podcast ฟิกชัน tabletop RPG actual plays เสียง game master - ทั้งหมดนี้ได้รับประโยชน์จากความสามารถในการสร้างเสียงตัวละครที่ลึกและแตกต่างกันตามความต้องการ แทนที่จะรักษาเสียงวิวเล้ว voice deepener ช่วยให้คุณประหยัดตัวละครนานหลายชั่วโมง โดยไม่มีความเหน็ดเหนื่อยเสียง

AI Voice Cloning vs. DSP Deepening: อะไรคือความแตกต่าง?

VoxBooster นำเสนอเอฟเฟกต์เสียง DSP ดั้งเดิม (pitch shift, formant shift, ลูกโซ่ EQ) และการโคลนเสียง AI แนวทางพื้นฐานที่แตกต่างกันเพื่อการแปลงเสียง

DSP deepening จัดการเสียงของคุณเองแบบเรียลไทม์โดยใช้อัลกอริธึมการประมวลผลสัญญาณ เอาต์พุตยังคงฟังเหมือนคุณ เพียงแค่เปลี่ยนแปลง Latency ต่ำมาก (ต่ำกว่า 10ms) และการประมวลผลเป็นแบบ deterministic - อินพุตเดียวกันจะสร้างเอาต์พุตเดียวกันเสมอ

AI voice cloning ใช้การแปลงเสียง neural เพื่อแมปเสียงของคุณไปยังโมเดลเสียงที่ได้รับการฝึกอบรม เอาต์พุตฟังเหมือนคนที่แตกต่างกันจริง ๆ ไม่ใช่เวอร์ชันเลื่อนของคุณ Latency สูงกว่า (โดยปกติ 80 ถึง 200ms ขึ้นอยู่กับฮาร์ดแวร์และโมเดล) และคุณภาพขึ้นอยู่กับข้อมูลการฝึกอบรมของโมเดล

สำหรับเอฟเฟกต์เสียงลึกระหว่างการเล่นเกมสดหรือการโทร Discord DSP เกือบจะเป็นตัวเลือกที่ดีกว่า - ความแตกต่าง latency มีนัยสำคัญเพียงพอที่จะมีผลต่อคุณภาพการสื่อสาร AI voice cloning เหมาะสำหรับเนื้อหา pre-recorded streaming ที่ซิงค์เสียง-วิดีโอน้อยสำคัญ หรือกรณีที่คุณต้องการตัวตนที่แตกต่างกันโดยสิ้นเชิง แทนที่จะเป็นเวอร์ชันลึกของตัวเอง

หน้า voice changer features และ voice effects ของ VoxBooster อธิบายโหมดทั้งสองโดยละเอียด

ความผิดพลาดทั่วไปและวิธีแก้ไข

Pitch มากเกินไป formant ไม่เพียงพอ เสียงฟังเพื่อหรือยาง ซ่อม: ลด formant จนกว่าการสั่นพ้องจะตรงกับความลึกของ pitch

Low shelf EQ boost หนักเกินไป เสียงฟังเพื่อเพื่อและสูญเสีย definition ต่ำกว่า 200 Hz ซ่อม: ให้ low shelf boost ต่ำกว่า +4 dB และ high-pass filter ที่ 60 Hz เพื่อตัดเสียงนอฟนของห้อง

Monitoring บน ขณะพูด หากคุณเปิดใช้งานการตรวจสอบอินพุตด้วย latency ที่เห็นได้ สมองของคุณจะพยายามชดเชยสิ่งสะท้อนโดยการเปลี่ยนวิธีที่คุณพูด - เสียงจึงกลายเป็นเครียดและไม่สม่ำเสมอ ซ่อม: ใช้การตรวจสอบ zero-latency หรือปิด ไว้ใจการตั้งค่าของคุณและฟังกลับบนการบันทึก

เลือก preset สุดขั้วโดยไม่ปรับแต่งเสียงของคุณ Presets ได้รับการสอบเทียมบนเสียงตัวอย่าง - มักเป็นจุดกึ่งกลางเอกจน โครงสร้าง formant ตามธรรมชาติของเสียง อัตราการพูด และความถี่พื้นฐานของคุณจะแตกต่างกัน เริ่มจาก preset เสมอ จากนั้นปรับ pitch และ formant ให้ตรงกับเสียงตามธรรมชาติของคุณก่อน ก่อนเพิ่มเอฟเฟกต์อื่น

หมดพื้นที่ CPU การซ้อน 5 หรือ 6 เอฟเฟกต์พร้อมกันสามารถทำให้เกิด dropouts คลิก หรือ artifact ประมวลผลบนฮาร์ดแวร์ที่เก่ากว่า ซ่อม: ใช้โหมด low-latency ของ VoxBooster ลดขนาดบัฟเฟอร์เป็น 256 ตัวอย่าง และปิดซอฟต์แวร์หนักเสียงอื่น ๆ ดูคำแนะนำของเราเกี่ยวกับ การตั้งค่า voice changer low-latency สำหรับขั้นตอนการหาปัญหาที่ละเอียด

Deep เท่าไหร่คือเกินไป?

มีจุดที่การเปลี่ยนแปลง pitch ลงและ formant เริ่มทำงานต่อต้านคุณ ความชัดเจนลดลง: สระกลายเป็นคลุมเครือ พยัญชนะสูญเสีย cues ออก ผู้ฟังต้องทำงานหนักกว่าเพื่อแยกวิเคราะห์สิ่งที่คุณพูด ความเหน็ดเหนื่อยตั้งค่าอย่างรวดเร็วบนด้านผู้ฟัง และบนด้านผู้พูด คุณอาจเริ่มโดยไม่สม่ำเสมอมากขึ้น ซึ่งทำให้เสียงที่ประมวลผลฟังมีการกำหนดเสียง

กฎหลักที่ดี: หากผู้พูดภาษาอังกฤษเจ้าหนาวีดีดีดีดีดีดีดีดี ‘บิต’ จาก ‘เดือย’ ในเสียงที่ประมวลผลที่ดังเสียงสนทนา คุณได้เลยห่างไกลเกินไป ดึงการตั้งค่ากลับมาจนกว่าเสียงจะลึกและน่าประทับใจ แต่ยังคงชัดเจน

เพดาน acoustics สำหรับ deepening สุดขั้วโดยไม่สูญเสียความชัดเจนคือ roughly -7 semitones ด้วย formants scaled สัดส่วนโลก เลยอีกหนึ่ง คุณอยู่ในดินแดนเนื้อหาสยองขวัญ ซึ่งดีหากนั่นคือจุดประสงค์ - เพียง ไม่ใช่สำหรับการสื่อสารประจำวัน

การเปรียบเทียบเครื่องมือเสียงลึก

สำหรับความสมบูรณ์ นี่คือวิธีการตัวเลือกหลักไปตามสัดส่วน:

VoxBooster: เลื่อน pitch และ formant อิสระ routing latency ต่ำ low-latency audio capture ลูกโซ่ EQ และเอฟเฟกต์ AI voice cloning mode พร้อม DSP Windows 10/11 ลองใช้ฟรี 3 วัน DSP latency ต่ำกว่า 10ms

Voicemod: ไลบรารี preset ที่ดี ตรวจสอบ Discord ที่ดี แต่ latency real-time สูงกว่า และเบอร์ฟรีถูก จำกัด อย่างมาก ไม่มีการควบคุม formant อิสระในอิน UI พื้นฐาน

MorphVOX Pro: Windows app ยาว - จักรวาล ควบคุม formant ยุติธรรม latency สูงขึ้นบนเอฟเฟกต์ที่ซับซ้อน UI เก่า ดีสำหรับผู้ใช้ที่ต้องการการประมวลผล offline-only โดยไม่มีการสมัครสมาชิก

Clownfish Voice Changer: ฟรี การติดตั้งระดับระบบ latency ขั้นต่ำ แต่คุณภาพ DSP จำกัด และไม่มี formant shifting ทำงานในทุก apps แต่คุณภาพเสียงสำหรับเอฟเฟกต์เสียงลึกต่ำกว่า visibly

สำหรับการแจกแจงอย่างสมบูรณ์ โปรดดูการเปรียบเทียบ voice changers ที่ดีที่สุดสำหรับ PC ของเรา

คำถามที่พบบ่อย

Deep voice changer คืออะไร?

Deep voice changer เป็นซอฟต์แวร์ที่ลดระดับเสียงและปรับเปลี่ยนสิ่งสั่นพ้องของ formant ของเสียงของคุณแบบเรียลไทม์ ทำให้ดูเต็มไปด้วยและมีอำนาจมากขึ้น โปรแกรมนี้กำหนดเส้นทางเสียงที่ประมวลผลแล้วผ่านไมโครโฟนเสมือน ดังนั้นแอปใด ๆ - Discord, OBS, games - จึงรับมันเป็นอินพุตไมค์ปกติ

ฉันควรเปลี่ยนระดับเสียงลงกี่เซมิโทนเพื่อให้ฟังลึกกว่า?

สำหรับเอฟเฟกต์การทำให้ลึกตามธรรมชาติ ให้เปลี่ยนระดับเสียงระหว่าง -2 ถึง -5 semitones เลยจุด -6 หรือ -7 เสียงจะเริ่มฟังขุ่นหรือตลกขบขัน ต่ำเว้นแต่ formants ก็เปลี่ยนไปด้วย ผลลัพธ์ที่น่าเชื่อถือมากที่สุดสำหรับการใช้งานในแต่ละวันอยู่ในช่วง -3 ถึง -4 semitones โดยมีการลด formant ประมาณ -15 ถึง -25 เปอร์เซ็นต์

ทำไมเสียงลึกของฉันจึงฟังเหมือนมีเสียงหรือเหมือนหุ่นยนต์?

การเปลี่ยนแปลงระดับเสียงลงโดยไม่ปรับเปลี่ยน formant เป็นสาเหตุทั่วไปที่สุด Formants เป็นความถี่ที่สั่นพ้องของช่องเสียงของคุณ - พวกมันกำหนด ‘สี’ ของเสียงของคุณ เมื่อคุณลดระดับเสียงแต่ปล่อยให้ formants ไม่เปลี่ยนแปลง เสียงจะฟังเพื่อและไม่เป็นธรรมชาติ ลดฟอร์แมนต์พร้อมกับระดับเสียงเพื่อแก้ไข

Deep voice changer ทำงานบน Discord หรือไม่?

ใช่. ซอฟต์แวร์เช่น VoxBooster ติดตั้งไมโครโฟนเสมือน low-latency audio capture คุณเลือกไมโครโฟนเสมือนนั้นในการตั้งค่าอินพุต Discord และ Discord จะรับเสียงลึกที่ประมวลผลแล้วโดยตรง ไม่จำเป็นต้องมีเครื่องมือการกำหนดเส้นทางเพิ่มเติม

การใช้ voice deepener จะทำให้ฉันถูกแบนในเกมหรือไม่?

VoxBooster ลงทะเบียนเป็นไมโครโฟนเสมือน Windows มาตรฐานโดยใช้ low-latency audio capture - ไม่มี kernel driver ไม่มี process injection ระบบ anti-cheat ปฏิบัติต่อมันเหมือนกับอุปกรณ์เสียงอื่น ๆ ความเสี่ยงมีประสิทธิผลเป็นศูนย์ แม้ว่าคุณควรตรวจสอบเงื่อนไขของแต่ละเกมหากคุณใช้ AI voice cloning

ฉันสามารถเพิ่มเบสและ reverb ด้านบนการเปลี่ยนระดับเสียงเพื่อให้ได้เอฟเฟกต์ที่ลึกกว่าหรือไม่?

ใช่ และมันใช้งานได้ดี เพิ่ม low shelf EQ ประมาณ 80-150 Hz เพิ่มน้ำหนัก ในขณะที่ short room reverb หรือ mild chorus เพิ่มขนาด อย่างไรก็ตาม ให้เก็บเอฟเฟกต์ไว้เล็กน้อย - การซ้อนตัวกรองมากเกินไปจะลดความชัดเจน ให้ความสำคัญกับการปรับปรุงระดับเสียงและ formant ก่อน จากนั้นเพิ่มเอฟเฟกต์หนึ่งหรือสองอย่างที่เสริม

อะไรคือความแตกต่างระหว่าง pitch shift และ formant shift ในการทำให้เสียงลึก?

Pitch shift ลดความถี่พื้นฐาน - โน้ตดนตรีที่เสียงของคุณอยู่ Formant shift ลดยอดสั่นพ้องของช่องเสียงของคุณ ซึ่งกำหนดขนาดที่รู้สึกและเสียงกึ่งที่อกของคุณ การลดระดับเสียงเพียงอย่างเดียวฟังเหมือนกล: การลด formant พร้อมกับระดับเสียงสร้างเสียงที่ลึกกว่าและใหญ่ขึ้นอย่างน่าเชื่อถือ

บทสรุป

ได้รับเสียงที่ลึกและน่าเชื่อถือจริง ๆ จากตัวลึกเสียงเป็นปัญหาพารามิเตอร์สอง: pitch down บวก formant ลง ระดับเสียงควบคุมที่ที่เสียงของคุณอยู่บนเครื่องชั่งดนตรี formants ควบคุมขนาดและ resonance ของร่างกายที่สร้างเสียง เล็บทั้งสอง เพิ่มเบา low shelf EQ และผลลัพธ์ยืนหยัดต่อการฟังที่เคร่งครัด

VoxBooster จัดการทั้งหมดนี้ผ่านลูกโซ่สัญญาณ low-latency audio capture-native ที่มี latency ที่เพิ่มเติมต่ำกว่า 10ms การควบคุม pitch และ formant อิสระ EQ chainable และชั้นวาง EQ ไมโครโฟนเสมือนที่ทุก Windows app นำมาโดยไม่มีการตั้งค่าเพิ่มเติม ไม่ว่าคุณจะใช้มันสำหรับ persona streaming gaming comms narration หรือเพียงเพื่อดูว่าเสียงของคุณฟังเหมือนไร กับ 40 Hz resonance ที่อกเพิ่มเติม - ฟรีไปลอง

ดาวน์โหลด VoxBooster และเริ่มการลองใช้งานฟรี 3 วันเพื่อทดลองกับการตั้งค่าทุกอย่างที่ครอบคลุมในคำแนะนำนี้โดยไม่ต้องเสีย

ลอง VoxBooster — ทดลองใช้ฟรี 3 วัน

โคลนเสียงเรียลไทม์ ซาวด์บอร์ด และเอฟเฟกต์ — ทุกที่ที่คุณคุย

  • ไม่ต้องใช้บัตรเครดิต
  • ความหน่วง ~30ms
  • Discord · Teams · OBS
ลองฟรี 3 วัน