ตัวแปลงเสียงสูง: ทำให้เสียงของคุณสูงขึ้น

เรียนรู้วิธีทำให้เสียงสูงขึ้นในเวลาจริงด้วยการควบคุม pitch shift และ formant การตั้งค่าคำแนะนำ การแก้ไข artifact และกรณีการใช้งานสำหรับเกมและสตรีมมิง

ตัวแปลงเสียงสูง: ทำให้เสียงของคุณสูงขึ้น

ตัวแปลงเสียงสูงเป็นหนึ่งในเอฟเฟกต์เสียงในเวลาจริงที่ได้รับการร้องขอมากที่สุด — ไม่ว่าคุณต้องการเสียงตัวละครที่น่าเชื่อถือสำหรับการเล่นบทบาท ตัวกรองสนุก ๆ สำหรับคืนเกม หรือการเปลี่ยนแปลงเสียงอย่างเป็นมืออาชีพสำหรับสตรีมมิง ส่วนที่ยากคือการได้รับเสียงที่ดูเหมือนว่าดีจริง ๆ แทนที่จะเป็นเสียงหุ่นยนต์ที่หักแตก บทความนี้ครอบคลุมวิธีการทำงานของการประมวลผล pitch และ formant ร่วมกัน การตั้งค่าที่ใช้สำหรับเป้าหมายที่ต่างกัน วิธีหลีกเลี่ยง artifact ที่พบบ่อยที่สุด และวิธีการทำให้ทุกอย่างทำงานใน Discord OBS หรือเกมใด ๆ ได้ภายในเวลาไม่กี่นาที”


TL;DR

  • Pitch shift ย้ายความถี่พื้นฐานของคุณ formant shift ย้ายการสั่นพ้องของเสียงของคุณ — คุณมักจะต้องใช้ทั้งคู่เพื่อผลลัพธ์ที่น่าเชื่อถือ
  • สำหรับเสียงสูงที่ฟังเหมือนธรรมชาติ ให้เริ่มต้นที่ +3 ถึง +5 semitone และเพิ่มการแก้ไข formant ประมาณ 1.2x ถึง 1.3x
  • สำหรับเอฟเฟกต์ squeaky ที่เกินจริง ให้ดัน pitch ให้สูงขึ้น (+8 ถึง +12 st) และให้ formant ตามไป
  • Artifact ส่วนใหญ่มาจากการ shift pitch มากเกินไปโดยไม่มีการชดเชย formant หรือสัญญาณแหล่งที่มีเสียงรบกวน
  • VoxBooster ทำงานเป็น mic เสมือนมาตรฐาน — ไม่มี kernel driver anti-cheat ปลอดภัย latency sub-10ms
  • ทำงานใน Discord OBS เกมใด ๆ แอปพลิเคชันใด ๆ ที่เลือกอินพุต microphone

ตัวแปลงเสียงสูงคืออะไร?

ตัวแปลงเสียงสูงคือซอฟต์แวร์ที่เพิ่ม pitch ของเสียงของคุณในเวลาจริงขณะที่คุณพูด โดยไม่มีการบันทึกหรือการประมวลผลในภายหลัง ซอฟต์แวร์นี้ดักจับสัญญาณไมโครโฟนของคุณ ใช้การประมวลผล pitch และ formant ในทันที และส่งผ่านผลลัพธ์ไปยังอุปกรณ์เสียงเสมือนที่ซอฟต์แวร์อื่น ๆ อ่านเป็น microphone ปกติ วลีหลักคือ “เวลาจริง” — ผู้ฟังของคุณใน Discord หรือในเกมจะได้ยินเสียงที่ได้รับการแก้ไขขณะที่คุณพูด โดยมี latency วัดเป็นมิลลิวินาที มิใช่วินาที

เทคโนโลยีที่อยู่เบื้องหลังการเปลี่ยน pitch ได้รับการศึกษามาตั้งแต่ศตวรรษที่ผ่านมาในการประมวลผลสัญญาณ แกนกลางของ pitch shifter สมัยใหม่คือ phase vocoder ซึ่งเป็นเทคนิคที่แยกเสียงของคุณออกเป็นเฟรมสั้น ๆ ที่ทับซ้อนกัน ยืดหรือบีบอัดในโดเมนความถี่ และประกอบใหม่ — ทั้งหมดนี้เร็วพอที่จะทำ live การประยุกต์ใช้ที่ดีกว่าเพิ่มเติมยังรักษาหรือเปลี่ยน formant โดยอิสระ ซึ่งเป็นจุดสูงสุดของการสั่นพ้องในประตูเสียงของคุณที่ให้ลักษณะของเสียง

Pitch vs. Formant: ทำไมทั้งคู่จึงสำคัญ

นี่คือแนวคิดที่สำคัญที่สุดหากคุณต้องการเสียงสูงที่ฟังเหมือนธรรมชาติแทนที่จะถูกประมวลผล

Pitch (หรือความถี่พื้นฐาน F0) คืออัตราการสั่นของเสียงของคุณ Pitch ที่สูงขึ้นหมายความว่าการสั่นเร็วขึ้น ซึ่งคุณรับรู้ว่าเป็นโน้ตดนตรีที่สูงขึ้น การเปลี่ยน pitch ค่อนข้างตรงไปตรงมาในอัลกอริทึม

Formants เป็นปรากฏการณ์ที่แยกจากกัน ประตูเสียงของคุณ — รูปร่างของคอ ปาก และช่องจมูก — ทำหน้าที่เป็นตัวสั่นพ้องที่ขยายช่วงความถี่บางช่วงที่เรียกว่าความถี่ formant F1 และ F2 (formant ตัวแรกและตัวที่สอง) มีความสำคัญเป็นพิเศษสำหรับคุณภาพสระที่รับรู้และลักษณะธรรมชาติของเสียง เสียงของเด็กรับรู้ว่าสูงขึ้นส่วนหนึ่งเป็นเพราะว่าพวกเขามีประตูเสียงที่สั้นกว่า ซึ่งผลักดัน formant ขึ้นไปพร้อม ๆ กับ pitch

เมื่อคุณ pitch-shift โดยไม่ต้องสัมผัส formant คุณจะยกระดับความถี่พื้นฐาน แต่ปล่อยให้จุดสูงสุด formant อยู่ในที่ที่พวกเขาอยู่ ผลลัพธ์คือเสียง “กระรอก” แบบคลาสสิก: เสียงของคุณสูงขึ้น แต่การสั่นพ้องยังคงอยู่ในที่ที่เสียงของผู้ใหญ่นั่ง ซึ่งสร้างความไม่ตรงกันที่ไม่เป็นธรรมชาติ เพื่อให้ได้เสียงสูงที่น่าเชื่อถือตามธรรมชาติ คุณจะยกระดับ pitch และ formant ร่วมกัน เพื่อให้ได้เอฟเฟกต์กระรอกที่เกินจริง คุณจะผลักดัน pitch ขึ้นโดยไม่ต้องจับคู่ formant ตามสัดส่วน — คุณจึงจงใจสร้างความไม่ตรงกันนั้น

ไม่มีวิธีการใดผิด พวกเขาให้บริการเพื่อวัตถุประสงค์สร้างสรรค์ที่แตกต่างกัน

สองเป้าหมาย สองการตั้งค่าที่แตกต่างกัน

ก่อนที่คุณจะเริ่มต้นเลื่อน ลูกกลิ้ง ให้ตัดสินใจว่าคุณลงเอยอะไรจริง ๆ

เสียงสูงตามธรรมชาติ

หากเป้าหมายของคุณคือฟังเหมือนคนที่อายุน้อยกว่า ตัวละครที่มีเสียงสูง หรือ register เสียงที่ต่างกัน คุณต้องการให้ pitch และ formant เคลื่อนไหวเข้าด้วยกัน นี่บางครั้งเรียกว่า “feminisasi เสียง” ในเครื่องมือพูด แม้ว่ามันจะใช้ได้เท่า ๆ กันกับเสียงตัวละครสูงใด ๆ อัตราส่วน formant ควรอยู่ในสัดส่วนกับตัวคูณ pitch ของคุณประมาณ

การ shift pitch +4 semitone สอดคล้องกับตัวคูณความถี่ประมาณ 1.26x การจับคู่ที่มี shift formant ประมาณ 1.2x ถึง 1.3x จะรักษาความสัมพันธ์ระหว่าง F0 และ formant ให้เชื่อถือได้

เสียง Squeaky ที่เกินจริง

หากคุณต้องการเสียงกระรอก ยักษ์ดินแดน หรือ gremlin เพื่อความบันเทิง คุณจึงจงใจสร้างความไม่ตรงกัน ผลักดัน pitch ไปที่ +8 +10 หรือ +12 semitone และปล่อยให้ formant อยู่ในอัตราส่วนที่ต่ำกว่า — ประมาณ 1.0x ถึง 1.1x นี่คือดินแดน “helium voice” มันฟังเหมือนสิ่งประดิษฐ์ ซึ่งก็คือจุดประสงค์

ตัวแปลงเสียงสูงที่ดีให้คุณได้ควบคุมอิสระเหนือพารามิเตอร์ทั้งสองเพื่อให้คุณสามารถลงจอดได้ที่ใดก็ได้ระหว่างสองสุดขั้ว

การตั้งค่า Semitone และ Formant ที่แนะนำ

นี่คือตารางอ้างอิงเชิงปฏิบัติสำหรับกรณีการใช้งานทั่วไป นี่คือจุดเริ่มต้น — เสียง ไมโครโฟน และสภาพแวดล้อมเสียงของคุณทั้งหมดส่งผลต่อผลลัพธ์ ดังนั้นให้พิจารณานี่เป็นพื้นฐานที่คุณปรับแต่งจาก

กรณีการใช้งานPitch Shiftอัตราส่วน Formantตัวละคร
เสียงสูงเล็กน้อย+3 ถึง +5 st1.15x ถึง 1.25xธรรมชาติ register สูงเล็กน้อย
เสียงตัวละคร (elf sprite)+5 ถึง +7 st1.2x ถึง 1.35xชัดเจนต่างกัน ยังคงเข้าใจได้
กระรอกที่เกินจริง+9 ถึง +12 st1.0x ถึง 1.1xสนุก การ์ตูน obviously สิ่งประดิษฐ์
Goblin / NPC หมวดมุก+6 ถึง +8 st1.15x ถึง 1.25xสูง แต่มีลักษณะ “gravel”
เสียงสไตล์อนิเมะ+4 ถึง +6 st1.25x ถึง 1.4xสว่าง คลื่น ความเข้มข้นของอายุที่สูงขึ้น
Shift octave เต็ม+12 st1.5xความเป็นจริงสูงสุดที่ octave ทรัพยากร-หนัก

หนึ่ง semitone คือ 1/12 ของ octave +12 semitone = ตรง octave ขึ้นหนึ่งอัน ที่ +12 คุณเพิ่มความถี่พื้นฐานของเสียงคุณเป็นสองเท่า ซึ่งเป็นการ shift ที่เรียกร้อง เสียงส่วนใหญ่ยังคงเข้าใจได้ที่นั่นหากมีการชดเชย formant เกินไปนั้น การรู้จำคำจะเริ่มลดลง

Setup ทีละขั้นตอนใน VoxBooster

การใช้งานเสียงสูงใช้เวลาประมาณสองนาที หากคุณมีซอฟต์แวร์ที่ติดตั้งแล้ว หากยังไม่ได้ดำเนินการ ให้ดาวน์โหลด ทดลองใช้ฟรี 3 วัน

ขั้นตอนที่ 1: ตั้งค่าอุปกรณ์อินพุตของคุณ

เปิด VoxBooster และไปที่ Settings ภายใต้ Audio Input ให้เลือก microphone จริงของคุณ นี่คือแหล่งที่มาของคุณ — ตรวจสอบให้แน่ใจว่ามันเก็บรวบรวมอย่างสะอาด โดยไม่มี background noise หรือ clipping ก่อนที่คุณจะเริ่มประมวลผล

ขั้นตอนที่ 2: เปิดใช้งาน Pitch Shifter

ในบานหน้าต่าง Voice Effects ให้ค้นหาการควบคุม Pitch Shift โดยปกติจะแสดงเป็น semitone เริ่มต้นโดยลาก ไปที่ +4 หรือ +5 และพูดเข้าไปในไมโครโฟนของคุณ คุณจะได้ยินตัวอย่างเวลาจริงผ่านช่องการติดตามของคุณ Latency ควรต่ำกว่า 10ms — ต่ำพอที่จะไม่รู้สึกตัดขาดจากพูดของคุณ

ขั้นตอนที่ 3: ปรับ Formant

ทันทีถัดจากหรือด้านล่างการควบคุม pitch คุณจะพบเลื่อน Formant หากมี VoxBooster auto-correction เปิดใช้งาน มันอาจเพิ่มเติมได้แล้วการติดตาม pitch shift ของคุณ หากคุณต้องการผลลัพธ์ตามธรรมชาติ ให้เก็บ formant ไว้ที่ตัวคูณประมาณเดียวกับ pitch shift ของคุณ หากคุณต้องการสไตล์กระรอก ให้ลด formant ratio ลง 1.0x

ขั้นตอนที่ 4: บันทึกเป็น Preset

เมื่อคุณได้เสียงที่คุณชอบแล้ว ให้บันทึกเป็น preset ที่มีชื่อ นี่ให้คุณ hotkey มันระหว่างวิทยุน้อยหรือวิดีโอการเล่นเกม คุณสามารถมี preset “เสียงปกติ” และ preset “เสียงตัวละคร” และสลับระหว่างพวกเขาโดยไม่ต้องเปิด giao diện ของแอป

ขั้นตอนที่ 5: ตั้งค่าเป็นอินพุตใน Discord / OBS / Game

ขั้นตอนสุดท้ายคือการชี้แอปพลิเคชันเป้าหมายของคุณไปที่ microphone เสมือน VoxBooster แทนอันจริง

  • Discord: Settings > Voice and Video > Input Device — เลือก VoxBooster Virtual Mic
  • OBS: ในการตั้งค่าเสียงหรือแหล่ง microphone ให้เลือก VoxBooster Virtual Mic เป็นอุปกรณ์ capture
  • เกม / แอปอื่น ๆ: เช่นเดียวกัน — ค้นหาการเลือก microphone ในแอปหรือในการตั้งค่า Windows Sound และเลือกอุปกรณ์เสมือน VoxBooster

ดู walkthrough โดยละเอียดใน วิธีใช้ voice changer บน Discord หากคุณประสบปัญหากับ noise processing ที่มีตัวในตัวของ Discord

ส่วนสัญญาณสะอาดก่อนการประมวลผล

Artifact ทุกตัวในผลลัพธ์ของคุณจะถูกขยายจากแหล่งที่มาของคุณ สัญญาณการป้อนข้อมูลที่สะอาดคือสิ่งที่ต้องปฏิบัติตาม

  • ปิดใช้งาน noise suppression ใด ๆ ที่ firmware mic หรือ headset ของคุณใช้ก่อนที่สัญญาณจะชนวน VoxBooster ปล่อยให้ VoxBooster จัดการ noise suppression ในห่วงโซ่ของตัวเอง หลังจาก pitch processing การ layer สอง noise suppressor มักจะนำเสนอ phase artifacts ที่ทำให้ pitch shifting ฟังแย่ลง
  • หลีกเลี่ยง gain staging ที่ clip input ตรวจสอบให้แน่ใจว่าระดับ mic ของคุณเป็นจุดสูงสุดระหว่าง -12 dBFS และ -6 dBFS เมื่อคุณพูด ด้วยเสียงปกติ Clipping ก่อน pitch shift สร้าง crack ที่ยากที่ไม่มีอัลกอริธึมใด ๆ ที่สามารถลบออกอย่างสะอาด
  • หากคุณอยู่ในชุดหูฟัง gaming ที่มี mic สร้างขึ้น ผลลัพธ์จะดีกว่าที่คุณคาดว่า — low-latency audio capture จับที่คุณภาพเต็ม — แต่ microphone USB หรือ XLR ที่อุทิศเป็นพิเศษจะให้ headroom มากขึ้นและปัญหา background noise น้อยลง

หลีกเลี่ยง Artifact ทั่วไป

เสียง “ใต้น้ำ” หรือ “Phasey”

สิ่งนี้เกิดขึ้นเมื่อ frame size phase vocoder ไม่ตรงกับจำนวน pitch shift ที่คุณใช้ ที่ pitch shifts สุดขั้ว (+10 st หรือมากกว่า) บางการประยุกต์ใช้สร้างคุณภาพ swooshing หรือใต้น้ำที่เป็นลักษณะเฉพาะ การแก้ไขมักจะเป็นการใช้การตั้งค่าอัลกอริธึม pitch ที่มีคุณภาพสูงขึ้นหากซอฟต์แวร์ของคุณมอบให้ หรือยอมรับการเพิ่มขึ้นเล็กน้อยใน latency เพื่อแลกกับการประมวลผลที่สะอาดขึ้น

Buzzing Metallic Robotic

สิ่งนี้เกือบจะเกิดจากการเก็บอัดเกินหรือ hard-clipping ที่ไหนสักแห่งในห่วงโซ่ ตรวจสอบ input gain การประมวลผลฮาร์ดแวร์ใด ๆ ที่ headset หรือ interface ของคุณใช้ และเอฟเฟกต์เสียงระดับระบบใด ๆ (Windows “sound enhancements” ควรปิดสำหรับซอฟต์แวร์การประมวลผล)

Word-Ending Cutoffs

ที่ค่า pitch shift สูง อัลกอริธึมบางตัวต่อสู้กับ consonant transient — โดยเฉพาะ sibilant เช่นเสียง “s” และ “sh” สามารถยืดหรือตัด หากพูดของคุณฟังเหมือนคำที่ถูกตัดที่จุดสิ้นสุด ให้ลองลดการตั้งค่า buffer size การประมวลผล Buffer ที่เล็กลงหมายถึง latency ต่ำลง แต่ยังมี frame น้อยลงสำหรับอัลกอริธึมในการทำงาน experiment เพื่อค้นหาความสมดุล

คุณภาพ Thin Tinny

Formant สูงเกินไปเทียบกับ pitch สามารถสร้างคุณภาพ thin tinny ถ้า เสียงของคุณฟังเหมือนว่างเปล่าหรือขาดร่างกาย ให้ลดอัตราส่วน formant เล็กน้อย อัตราส่วน formant 1.5x พร้อม +3 semitone pitch shift มักจะเปลี่ยนการ shift resonance มากเกินไป — นำพวกเขาให้ใกล้เคียงกับสัดส่วน

กรณีการใช้งาน: คุณต้องการเสียงสูงจริง ๆ เมื่อไร?

Character Roleplay และ D&D Sessions

กลุ่ม RPG tabletop ออนไลน์ (Roll20 Foundry VTT Discord server) เป็นหนึ่งในกรณีการใช้งานที่ใหญ่ที่สุดสำหรับ voice changing มีเสียงตัวละครที่อุทิศเป็นพิเศษชัดเจนแตกต่างจากเสียงปกติของคุณช่วยให้ผู้เล่นอยู่ในเรื่อง Elf gnome sprite และตัวละครหนุ่มสาวทั้งหมดได้รับประโยชน์จาก register เสียงที่สูงขึ้น +5 st / 1.25x formant preset บันทึกไป hotkey หมายถึงคุณสามารถเปลี่ยนเข้าและออกจาก character voice ทันที

Streaming และ Content Creation

เสียงตัวละครสูงเพิ่ม texture ไปยังเนื้อหา เสียง NPC squeaky เมื่อคุณเล่น RPG “กระรอก” ตัวกรองระหว่างช่วงเวลามีม หรือเสียงตัวละครที่สม่ำเสมอสำหรับบิตซ้ำ — ทั้งหมดนี้เป็นกรณีการใช้งานจริงที่ streamer ค้นหา OBS integration guide สำหรับ voice changer ครอบคลุมวิธีเส้นทาง VoxBooster เพื่อให้ stream ของคุณได้รับเสียงที่ได้รับการแก้ไขในขณะที่การติดตามในเครื่องของคุณ สามารถ tionally อยู่ในเสียงจริงของคุณ

Gaming และ Chat

เซสชั่นเกม bạn bè-and-ครอบครัว Among Us lobby เกม party — ตัวกรองเสียงสูงที่สนุก สนใจเพิ่มการบันเทิง ความปลอดภัยต่อต้านการโกงจากการประยุกต์ใช้ที่ไม่มี kernel-driver เช่น VoxBooster มีความสำคัญที่นี่ ดู ความปลอดภัยต่อต้านการโกงและวิธี VoxBooster ทำงาน สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับเหตุใด tools ที่ใช้ low-latency audio capture จึงไม่เรียกใช้ระบบต่อต้านการโกง

Privacy

ผู้ใช้บางคนยกระดับ pitch เป็น layer anonymization เสียง พื้นฐาน Shift +4 ถึง +6 st เปลี่ยนแปลงพอลายเซ็น voice ของคุณเพื่อให้ลำโพงการรู้จำตัวตนต่อสิ่งที่ยากขึ้นมากกว่า แต่ฟังไม่เป็นธรรมชาติต่อผู้ฟัง นี่ไม่ใช่เครื่องมือการรักษาความปลอดภัย แต่เพื่อ anonymization เสียงสบาย ๆ (streaming โดยไม่เปิดเผยเสียงของคุณ ตัวอย่างเช่น) มันเพิ่มการแยกแยะมีความหมายจากเสียงจริงของคุณ

AI Voice Cloning และเป้าหมาย Pitch-สูง

หากคุณใช้ neural voice conversion ของ VoxBooster เพื่อ clone เสียงเป้าหมายที่สูง pitch กว่าคุณ ระบบจัดการความสัมพันธ์ pitch โดยอัตโนมัติ — มันแม็ป voice ของคุณกับ timbre เป้าหมาย ซึ่งรวมถึง register pitch ธรรมชาติของเป้าหมาย Pitch และ formant sliders จากนั้นให้คุณ fine-tune จากนั่น นี่คือ workflow ที่แตกต่างจากการควบคุมด้วยตนเองที่อธิบายข้างต้น แต่ทำความเข้าใจความสัมพันธ์ formant ช่วยคุณตีความว่า AI กำลังทำอะไรและแก้ไข artifacts ถ้ามัน ปรากฏตัว

การเปรียบเทียบตัวเลือก Voice Changer

คุณมีตัวเลือกอื่น ๆ สำหรับ pitch shifting เวลาจริง Voicemod และ MorphVOX เป็นทางเลือกที่เสนอบ่อยที่สุด Clownfish เป็นตัวเลือกฟรีที่มีอยู่มาเป็นเวลาหลายปี

ความแตกต่างหลักเพื่อพิจารณา:

  • คุณภาพการประมวลผล: อัลกอริธึม pitch คุณภาพสูงขึ้นสร้าง artifact น้อยลงที่การตั้งค่าสุดขั้ว สิ่งนี้เปลี่ยนแปลงอย่างมีนัยสำคัญในเวอร์ชันซอฟต์แวร์และมักไม่ได้บันทึก ที่ โดยผู้จำหน่าย
  • Latency: Sub-10ms มีความสำคัญสำหรับการสนทนาแบบสด Latency ใด ๆ ที่คุณสามารถได้ยิน (คร่าว ๆ เหนือ 20-30ms) สร้างเอฟเฟกต์ echo-in-your-head ที่ทำให้เป็นการพูดตามธรรมชาติยากขึ้น
  • ควบคุม Formant: ไม่ใช่เครื่องมือทั้งหมดที่เปิดเผยควบคุม formant โดยอิสระ หากคุณมี Pitch slider เท่านั้น คุณจะ จำกัด ไปยัง shift gaya กระรอกโดยไม่มีความสามารถใน tune เพื่อผลลัพธ์ที่ฟังเหมือนธรรมชาติ
  • Integration: Tools ที่ใช้ low-latency audio capture ลงทะเบียนเป็นอุปกรณ์เสียงมาตรฐานและทำงานได้ทุกที่ Implementations kernel-driver อาจมอบฟีเจอร์เพิ่มเติม แต่มีความเสี่ยงต่อต้านการโกงและต้องการการตั้งค่าที่ระมัดระวังกว่า
  • ราคา: Tier ฟรีมีอยู่สำหรับเครื่องมือส่วนใหญ่ tier ที่ support มักจะปลดล็อคคุณภาพเสียง เอฟเฟกต์พร้อมกัน และการจัดการ preset

หน้า pricing ของ VoxBooster มีรายละเอียดแผนปัจจุบันหากคุณต้องการเปรียบเทียบ

Pitch Shifting สำหรับ Speech-to-Text และ TTS

ปฏิสัมพันธ์ที่ underappreciated หนึ่ง: หากคุณใช้คุณลักษณะ speech-to-text ของ VoxBooster (dictation) พร้อมกับ voice effects ให้เก็บ voice effects chain ปิดสำหรับเส้นทางอินพุต dictation เสียง pitch-shifted สับสนส่วนใหญ่แบบจำลอง transcription เพราะพวกเขาถูกฝึกอบรมในการพูดตามธรรมชาติ การกำหนด VoxBooster จัดการสิ่งนี้ — dictation อ่านจาก microphone raw ของคุณในขณะที่อุปกรณ์เอาต์พุตเสมือนของคุณมี เสียงที่ประมวลผล

ในทำนองเดียวกัน หากคุณใช้เอาต์พุต TTS (text-to-speech) ผ่าน VoxBooster การควบคุม pitch ในโมดูล TTS แยกจากจากโซ่ pitch shift microphone

Advanced: Pitch Shift ร่วมกับสิ่งอื่น ๆ เอฟเฟกต์

เสียงสูงมักจะจับคู่ที่ดีกับเอฟเฟกต์บางอย่างและแย่กับคนอื่น ๆ

การรวมกันที่ดี:

  • Reverb ที่ mix ต่ำ (5-10%) ขึ้นเพิ่มอากาศเข้าไปยังเสียงสูง ไม่ เบลอ
  • Subtle chorus (delay สั้นมาก ความลึก minimal) เพิ่มคุณภาพ ethereal ที่ทำงานได้ดีสำหรับตัวละครไฟแนลแฟนตาซี
  • Light noise gate เพื่อทำความสะอาด hiss การประมวลผลที่ใด ๆ ที่ค่า shift สูง

หลีกเลี่ยง:

  • Heavy compression หลัง pitch shift อัลกอริธึม pitch ได้รับการแก้ไขแล้ว dynamics การเพิ่ม fast-attack compressor เหนือบ่อยครั้งสร้าง pumping artifacts
  • Pitch shift + pitch shift xếp chồng หากคุณใช้ neural voice conversion ของ VoxBooster ไม่ยังด้วยการ stack manual pitch slider เหนือเว้นแต่คุณเข้าใจ precisely ว่าคุณเพิ่มสิ่งที่ — คุณสามารถสร้าง doubled artifacts
  • Extreme EQ cuts ใน high-mid range (2-4 kHz) หลัง pitch shift เสียง high-shifted อาศัยอยู่ใน range นั่น การตัดมันยากหลาย laymakers เหมือน hoarse และ unrecognizable

สำหรับการเรียนรู้เพิ่มเติมเกี่ยวกับ layering effects หน้า features voice effects มีเอกสารห่วงโซ่เอฟเฟกต์เต็ม

FAQ

ฉันควรขยับ semitone กี่อันเพื่อให้ได้เสียงสูง?

สำหรับเสียงที่สูงขึ้นเล็กน้อย ลอง +3 ถึง +5 semitone สำหรับเสียงตัวละครที่ชัดเจนว่าสูงขึ้น +6 ถึง +10 เกิน +12 (หนึ่งอ็กเทฟ) มักจะสร้าง artifact ที่หนักหน่วงเว้นแต่คุณจะปรับ formant ด้วย เริ่มต่ำและเพิ่มขึ้นอย่างค่อยเป็นค่อยไป

ความแตกต่างระหว่าง pitch shift และ formant shift สำหรับทำให้เสียงสูงขึ้นคืออะไร?

Pitch shift ย้ายความถี่พื้นฐานของเสียงของคุณขึ้นหรือลง Formant shift ย้ายจุดสูงสุดของการสั่นพ้องในประตูเสียงของคุณโดยอิสระ การเปลี่ยน pitch โดยไม่มี formant มักจะฟังเหมือนกระรอก การเปลี่ยนทั้งคู่ร่วมกันจะสร้างเสียงที่สูงขึ้นและเชื่อถือได้มากขึ้น

ตัวแปลงเสียงสูงจะทำให้ฉันถูกแบนจากเกมหรือไม่?

VoxBooster ใช้ low-latency audio capture และลงทะเบียน microphone เสมือน มาตรฐานโดยไม่มี kernel driver ดังนั้นระบบต่อต้านการโกงจึงเห็นมันเหมือนกับอุปกรณ์เสียงอื่น ๆ ปลอดภัยที่จะใช้ในเกมเชิงแข่งขัน

ฉันสามารถใช้ตัวแปลงเสียงสูงใน Discord ได้หรือไม่?

ใช่ ตั้งค่า VoxBooster เป็นอุปกรณ์อินพุตของคุณในการตั้งค่า Discord ภายใต้ Voice and Video เสียงของคุณจะถูกประมวลผลในเวลาจริงก่อนที่ Discord จะได้รับ ดังนั้นทุกคนในการโทรจะได้ยินเสียงที่สูงขึ้น

ฉันจะหยุดเสียงหุ่นยนต์เซี่ยงขึ้นเมื่อ pitch ขึ้นได้อย่างไร?

สาเหตุหลักคือการ shift pitch มากเกินไปโดยไม่มีการชดเชยฟอร์แมนต์ อัตราส่วนฟอร์แมนต์ที่ช้า หรืออัลกอริธึม pitch ที่มีคุณภาพต่ำ ใน VoxBooster ให้เปิดใช้งานการแก้ไข formant และให้อยู่ในเกณฑ์ 1.2x ถึง 1.5x ของตัวคูณ pitch ของคุณ นอกจากนี้ โปรดตรวจสอบให้แน่ใจว่าสัญญาณไมโครโฟนแห้งของคุณสะอาดก่อนการประมวลผล

การทำให้เสียงสูงขึ้นใช้ได้กับการสตรีมบน OBS หรือไม่?

ใช่ VoxBooster รวมเข้ากับ OBS เป็นแหล่งเสียงเสมือน สตรีมของคุณจึงแสดงเสียงที่ประมวลผลแล้ว เช่นเดียวกับไมโครโฟนใด ๆ คุณยังสามารถใช้ hotkey เพื่อสลับ preset แบบสดอยู่ไม่ต้องสัมผัสการตั้งค่า OBS

เสียงสูงที่ดีที่สุดสำหรับตัวละครเกมคืออะไร?

ขึ้นอยู่กับสถาปัตยกรรมตัวละคร สำหรับปีศาจที่หมวดมุก +6 ถึง +8 semitone ที่มี shift formant เบาจะทำงานได้ดี สำหรับเอฟเฟกต์กระรอกเต็มรูปแบบ ให้ดัน pitch ไปที่ +10 ถึง +12 และปล่อยให้ formant ยังคงสูง สำหรับเสียงหญิงที่น่าเชื่อถือ ให้เน้นไปที่ shift formant (+1.2x ถึง +1.4x) ที่มี shift pitch ปานกลาง (+3 ถึง +5 st)

บทสรุป

การทำให้เสียงของคุณสูงขึ้นในเวลาจริงเป็นปัญหาสองตัวแปร — pitch และ formant — และการทำความเข้าใจทั้งคู่คือสิ่งที่แยกผลลัพธ์ที่น่าเชื่อถือออกจากเสียงหุ่นยนต์ที่หักแตก ไม่ว่าคุณต้องการ shift vocal subtle ตัวละครเสียง fantasy หรือตัวกรองกระรอก full-on หลักการดูแลใจคือเหมือนกัน: จับคู่ formant ratio ของคุณไปยัง pitch shift เพื่อผลลัพธ์ตามธรรมชาติ หรือ intentionally mismatch พวกเขาเพื่อเอฟเฟกต์ที่เกินจริง

ซอฟต์แวร์ voice changer ส่วนใหญ่ให้คุณอย่างน้อยเลื่อน pitch โปรแกรมที่คุ่มค่าในการใช้สำหรับผลลัพธ์คุณภาพ — VoxBooster included — ยังเปิดเผย formant ควบคุม low-latency การประมวลผล และ preset ที่ถูกต้อง การจัดการเพื่อให้คุณสามารถเปลี่ยนเสียงกลางการนั่งซ้ำแบบ โดยไม่หักขัดท๊อกหรือเกม

หากคุณยังไม่ได้ลอง ดาวน์โหลด VoxBooster และเรียกใช้ทดลองใช้ฟรี 3 วัน คุณจะมี preset สูง ทำงาน ในห้านาที และคุณสามารถประเมินคุณภาพเอง ก่อนที่คุณใช้จ่ายใด ๆ

ลอง VoxBooster — ทดลองใช้ฟรี 3 วัน

โคลนเสียงเรียลไทม์ ซาวด์บอร์ด และเอฟเฟกต์ — ทุกที่ที่คุณคุย

  • ไม่ต้องใช้บัตรเครดิต
  • ความหน่วง ~30ms
  • Discord · Teams · OBS
ลองฟรี 3 วัน