Girl Voice: การตั้งค่าการปรับแต่งแบบเรียลไทม์ที่ฟังดูจริง

เสียง หญิงสาว ที่น่าเชื่อถือแบบเรียลไทม์ไม่ได้มาจากเลื่อนเดียวที่คุณลากขึ้นไป และความเข้าใจผิดครั้งเดียวนี้คือเหตุผลว่าทำไมความพยายามครั้งแรกส่วนใหญ่จึงออกมาเหมือนของเล่นการ์ตูนที่ร้องไห้แทนที่จะเป็นบุคคล ข่าวดีคือสูตรที่แท้จริงนั้นสั้น สามารถทำซ้ำได้ และอยู่ในสามหมุดบวกกับการส่งออกเล็กน้อย นี่คือคำแนะนำการปรับแต่งแบบเรียลไทม์เชิงปฏิบัติ: สิ่งที่การตั้งค่าแต่ละส่วนทำ ตัวเลขเริ่มต้นที่อยู่ห่างไปประมาณ 80 เปอร์เซ็นต์ และเทคนิคเสียงเล็ก ๆ ที่ส่งผลต่อภาพลวงตาผ่านหูที่สงสัยบน Discord หรือสตรีม

หากคุณต้องการเส้นทางสังเคราะห์อย่างสมบูรณ์แทน (พิมพ์ข้อความหรือแปลงเป็นเสียงหญิงสาวโคลน) จะกล่าวถึงใน คำแนะนำการสร้างเสียง AI girl หากเครื่องมือเปลี่ยนเสียงของคุณสร้างเอาต์พุตที่ไม่ชัดเจนหรือหุ่นยนต์ไม่ว่าคุณจะทำอะไรก็ตาม โพสต์แก้ไขปัญหาตัวแปลงเสียงหญิง คือที่ที่จะเริ่มต้น โพสต์นี้เป็นเจ้าของตรงกลาง: การปรับแต่ง DSP แบบเรียลไทม์ที่ฟังดูจริง

TL;DR

เสียงหญิงสาวที่น่าเชื่อถือคือ pitch ขึ้น ค่อนข้าง บวก formant ขึ้น มากกว่า ไม่ใช่เพียงแค่ pitch
การเลื่อน pitch เพียงอย่างเดียวยืดแรง formant ของคุณและสร้างสิ่งประดิษฐ์กระรอกที่ทุกคนเกลียด
Formant ทำให้ส่วนใหญ่ของการรับรู้ ให้ถือว่า pitch เป็นการควบคุมที่สนับสนุน
เพิ่มการเพิ่ม EQ ช่วงสูงที่อ่อนโยนและการระงับเสียงที่สะอาดเพื่อให้โทนที่ประมวลผลแล้วยังคงเรียบ
ใช้ตารางการตั้งค่า subtle / medium / character ด้านล่างเป็นจุดเริ่มต้น จากนั้นทำการปรับแต่งโดยหู
เทคนิคการทำให้สตรีเป็นผู้หญิงเสียงเบา ๆ (resonance, intonation, การเลือกคำ) ทำให้เครื่องเปลี่ยนเสียงใด ๆ น่าเชื่อถือมากกว่า

สิ่งที่ทำให้เสียงฟังดูเหมือนหญิงสาว?

เสียงนั้นอ่านได้ว่าเป็นหญิงสาวโดยหลัก ๆ ผ่านสัญญาณเสียงสองสัญญาณ: pitch พื้นฐานที่สูงขึ้นและที่สำคัญกว่านั้น formants ที่สูงขึ้นซึ่งบ่งบอกถึงท่อเสียงที่สั้นกว่า Formant คือจุดสูง resonance ที่หล่อด้วยขนาดของคอและปากของคุณ เมื่อพวกเขานั่งอยู่ที่ระดับสูงขึ้น หูจะรับรู้เครื่องดนตรีที่เล็กกว่าและสว่างกว่า ซึ่งเป็นหลักของเสียงหญิงสาวไม่ว่า pitch ที่แน่นอนจะเป็นอย่างไร

นี่คือส่วนที่ขัดขวางสัญชาตญาณ ผู้คนสันนิษฐานว่า “เสียงสูงกว่าเท่ากับหญิงสาว” ดังนั้นพวกเขาจึงยกระดับ pitch และหยุดที่นั่น แต่ผู้พูดสองคนสามารถโจมตีบันทึกเดียวกันในขณะที่คนหนึ่งฟังดูเหมือนชายและอีกคนฟังดูเหมือนหญิงสาวล้วน ๆ เพราะการวางตำแหน่ง formant นี่คือเหตุผลว่าทำไมการเลื่อน formant จึงเป็นดาวของการแสดงและ pitch เป็นดาวรองชำนาญ ได้การจัดลำดับชั้นนี้ให้ถูกต้องและคุณอยู่ส่วนใหญ่ของวิธี สำหรับเสียงหญิงสาวที่อยู่รอดจากการตรวจสอบในการโทรแบบสด

ทำไม pitch-only จึงให้คุณกระรอกไม่ใช่เสียงหญิงสาว

เมื่อคุณเร่งความเร็วหรือ pitch-shift บันทึกอย่างไร้เดียงสา คุณจึงยกระดับพื้นฐาน และ ลากแรง formant ของแต่ละคนขึ้นตามอัตราส่วนเดียวกัน ท่อเสียงที่รับรู้ได้จะหดตัวเกินสัดส่วนของมนุษย์ และสมองของคุณจึงทำเครื่องหมายให้เป็นสัตว์ฟันแรดการ์ตูนทันที นี่คือสิ่งประดิษฐ์กระรอกในประโยคเดียว: pitch และ formant ที่เชื่อมโยงเคลื่อนไหวร่วมกัน ไปไกลเกินไป เร็วเกินไป

เครื่องเปลี่ยนเสียงหญิงสาวเฉพาะจะแยกการควบคุมเหล่านี้เพื่อให้คุณสามารถเคลื่อนย้าย formant ได้อย่างเป็นอิสระจาก pitch คุณยกระดับพื้นฐานเพียงเล็กน้อย จากนั้นผลักดัน formant ให้สูงขึ้นเพื่อวาง timbre ในช่วงหญิงสาวโดยไม่มีท่อเสียงพังลงไปขนาดของเล่น หากเครื่องมือปัจจุบันของคุณเสนอเพียงปุ่ม pitch เดียวและไม่มีการควบคุม formant นี่คือข้อจำกัดของเครื่องมือไม่ใช่ของคุณ และการลากอย่างระมัดระวังจะไม่ซ่อมแซม ควบคุม formant อิสระเป็นคุณลักษณะที่ไม่สามารถเจรจาได้

โมเดลจิตใจด่วน

คิดว่า pitch เป็น บันทึกที่คุณร้อง และ formant เป็น นักร้องใหญ่แค่ไหน เสียงหญิงสาวคือนักร้องเล็กน้อยในบันทึกที่สูงพอสมควร ยกระดับบันทึกโดยไม่ย่อให้เล็กลงของนักร้องและคุณจะได้เสียงต่ำ ๆ ที่บึ้งซึ่งดูเหมือนสูงแปลก ๆ ย่อให้เล็กลงของนักร้องมากเกินไปและคุณจะได้กระรอก สมดุลคือเกมทั้งหมด

สามหมุดที่สำคัญสำหรับการปรับแต่งเสียงหญิงสาว

เกือบทั้งหมดที่ได้ผลอย่างน่าเชื่อถือมาจากการควบคุมสามอย่างทำงานร่วมกัน การปรับแต่งเสียงหญิงสาวนั้นจริง ๆ แล้วเป็นเพียงการหาความสัมพันธ์ที่ถูกต้องระหว่างพวกเขาสำหรับเสียง ของคุณ ที่เริ่มต้น

Pitch (พื้นฐาน). ยกระดับบันทึกฐาน การเคลื่อนไหวเล็ก ๆ เท่านั้น ประมาณ 3 ถึง 5 semitone สำหรับผู้พูดส่วนใหญ่ขนาดชาย เกินความคาดหมายและคุณออกไปจากวงดนตรีมนุษย์
Formant (timbre / ขนาดท่อเสียง). การควบคุมความสมจริง ผลักดัน มากกว่า pitch นี่คือสิ่งที่ทำให้เสียงฟังดูเหมือนหญิงสาวแทนที่จะเป็นชายที่มี pitch สูง
Resonance / EQ (ความสว่าง). การเพิ่มเล็กน้อยในความถี่กลาง-บนและสูงเพิ่มคุณภาพ airy, ไปข้างหน้าซึ่งเสียงหญิงสาวมีแนวโน้มที่จะมี คิดว่านี่เป็นการขัดสีบน pitch และ formant

บางเครื่องเปลี่ยนเสียงติดป้ายการควบคุมที่สาม “ความสว่าง” “โทน” หรือเปิด equalizer เต็มรูปแบบแทน แนวคิดนั้นเหมือนกัน: ยกสูงเล็กน้อย เลี้ยงการสะสม low-mid ที่กำลังวิ่นเข้า และเสียงที่ประมวลผลแล้วนั่งลงอย่างสะอาดกว่า

การตั้งค่าตัวแปลงเสียงหญิงสาว: ตารางจุดเริ่มต้น

นี่คือแผนที่การตั้งค่าที่คุณสามารถคัดลอกลงไปยังตัวแปลงแบบเรียลไทม์ส่วนใหญ่ได้ เหล่านี้เป็นเป้าหมายที่สัมพัทธ์ ไม่ใช่ตัวเลขพระสัตวเจ้า เนื่องจากเครื่องมือปรับขนาดเลื่อนของพวกเขาต่างกัน และ pitch ธรรมชาติของคุณเปลี่ยนแปลงว่าคุณเริ่มที่ไหน เริ่มต้นที่นี่ จากนั้นปรับเปลี่ยนในขั้นตอนเล็ก ๆ ขณะพูดเสียง

การตั้งค่า	Subtle (androgyne)	ตัวกลาง (หญิงสาวตามธรรมชาติ)	Character (สว่าง/anime)
Pitch	+2 ถึง +3 semitone	+4 ถึง +5 semitone	+6 ถึง +8 semitone
Formant	+15%	+30%	+45% หรือมากกว่า
Resonance / high-shelf EQ	+1 dB เหนือ 3 kHz	+2 ถึง +3 dB เหนือ 3 kHz	+4 dB บวกการตัด 200 Hz ที่อ่อนโยน
การระงับเสียงรบกวน	อ่อนโยน	ตัวกลาง	ตัวกลาง
เป้าหมาย	นุ่มกว่า เป็นกลาง เพศ	เสียงหญิงสาวที่เชื่อถือได้	การออกแบบสไตล์ เล่นสนุก

โปรดสังเกตว่า formant ปีนขึ้นเร็วกว่า pitch ในทั้งสามคอลัมน์ นี่คือความลับทั้งหมดที่เข้ารหัสในตาราง คอลัมน์ “ตัวกลาง” คือที่ที่ผู้คนส่วนใหญ่ลงเอยเพื่อผลลัพธ์ที่เป็นธรรมชาติซึ่งฟังดูเหมือนหญิงสาวบน Discord โดยไม่หักเหว่าเข้าสู่การเลียนแบบ คอลัมน์ “ตัวละคร” มีไว้สำหรับผู้ถ่ายทำที่ ต้องการ การอ่าน playful ที่ชัดเจนซึ่งเข้าคู่กับ soundboard ของปฏิกิริยาสไตล์

วิธีการอ่านตารางสำหรับเสียงของคุณเอง

หากเสียงพูดธรรมชาติของคุณสูงอยู่แล้ว ให้เลื่อนทุกอย่างลง (คุณต้องการ pitch น้อยลง) หากลึก คุณอาจต้องการด้านบนของแต่ละช่วง ความสัมพันธ์ระหว่างคอลัมน์มีความสำคัญมากกว่าค่าที่แน่นอน ดังนั้นให้เก็บ formant ด้านหน้า pitch ไม่ว่าคุณจะเริ่มต้นจากที่ใด

ทีละขั้นตอน: ปรับแต่งเสียงหญิงสาวที่เชื่อถือได้แบบเรียลไทม์

ทำสิ่งนี้ด้วยหูฟังและการตรวจสอบที่เปิดใช้งานเพื่อให้คุณได้ยินตัวเองแบบเรียลไทม์ การพูดขณะปรับแต่งเป็นสิ่งสำคัญ preset แบบคงที่ไม่เคยฟังดีเท่า voice ที่คุณสร้างรูปทรงด้วยหู

รีเซ็ตทุกอย่างเป็นศูนย์ และอ่านประโยคเป็นกลาง เสียงดังเพื่อได้ยินพื้นฐานของคุณ
ยก formant ก่อน, ไม่ใช่ pitch เนื้อหาขึ้นจนกว่า timbre จะสว่างและท่อเสียงรู้สึกว่าเล็กลง แต่หยุดก่อนที่มันจะบาง หรือจมูก
เพิ่ม pitch ที่พอสมควร, 3 ถึง 5 semitone ฟังช่วงเวลาที่เสียงเข้าสู่ช่วงหญิงสาวโดยไม่กลายเป็นการเลียนแบบ ถอยกลับทันทีเมื่อคุณได้ยินกระรอก
Nudge resonance / EQ ด้วย high-shelf lift เล็กน้อยเพื่อให้สูงสาร airy แทนที่จะอมึกลึก
พูดย่อหน้าเต็ม, ไม่ใช่คำเดียว สำหรับการพูดอย่างต่อเนื่องเปิดเผยสิ่งประดิษฐ์แปลก ๆ ที่ซ่อนเสียงเดียว “สวัสดี”
ไมโครปรับสมดุล pitch-to-formant. หากเสียงสูง แต่ยังชายอยู่ ให้เพิ่ม formant หากเสียงเลียนแบบ ให้ลดระดับ pitch หากเสียงตัวอักษร ให้ตัด low-mid เล็กน้อย
บันทึก preset เมื่อเก็บไว้ตลอดทั้งย่อหน้า

วงเต็มรูปแบบใช้เวลาสองสามนาทีเมื่อคุณรู้คำสั่ง คำสั่งคือประเด็น: formant จากนั้น pitch จากนั้น shine

การปรับแต่งเสียงหญิงสาวด้วย EQ และเสียงรบกวน

แม้แต่การตั้งค่า pitch และ formant ที่สมบูรณ์แบบอาจถูกบดบังด้วยสัญญาณที่คลุมเครือ สองขั้นตอนการล้างทำให้ความแตกต่างระหว่าง “เห็นได้ชัดว่าประมวลผลแล้ว” และ “เพียงแค่หญิงสาวบน mic”

High-shelf EQ: การยกเบา ๆ เหนือประมาณ 3 kHz เพิ่มอักขระด้านหน้า สว่างที่เสียงหญิงสาวมีแนวโน้มที่จะมี เก็บไว้อย่างดี มากเกินไปกลายเป็นหนักและ sibilant
การตัด low-mid: การแช่เล็ก ๆ รอบ 200 ถึง 300 Hz เอาน้ำหนัก boxy, คนดูเหมือนชายได้ ปล่อยให้ formant สูงกว่าเก็บไว้ข้างหน้า
การระงับเสียงรบกวน: นำหมวดหมู่และ grumble ห้องทำให้ formant ของแน่น และให้กระบวนการไป Input สะอาด = ผลลัพธ์ที่สะอาดกว่า ดังนั้นเรียกใช้ระงับเสียงอย่างน้อยเบา

หากเครื่องมือเปลี่ยนเสียงของคุณรวมถึงการระงับเสียงในตัวและไมโครโฟนเสมือน คุณสามารถเรียงซ้อนทั้งหมดนี้ในโซ่สัญญาณหนึ่งแทนที่จะถมาไปเสียงปลั๊กอินแยก นี่คือข้อดีเชิงปฏิบัติของเครื่องมือ all-in-one เช่น VoxBooster: pitch, formant, EQ และการระงับเสียงอยู่ในหน้าต่างเดียวกัน และเสียงที่ประมวลผลแล้วป้อนไปยัง virtual mic ที่แอปพลิเคชันใด ๆ สามารถเลือกได้ ทุกอย่างทำงานบนอุปกรณ์ ดังนั้นไม่มีเสียงของคุณออกจากพีซีของคุณ

เทคนิคการทำให้สตรีเป็นผู้หญิงเสียงจริงที่แบกรับผล

นี่คือส่วนที่คำแนะนำซอฟต์แวร์ส่วนใหญ่ข้ามไป Changer จัดการอคูสติก แต่ การส่งออก จัดการความเชื่อถือได้ เทคนิคการทำให้สตรีเป็นผู้หญิงเสียงจริงเล็กน้อยทำให้การตั้งค่าตัวแปลงเสียงหญิงสาวใด ๆ ฟังเชื่อถือได้มากขึ้นอย่างมาก เพราะสมองของคุณฟังพฤติกรรม ไม่ใช่แค่ความถี่

การวางตำแหน่ง Resonance

เสียงหญิงสาวมีแนวโน้มที่จะสะท้อนไปข้างหน้า ไปยังหน้ากากของใบหน้า (จมูก แก้ม ปาก) แทนที่จะอยู่ลึกในหน้าอก เป้าหมายเสียงของคุณ “ไปข้างหน้าและขึ้นไป” คุณไม่ต้องบังคับ เพียงจินตนาการถึงเสียงที่ลงจอดที่หน้าปากของคุณ Changer จะมีแหล่งที่สว่างกว่า บางกว่า ที่จะทำงาน ซึ่งเรียงซ้อนกับ formant shift แทนที่จะต่อสู้กับมัน

เสีย และความหลากหลาย Pitch

รูปแบบการพูดหญิงสาวหลายชนิดใช้ช่วง intonation ที่กว้างขึ้น ดนตรีมากขึ้น มีการขึ้นและลงมากขึ้นตลอดประโยค การส่งออกแบบเรียบ monotone อ่านว่าชายแม้หลังการประมวลผล ให้สัญญาณดนตรีธรรมชาติของคุณเปิดเล็กน้อย นี่คือการส่งออก ไม่ใช่ซอฟต์แวร์ และยังคงอยู่แม้ว่า changer จะปิด

การเลือกคำและการออกเสียง

การโจมตีพยัญชนะที่นุ่มนวลและการออกเสียงที่แม่นยำเล็กน้อยอ่านว่า บริหารชาวต่างชาติมากขึ้น คุณไม่ได้เปลี่ยนคำศัพท์ เพียง ขอบ ของคำของคุณ Onsets อ่อนโยน plosives ที่ด้อยกว่า สระที่สะอาดกว่า นิสัยเล็กน้อย ประโยชน์ใหญ่

ไม่มีสิ่งนี้จำเป็นสำหรับการใช้ตัวแปลงเสียง แต่ มีความสำคัญจริง ๆ สำหรับสองกลุ่ม: ผู้ใช้ trans ที่ต้องการเสียงที่สอดคล้องกันโดยไม่มีซอฟต์แวร์ และเกมเมอร์หรือผู้ถ่ายทำที่ต้องการให้ลวงตาอยู่ในการสนทนา unscripted การฝึกฝนเสียงเป็นวิธีปฏิบัติที่ถูกต้องตามกฎหมาย และมีเอกสารประกอบอย่างดี บทส่วนหนึ่งของ Wikipedia เกี่ยวกับ pitch ในดนตรี เป็น primer ที่สมควรในด้านความถี่พื้นฐาน และนักบำบัดสำนักงานกำหนดที่ได้รับใบอนุญาตเชี่ยวชาญด้านเทคนิคการทำให้สตรีเป็นผู้หญิงแบบเต็มรูปแบบสำหรับผู้ที่ต้องการผล lasts นึกถึง changer และเทคนิคเป็นลูกน้อง ไม่ใช่อย่างใดอย่างหนึ่ง

Tuning DSP แบบเรียลไทม์เทียบกับเส้นทาง AI Conversion

มีสองเส้นทางสำหรับเสียงหญิงสาว และพวกเขาแก้ไขปัญหาที่แตกต่างกัน ตารางนี้เปิดเผยเมื่อแต่ละรายการชนะ

ปัจจัย	Tuning DSP แบบเรียลไทม์ (คำแนะนำนี้)	AI Voice Conversion
ความล่าช้า	ต่ำมาก เรียลไทม์	สูงกว่าเล็กน้อย แต่สามารถใช้งานแบบสดในเครื่องมือที่ดี
ความพยายามปรับแต่ง	นาทีของการปรับเลื่อน	ฝึกฝนเสียง เตรียมการมากขึ้น
เพดานความสมจริง	ยอดเยี่ยมกับการส่งออกที่ดี	สูงสุด การทดแทนตัวแบบเต็ม
การส่งออกของคุณสำคัญ	มาก	น้อยกว่า รุ่นถือเวลามากขึ้น
ดีที่สุดสำหรับ	อย่างรวดเร็ว ควบคุมได้ ส่วนตัว	เสียงหญิงสาวที่แตกต่างกันและคัดลอกทั้งหมด

หากคุณต้องการความสมจริงสูงสุดและเต็มใจที่จะลงทุนการปรับแต่งเล็กน้อย เส้นทาง AI conversion (ดูใน คำแนะนำเสียง AI girl) ฝึกฝนรูปแบบไมโครแล้วแทนที่ timbre ของคุณอย่างสมบูรณ์ หากคุณต้องการการควบคุมแบบทันที ตาย-เรียบง่ายที่คุณรูปร่างด้วยหูบนการโทรแบบสด tuning DSP เป็นถนนที่เร็วกว่า ผู้คนจำนวนมากใช้ทั้งสอง: DSP สำหรับการสนทนาเสียงไม่เป็นทางการ AI conversion สำหรับตัวละครลายเซ็น

ทดสอบเสียงหญิงสาวของคุณใน Discord, OBS และ Games

เสียงหญิงสาวที่ฟังดูสมบูรณ์แบบในจอมอนิเตอร์ของคุณยังต้องไปที่ปลายอีกด้านหนึ่งของการโทร นี่คือหน้าที่ของ virtual mic เครื่องมือประมวลผล mic ของคุณ จากนั้นเปิดอุปกรณ์ input virtual ที่แอปพลิเคชันรับปฏิบัติเหมือน mic อื่น ๆ

ในตัวแปลงเสียงของคุณ ให้เปิดใช้งานการส่งออก virtual mic
ใน Discord ให้เปิดการตั้งค่า Voice and Video และตั้งค่า Input Device ให้เป็น virtual mic นั้น Discord ยังช่วยให้คุณสามารถเรียกใช้การทดสอบ mic ซึ่งกล่าวถึงใน การสนับสนุน Discord
ใน OBS หรือเกมของคุณ เลือก virtual mic เดียวกับการป้อนข้อมูล
พูด เสียงที่ประมวลผลแล้วจะได้รับเส้นทางโดยอัตโนมัติโดยไม่มี driver เพิ่มเติม

การเดินเท้า Discord อาศัยอยู่ใน คำแนะนำการปรับแต่งตัวแปลงเสียง Discord หากคุณต้องการเวอร์ชันเคลิก-ต่อแต่ละ สำหรับการสตรีม การเส้นทาง virtual mic เดียวกันไปยัง OBS ทำให้เสียงบนสตรีมของคุณสอดคล้องกับสิ่งที่เพื่อน Discord ของคุณได้ยิน ไม่จำเป็นต้องมี kernel driver เมื่อซอฟต์แวร์จัดการการเส้นทางในระดับแอปพลิเคชัน ซึ่งหมายถึงปวดหัวจอภาพน้ำเงิน ของตัวแปลง

ฮิตการแก้ไขปัญหาอย่างรวดเร็ว

หากผลลัพธ์ปิด การแก้ไขปกติ ยาเหล่านี้อย่างใดอย่างหนึ่ง:

ฟังเหมือนกระรอก? pitch มากเกินไป หรือ pitch และ formant linked ลดระดับ pitch ยก formant แยก
สูง แต่ยังคงชาย? ไม่มี formant ผลักสูงกว่า pitch
บางและจมูก? Formant overshoot ดึงกลับและเพิ่ม low-mid เล็กน้อย
หุ่นยนต์หรือเชิงซ้อน? นั่นคือปัญหาการประมวลผลหรืออินพุต ไม่ใช่ปัญหาการตั้งค่า post แก้ไขปัญหา verset ผู้หญิง verset ดำเนินไป latency, sample-rate, และตัวแปลง driver
ขุ่นหรือเงียบ? ล้างอินพุตด้วยการระงับเสียงและ high-shelf EQ เล็กน้อย

FAQ

การตั้งค่าใดที่ทำให้เสียงหญิงสาวฟังดูเชื่อถือได้?

ยกระดับ pitch อย่างพอสมควร (ประมาณ 3 ถึง 5 semitone) ยักเสียง formant สูงกว่า pitch อย่างหนักแน่น จากนั้นเพิ่มการเพิ่ม EQ ช่วงสูงที่อ่อนโยน การเลื่อน formant ทำให้ส่วนใหญ่ของการรับรู้ Pitch เพียงอย่างเดียวฟังดูเหมือนกระรอก ดังนั้นให้คงไว้และให้ formant ถือ timbre

ทำไมเสียงของฉันฟังดูเหมือนกระรอกเมื่อฉันยกระดับ pitch?

เพราะการยกระดับ pitch เพียงอย่างเดียวจะยืดแรง formant ของคุณสูงขึ้นอย่างไม่เป็นธรรมชาติ ทำให้ท่อนเสียงที่รับรู้ได้หดตัวลงไปขนาดการ์ตูน เสียงหญิงสาวที่แท้จริงจะรักษาความสัมพันธ์ formant ที่เป็นธรรมชาติ แยกการควบคุมทั้งสอง: pitch ที่พอสมควร formant ที่ใหญ่กว่า และสิ่งประดิษฐ์กระรอกจะหายไปเกือบทันที

ฉันควรยกระดับ pitch เท่าใดเมื่อเทียบกับ formant สำหรับเสียงหญิงสาว?

จุดเริ่มต้นที่ดีคือการเพิ่ม pitch 3 ถึง 5 semitone และเพิ่ม formant 20 ถึง 40 เปอร์เซ็นต์ในแง่สัมพัทธ์ Formant ควรเคลื่อนไหวมากกว่า pitch ปรับเปลี่ยนในขั้นตอนเล็ก ๆ ในขณะที่พูด เพราะเสียงแต่ละเสียงตั้งอยู่ในช่วงเริ่มต้นที่แตกต่างกันและต้องการจำนวนที่แตกต่างกัน

เครื่องมือเปลี่ยนเสียงสามารถทำให้ฉันฟังดูเหมือนหญิงสาวแบบเรียลไทม์ได้หรือไม่?

ใช่ เครื่องมือเปลี่ยนเสียง DSP แบบเรียลไทม์จะเลื่อน pitch, formant และ resonance ด้วยความล่าช้าต่ำพอสำหรับการโทรแบบสด และการสตรีม ความสมจริงขึ้นอยู่กับการปรับแต่งอย่างเหมาะสมและการส่งออกของคุณ สำหรับเสียงหญิงสาวที่โคลนอย่างเต็มที่ เส้นทาง AI voice conversion สามารถผลักดันผลได้ไกลขึ้น

ฉันจำเป็นต้องฝึกฝนเสียงเพื่อให้ฟังดูเหมือนหญิงสาวหรือไม่?

ไม่ใช่เพื่อใช้เครื่องมือเปลี่ยนเสียง แต่เทคนิคเบา ๆ ช่วยได้มากมาย การวางตำแหน่ง resonance intonation ที่สว่างขึ้น และการโจมตีคำที่นุ่มนวลทำให้เอาต์พุตที่ประมวลผลแล้วน่าเชื่อถือมากขึ้น การฝึกฝนเสียงมีความสำคัญมากที่สุดสำหรับผู้ใช้ trans ที่ต้องการเสียงหญิงสาวที่สอดคล้องกันโดยไม่มีซอฟต์แวร์ใด ๆ ทำงานในพื้นหลัง

Formant คืออะไรและเหตุใดจึงมีความสำคัญสำหรับเสียงหญิงสาว?

Formant คือจุดสูงของความถี่ resonance ที่หล่อด้วยท่อเสียงของคุณซึ่งกำหนดสีสระและขนาดเสียงที่รับรู้ เสียงหญิงสาวมักจะนั่งอยู่ที่ระดับที่สูงกว่า การเลื่อน formant ขึ้นไปเป็นสิ่งที่จริง ๆ ขายเสียงหญิงสาว มากกว่า pitch ดิบซึ่งเพียงแค่เคลื่อนไหวความถี่พื้นฐานของเสียง

เครื่องมือเปลี่ยนเสียงหญิงสาวทำงานใน Discord และ OBS หรือไม่?

ใช่ ถ้าเครื่องมือเปิดเผยไมโครโฟนเสมือน คุณเลือกไมโครโฟนเสมือนนั้นเป็นอินพุตภายใน Discord, OBS หรือเกมใด ๆ และเสียงหญิงสาวที่ประมวลผลแล้วจะเส้นทางโดยอัตโนมัติ ไม่จำเป็นต้องมีไดรเวอร์พิเศษเมื่อซอฟต์แวร์จัดการการกำหนดเส้นทางในระดับแอปพลิเคชันสำหรับคุณ

สรุป

เสียง หญิงสาว ที่น่าเชื่อถือแบบเรียลไทม์ไม่ใช่โชคและไม่ได้เป็นเลื่อนเดียวเวทมนต์ มันเป็นสูตรเล็ก ๆ ที่ได้เรียนรู้: ยกระดับ pitch ตามสมควร ยกระดับ formant มากขึ้น ขัดสี ด้วยการแตะ EQ และการระงับเสียงสะอาด จากนั้นปล่อยให้ resonance ไปข้างหน้าเล็กน้อยและ intonation สว่างกว่าจึงถือว่าลวงตาที่เหลือทั้งหมด เริ่มต้นจากตาราง subtle / medium / character ปรับแต่งหูในขณะที่คุณพูดจริง ๆ และทดสอบผ่าน virtual mic ก่อนที่คุณจะไปแบบสด

หากคุณต้องการลอง ห่วงโซ่ทั้งหมด (pitch, formant, resonance, EQ, การระงับเสียง และ virtual mic) ในแอปพลิเคชันบน-device เดียว VoxBooster เป็นหนึ่งตัวเลือกที่สร้างขึ้นมาอย่างแน่นอนสำหรับการไหลงานนี้ โดยทำให้ทุกอย่างที่ประมวลผลในเครื่อง เพื่อให้เสียงของคุณไม่ยอมจำแนก PC ของคุณ มีการทดลอง สามวันแบบเต็ม ไม่มี บัตรเครดิต และคุณสามารถตรวจสอบ แผนและการกำหนด เมื่อคุณพร้อม

ดาวน์โหลด VoxBooster