คำแนะนำตัวเปลี่ยนเสียงการ์ตูน: ฟังเหมือนตัวละครแบบภาพเคลื่อนไหว

ตัวเปลี่ยนเสียงการ์ตูนให้สิ่งที่ไม่สามารถทำได้ด้วยตัวเลื่อนพิช - ภาพลวงตาเสียงที่สมบูรณ์ของตัวละครที่แตกต่างกันโดยสิ้นเชิงพูดผ่านไมโครโฟนของคุณแบบเรียลไทม์ หากคุณเคยใช้เวลาในเซิร์ฟเวอร์ Discord หรือ Twitch คุณเคยได้ยินใครบางคนสตริงทั้งเลขที่ประกอบกับความสูงเล็กน้อยหรือวายร้ายการ์ตูนดังก้อง และคุณอาจสงสัยว่าพวกเขาได้มาจากเสียงที่แท้จริงของพวกเขาถึง นั่น ได้อย่างไร คำแนะนำนี้อธิบายสี่ต้นแบบเสียงการ์ตูนหลัก สูตรพิช และ formant ที่แน่นอนสำหรับแต่ละสูตร วิธีการใช้เอฟเฟกต์เบาบนด้านบนโดยไม่ทำให้เสียหาย clarity วิธีบันทึกพรีเซ็ตและสลับด้วยคีย์ยอด และวิธีเดินสายทั้งหมดสำหรับการสตรีมหรือ Discord จากนั้นคุณจะมีระบบการทำงานสำหรับเสียงตัวละครการ์ตูนแบบเรียลไทม์ ไม่ใช่การตั้งค่าตามทฤษฎีเท่านั้น

TL;DR

เสียงการ์ตูนต้องการทั้งการเปลี่ยนพิช และ formant - formant คือสิ่งที่ทำให้พวกเขาฟังเหมือนสัตว์ต่างกัน ไม่ใช่เพียงการบันทึกที่เล่นด้วยความเร็วผิด
สี่ต้นแบบหลัก: ลักษณะเลขที่ประกอบกับตัวเล็กน้อย, วายร้ายดังก้อง, อักษร goofy comic ที่ไม่มีจมูก, และตัวละครมิตรสหาย - แต่ละอัตราส่วนที่มีสูตรการตั้งค่าของตัวเอง
เอฟเฟกต์ชั้นเบา (vibrato, การขับเคลื่อนเกินที่ลึกลับ, ประสานเสียงเบา) หลังจากขั้นตอนพิช/formant สำหรับความสมจริง; อย่าเรียงลำดับพวกเขา
บันทึกทุกต้นแบบเป็นพรีเซ็ตที่ตั้งชื่อและผูกมัดกับคีย์ยอดเพื่อให้คุณสามารถสลับตัวละครแบบสดบนสตรีม
VoxBooster จัดการทั้งหมดนี้ภายใต้การหน่วงเวลา 10ms โดยไม่จำเป็นต้องมีไดรเวอร์เคอร์เนล

อะไรที่ทำให้เสียงฟังเหมือน “การ์ตูน”?

ก่อนที่จะสัมผัสตัวเลื่อนเพียงตัวเดียว จะช่วยเข้าใจว่าเสียงการ์ตูนฟังเช่นไร ตัวละครแบบภาพเคลื่อนไหวมักจะถูกสั่งสมโดยนักแสดงเสียงที่ขยายคุณสมบัติเสียงสองอย่าง: พิช และขนาดช่องเสียง ตัวละครลักษณะเกizzard เล็กน้อยมีช่องเสียงเล็กน้อยและพูดด้วยพิชพื้นฐานสูง วายร้ายขนาดยักษ์มีช่องเสียงขนาดใหญ่หนาแน่นและพูดลดลง ตัวละครตลกขมวดจมูก มีรูปแบบเรโซแนนซ์ที่ผิดปกติซึ่งเน้นช่องทางจมูก ตัวละครนุ่มนวลอ่อนโยนมีแนวโน้มที่จะมีคุณภาพการหายใจที่ใกล้ชิดกับ formant สูงกว่าเสียงผู้ใหญ่ที่เป็นกลาง

แนวคิดหลักคือความแตกต่างระหว่าง pitch และ formant พิช คือ ความถี่พื้นฐาน - ความเร็วสั่นสะเทือนของเส้นเสียง formant คือ โครงสร้างเรโซแนนซ์ของช่องเสียง - ปาก, คอ, และโพรงจมูกทำหน้าที่เป็นชุดตัวกรองที่สร้างรสชาติเสียง เมื่อคุณเปลี่ยนพิชโดยไม่เปลี่ยน formant ผลลัพธ์จะฟังเหมือนผู้ที่เล่นบันทึกเร็วเกินไป เมื่อคุณเปลี่ยน formant พร้อมกับ pitch เสียงจะเริ่มฟังเหมือนผู้พูดที่แตกต่างกันทางกายภาพ - นั่นเป็นภาพลวงตาการ์ตูนอย่างแม่นยำ

ซอฟต์แวร์ตัวเปลี่ยนเสียงจัดการการเปลี่ยน formant ผ่านกระบวนการที่เรียกว่า pitch-synchronous overlap-add (PSOLA) หรือการประมวลผลตามสัญญาณเสียง ขึ้นอยู่กับเครื่องยนต์ อัลกอริทึมที่แน่นอนมีความสำคัญน้อยกว่ากว่าเครื่องมือให้คุณควบคุมพิช และ formant อย่างอิสระ หากเครื่องมือปัจจุบันของคุณมีเพียงตัวเลื่อน “character voice” เดียวคุณจะยังคงเดาได้

สี่ต้นแบบเสียงการ์ตูนหลัก

ภาพเคลื่อนไหวได้สร้างเสียงมากมายที่เป็นสัญลักษณ์ แต่เกือบทั้งหมดจะตกเป็นหนึ่งในสี่ต้นแบบเสียง เรียนรู้สี่นี้และคุณสามารถประมาณตัวละครการ์ตูนเกือบทุกตัวแบบเรียลไทม์ได้

ลักษณะเลขที่ประกอบกับตัวเล็กน้อย

คิด: สัตว์เสียงสูงขนาดเล็ก, เพื่อนสัตว์ประเภทของบท, ตัวละครโปรแกรมเด็กที่พลัง เสียงสว่าง, เรโซแนนซ์อย่างรวดเร็ว, และเร่งด่วน บนสเปกตรัมพิช, ตัวละครเหล่านี้นั่ง 6-12 semitone เหนือเสียงพูดของผู้ใหญ่ตามธรรมชาติ อีกวิธีที่สำคัญคือ formant เปลี่ยนแปลงขึ้นมาก - ช่องเสียงที่มองเห็นเล็กเหมือน rodent หรือนกตัวเล็ก

สูตรการตั้งค่า: Pitch +8 ถึง +10 semitone, formant +40 ถึง +50% เพิ่มการสั่นสะเทือนเบามาก (อัตรา 5 Hz, ความลึก 10-15%) เพื่อเลียนแบบความสั่นไหวตามธรรมชาติของเสียงสัตว์ตัวเล็ก เก็บอัตราขาด - เสียงขมวดจมูกตัดผ่านส่วนผสมอยู่แล้ว ที่เลือก: reverb ห้องสั้นมาก (pre-delay 5ms, decay 0.3s) เพิ่มคุณภาพ “กลวง” ที่ลึกลับขึ้นเล็กน้อย

วายร้ายดังก้อง

คิด: พจน์วายร้ายการ์ตูนที่มีเสียงโพรงกว้าง, ตัวละครสัตว์ขนาดใหญ่, บุคคลผู้มีอำนาจ เสียงกว้าง, เรโซแนนซ์ช้า, และ deliberate พิช นั่งลง 3-6 semitone ต่ำกว่ากลาง และ formant ลดลงอย่างมากเพื่อจำลองช่องเสียงที่ใหญ่ขึ้นอย่างมาก ผลลัพธ์จะฟังเหมือนปากตัวละครมีขนาดห้องเล็กน้อย

สูตรการตั้งค่า: Pitch -4 ถึง -6 semitone, formant -20 ถึง -30% เพิ่มการขับเคลื่อนเกินเบาหรือความอิ่มตัว (ให้ลึกลับ - 15-25% ไดรฟ์) เพื่อนำขอบ gritty ที่ขายพจน์วายร้ายการ์ตูนข้อมูล vibrato ช้า (3-4 Hz, ความลึก 10%) เพิ่มขนาด ความกว้างของสเตอริโอสามารถขยายเล็กน้อยเพื่อให้สามารถมีอยู่ได้ที่งดงามยิ่งขึ้นในหูฟัง เก็บ reverb ต่ำ - preset เพลตสั้นเพิ่มตัวกลางโดยไม่สูญเสียการโจมตีคำสั่ง

ตัวละคร goofy comic ที่ไม่มีจมูก

คิด: ลักษณะเลขที่ประกอบกับความรุนแรง, เจ้าของร้านค้าที่กระตือรือร้น, ตัวละครที่พูดเร็วเกินไป ต้นแบบนี้ยากที่จะปั้นด้วยตัวเลื่อนเพียงอย่างเดียวเพราะคุณภาพจมูกมาจากเรโซแนนซ์ที่ผิดปกติมากกว่าการเปลี่ยนพิช และ formant อย่างสม่ำเสมอ เสียงมักจะมีจุดศูนย์กลางพิชตรงกลาง แต่มีเรโซแนนซ์จมูกที่แข็งแกร่งและการส่งมอบอย่างรวดเร็ว choppy

สูตรการตั้งค่า: Pitch เป็นกลาง ถึง +2 semitone, formant +10 ถึง +20% โดยมีการเน้นเบาบนความถี่กลาง (boost EQ แคบรอบ 2-3 kHz เพิ่ม nasality) เพิ่มเอฟเฟกต์ประสานเสียงสั้น (อัตรา 0.8 Hz, ความลึก 20%, ปลายเปียก 30%) ซึ่งให้คุณภาพที่ลึกลับเล็กน้อย การประมวลผล ที่ตัวละครการ์ตูนจมูกขนยุ ตัวเปลี่ยนเสียงบางเครื่องมีพรีเซ็ต EQ “จมูก” หรือ “โทรศัพท์” ที่อุทิศเอง - ใช้นั่นเป็นฐานเริ่มต้น แล้วปรับพิช ด้านบน

ตัวละครมิตรสหาย

คิด: ตัวละครหลักที่อ่อนโยน, ตัวละครสนับสนุนที่ดี, ปีศาจ, สัตว์ที่พูดอย่างอ่อนโยน ต้นแบบนี้ชอบความอบอุ่นมากกว่าความสว่าง พิช เพิ่มขึ้นเล็กน้อย (2-4 semitone), formant เปลี่ยนแปลงปานกลาง (ขึ้น +15 ถึง +25%), แต่ความแตกต่างหลักจากลักษณะเลขที่ประกอบกับตัวเล็กน้อยคือการหายใจและความนุ่มนวล เสียงควรรู้สึกใกล้ชิดและอบอุ่น ไม่คม

สูตรการตั้งค่า: Pitch +2 ถึง +4 semitone, formant +15 ถึง +25% เพิ่มคัตความถี่สูงที่ลึกลับเหนือ 8 kHz เพื่อทำให้ขอบนุ่ม reverb ทำงานได้ดีที่นี่ - preset hall เล็ก ๆ (decay 0.8-1.0s, wet 20%) เพิ่มคุณภาพที่ฝันอย่างเบาบางเล็กน้อยที่ตัวละครเหล่านี้มี เก็บ อัตราขาด ต่ำและช่วงไดนามิกกว้าง; ความสำคัญของตัวละครมาจากความแตกต่างระหว่างช่วงเวลาที่นุ่มนวล และเสียงดังขึ้นเล็กน้อย

ตารางเปรียบเทียบ: Cartoon Voice Archetype ในแวบสว่าง

ต้นแบบ	Pitch Shift	Formant Shift	เลเยอร์เอฟเฟกต์	ดีสำหรับ
ลักษณะเลขที่ประกอบกับตัวเล็กน้อย	+8 ถึง +10 semitone	+40 ถึง +50%	Vibrato เบา, reverb ห้องสั้น	สัตว์ตัวเล็ก, ลักษณะเลขที่ประกอบกับการตลก, ตัวละครโปรแกรมเด็ก
วายร้ายดังก้อง	-4 ถึง -6 semitone	-20 ถึง -30%	การขับเคลื่อนเกินเบา, vibrato ช้า	พจน์วายร้าย, สัตว์ขนาดใหญ่, ตัวเลขผู้มีอำนาจ
ตัวละคร goofy comic ที่ไม่มีจมูก	0 ถึง +2 semitone	+10 ถึง +20%	EQ mid-boost, ประสานเสียงสั้น	ลักษณะเลขที่ประกอบกับความรุนแรง, ตัวละครที่พูดเร็ว
ตัวละครมิตรสหาย	+2 ถึง +4 semitone	+15 ถึง +25%	High-cut EQ, reverb hall เล็ก	ตัวละครหลักที่อ่อนโยน, ปีศาจ, บทบาทการสนับสนุนที่ดี

วิธีที่ AI Voice Cloning เข้ากัน

สี่ต้นแบบข้างต้นทำงานผ่าน DSP: การประมวลผลสัญญาณบริสุทธิ์โดยไม่มีการเรียนรู้ของเครื่องที่เกี่ยวข้อง สำหรับกรณีการใช้การ์ตูนส่วนใหญ่ - การสตรีม, Discord, บทบาท - ระดับการประมวลผลนั้นเพียงพอและทำงานบน Windows ขั้นปัจจุบันโดยมี CPU overhead ที่ไม่มีอยู่จริง

การแปลงเสียงประสาท AI ใช้วิธีต่างกัน แทนที่จะใช้ตัวกรองกับเสียงของคุณ มันผ่านการพูดของคุณผ่านโมเดลที่สร้างมันใหม่ในเฉดสีของเสียงเป้าหมายที่ฝึกแล้ว โมเดลจับปก formant โครงสร้าง, เรโซแนนซ์, breathiness, และรูปแบบการออกเสียงเล็ก ๆ ที่ตัวกรอง DSP ไม่สามารถทำซ้ำได้ สำหรับสไตล์ตัวละครการ์ตูนเฉพาะที่คุณต้องการฟังเหมือนประเภทตัวละครเฉพาะมากกว่า “การ์ตูน” การโคลนนิ่ง AI สร้างผลที่โดดเด่นกว่า

VoxBooster รวมทั้งสองเส้นทาง: เครื่องยนต์ DSP สำหรับเอฟเฟกต์การหน่วงเวลาต่ำทันที และชั้นการแปลงเสียง AI สำหรับเมื่อคุณต้องการเสียงตัวละครเฉพาะเจาะจง ความแตกต่างของการหน่วงเวลาสำคัญสำหรับการใช้งานสด - เอฟเฟกต์ DSP ทำงานภายใต้ 10ms ในขณะที่การแปลง AI เพิ่มหน้าต่างการประมวลผลเล็ก ๆ สำหรับการสตรีมที่คุณไม่พึ่งพาข้อมูลป้อนกลับทันที, ทั้งสองเส้นทางทำงานได้ดี สำหรับการเล่นเกมที่คุณต้องการแชทเสียงรู้สึกตามธรรมชาติและการสนทนา, พรีเซ็ต DSP คือตัวเลือกที่ถูกต้อง

รายละเอียดเพิ่มเติมเกี่ยวกับเทคโนโลยีพื้นฐานอยู่ในเพื่อน เทียบ bukan pitch-shift voice changer, ซึ่งครอบคลุมเมื่อแต่ละวิธีสมเหตุสมผลมากขึ้น

การตั้งค่าเสียงการ์ตูนของคุณใน VoxBooster

นี่คือจากขั้นตอนที่ใช้ได้จริงสำหรับการได้รับเสียงการ์ตูนที่ทำงาน end-to-end บน Windows

ขั้นตอนที่ 1: ติดตั้ง และ เปิด VoxBooster

ดาวน์โหลด VoxBooster จาก voxbooster.com/download และ เรียกใช้ตัวติดตั้ง การทดลอง 3 วันให้คุณมีการเข้าถึงทั้งหมดไปยังคุณลักษณะทั้งหมด รวมถึงการแปลงเสียง AI และเอฟเฟกต์ DSP ทั้งหมด ไม่ต้องติดตั้งไดรเวอร์ - VoxBooster ใช้ low-latency audio capture และจดทะเบียนไมโครโฟนเสมือน Windows มาตรฐานโดยอัตโนมัติระหว่างการตั้งค่า

ขั้นตอนที่ 2: เลือกไมโครโฟนทางกายภาพของคุณ

ในส่วนอินพุตของ VoxBooster เลือกไมโครโฟนที่แท้จริงของคุณ - ไมโครโฟน USB, ไมโครโฟนหูฟัง, หรือสิ่งใดก็ตามที่คุณพูด นี่คือสัญญาณแหล่งของคุณ เอาต์พุตที่ประมวลผลจะมาจากอุปกรณ์ VoxBooster Virtual Microphone ซึ่งเป็นสิ่งที่คุณจะตั้งค่าใน Discord, OBS, หรือเกมของคุณ

ขั้นตอนที่ 3: ปรับแต่งต้นแบบแรกของคุณ

เลือกหนึ่งในสี่ต้นแบบจากตารางข้างต้นและป้อนการตั้งค่านั้น เริ่มต้นด้วยพิช ก่อน ยืนยันว่าพิชใจปะโปะ จากนั้นเพิ่ม formant จากนั้นเพิ่มชั้นเอฟเฟกต์หนึ่ง (vibrato, การขับเคลื่อนเกิน, reverb, หรือประสานเสียง - ไม่ใช่ทั้งหมดพร้อมกัน) ทดสอบด้วยการพูดด้วยความเร็วปกติลงในไมโครโฟนและฟังเอาต์พุตการตรวจสอบ ปรับจนกว่าคุณ จะพอใจกับตัวละคร

ขั้นตอนที่ 4: บันทึกเป็นพรีเซ็ตที่ตั้งชื่อ

เมื่อคุณมีเสียงที่คุณชอบ ให้บันทึกเป็นพรีเซ็ตที่ตั้งชื่อ ให้ชื่อที่อธิบาย - “squeaky sidekick,” “booming villain,” เป็นต้น - เพื่อให้คุณสามารถค้นหาได้อย่างรวดเร็วระหว่างเซสชันสด สร้างหนังสือเก็บพรีเซ็ตของคุณโดยหนึ่งต้นแบบในครั้งเดียว คุณไม่จำเป็นต้องมีทั้งสี่ก่อนเปิดสด; สองพรีเซ็ตพอสำหรับสตรีมส่วนใหญ่

ขั้นตอนที่ 5: กำหนดคีย์ยอด

ในการตั้งค่าคีย์ยอดของ VoxBooster กำหนดพรีเซ็ตแต่ละรายไปยังทางลัดคีย์บอร์ด เลือกการรวมคีย์ที่ไม่ขัดแย้งกับการควบคุมเกมหรือคีย์ยอด OBS ของคุณ F9/F10/F11/F12 ทำงานได้ดีสำหรับการตั้งค่าส่วนใหญ่ ฝึกการสลับเสียงด้วยคีย์ยอดสองสามครั้งก่อนเปิดสด - การเปลี่ยนทันที แต่ความจำกล้ามเนื้อของการผูกมัดใช้เวลาสองสามนาที

ขั้นตอนที่ 6: เส้นทางไปยัง Discord, OBS, หรือเกมของคุณ

ใน Discord: การตั้งค่า → ส่วน & วิดีโอ → อุปกรณ์อินพุต → เลือก “VoxBooster Virtual Microphone” ใน OBS: การตั้งค่า → เสียง → ไมโครโฟน/Auxiliary Input → เลือก “VoxBooster Virtual Microphone” ในเกมของคุณ: ค้นหาแชทเสียงหรือการตั้งค่าอินพุตเสียง push-to-talk และเลือกไมโครโฟนเสมือนเดียวกัน คุณสามารถเส้นทางไปยังทั้งสามพร้อมกัน - เสียงที่ประมวลผลเดียวกันป้อนแต่ละแอปพลิเคชันพร้อมกัน

เลเยอร์เอฟเฟกต์โดยไม่สูญเสีย Clarity

หนึ่งในความผิดพลาดที่พบบ่อยที่สุดกับการตั้งค่าเสียงการ์ตูนคือการเรียงลำดับเอฟเฟกต์มากเกินไปพร้อมกัน เอฟเฟกต์แต่ละรายที่คุณเพิ่มจะลด clarity ตามจำนวนที่วัดได้ เป้าหมายคือฟังชัดเจนเหมือนตัวละคร ไม่เหมือนความราะหว่างที่บิดเบือน นี่คือกฎของหัวแม่มือ:

เลเยอร์เอฟเฟกต์หนึ่งครั้ง เริ่มต้นด้วยพิช และ formant, รับสิ่งที่ถูกต้องแล้วจากนั้นเพิ่มหนึ่งเอฟเฟกต์เพิ่มเติม ทดสอบการทำความเข้าใจด้วยการเพิ่มเดียว หากคุณยังคงสามารถฟังตัวเองได้อย่างชัดเจน คุณสามารถเลือกเพิ่มเพื่อ - แต่นั่นโดยทั่วไปมากที่สุดก่อนที่คุณภาพจะลดลง

Reverb คือเหน้าที่เพิ่ม ไม่ใช่ฐาน reverb ห้องหรือแผ่น (decay ต่ำกว่า 1.0 วินาที, wet mix 15-25%) เพิ่มมิติให้เสียงตัวละคร การตั้งค่า reverb ยาว (decay 2+ วินาที) ล้างพยัญชนะและทำให้เสียงยากต่อการเข้าใจ โดยเฉพาะอย่างยิ่งในเสียงเกมที่ดังเสียง

Vibrato rate ควรตรงกับพลังงานของตัวละคร ตัวละครพลังงานสูง (ลักษณะเลขที่ประกอบกับตัวเล็กน้อย, comic relief ที่กระตือรือร้น) พอดีกับ vibrato อย่างรวดเร็ว (5-6 Hz) ตัวละครพลังงานต่ำ (วายร้าย, ตัวละครมิตรสหาย) พอดี vibrato ช้า (3-4 Hz) หรือไม่มีเลย ความลึก vibrato เหนือ 20% เริ่มฟังเหมือนเจ็บป่วย

Overdrive ควรเพิ่มเนื้อแนว ไม่ใช่ระดับเสียง เอฟเฟกต์บิดเบือน อัตราส่วนเพิ่มที่รับรู้ได้ หากคุณเพิ่มการขับเคลื่อนเกินให้กับเสียงวายร้าย ให้ลดอัตราขาดของคุณลงเล็กน้อยหลังจากนั้นดังนั้นระดับเอาต์พุตจึงคงอยู่ในแนวเดียวกับพรีเซ็ตอื่น ๆ ของคุณ ระดับเสียงที่ไม่สม่ำเสมอในพรีเซ็ตจะต้องให้ผู้ชมปรับเสียงของพวกเขาทุกครั้งที่คุณเปลี่ยนตัวละคร ซึ่งจะทำลายสิ่งที่แช่อยู่ในความลึก

Formant Shifting คืออะไร และเหตุใดจึงมีความสำคัญ?

Formant shifting เป็นกระบวนการโยกย้ายยอด ความถี่เรโซแนนซ์ของช่องเสียงอย่างอิสระจากพิชพื้นฐาน สระ มนุษย์ถูกกำหนดโดยโครงสร้าง formant ของพวกเขา formant แรก (F1) และ formant ที่สอง (F2) เป็นตัวกำหนดหลักของการรับรู้จำนวนสระและขนาดช่องเสียง เมื่อคุณเปลี่ยน formant ขึ้น เสียงจะฟังเหมือนมาจากช่องเสียงที่เล็กกว่า ตึงกว่า เมื่อคุณเปลี่ยน formant ลง ฟังเหมือนใหญ่กว่าและเรโซแนนซ์มากขึ้น

เหตุผลที่ formant shifting สำคัญสำหรับเสียงการ์ตูนโดยเฉพาะคือตัวละครแบบภาพเคลื่อนไหวมักจะออกแบบเสียงเหมือนเวอร์ชันขยายสัตว์หรือมนุษย์จริง เม้าส์การ์ตูนเล็ก ๆ ไม่ได้เพียงพูดด้วยพิชสูง - ฟังเหมือนสัตว์ที่กายวิภาคเรโซแนนซ์ทั้งหมดของมันเล็ก โดยไม่มีการเปลี่ยน formant คุณสามารถเพิ่มพิชได้มากเท่าที่คุณต้องการและคุณจะยังคงฟังเหมือนมนุษย์ เพียงแค่พูดเร็วขึ้น ด้วยการเปลี่ยน formant ที่จัดแนวกับทิศทางพิช ภาพลวงตาตัวละครกลายเป็นน่าเชื่อถือเพราะคำใบ้เสียงทั้งหมดชี้ไปในทิศทางเดียวกัน

นี่คือความแตกต่างทางเทคนิคที่สำคัญที่สุดระหว่างเครื่องมือตัวเปลี่ยนเสียงการ์ตูนที่แท้จริง และตัวเลื่อนพิชที่เรียบง่ายในซอฟต์แวร์แก้ไขเสียง หากคุณต้องการเพิ่มความลึกในกลศาสตร์เสียง บทความ Wikipedia เกี่ยวกับ formant อธิบายโมเดลเรโซแนนซ์อย่างชัดเจน

ตัวเปลี่ยนเสียงการ์ตูนสำหรับการสตรีมและการสร้างเนื้อหา

สำหรับผู้สตรีม หนังสือเก็บพรีเซ็ตเสียงการ์ตูนเป็นหนึ่งในสินทรัพย์ที่นำกลับมาใช้ใหม่ได้มากที่สุดที่คุณสามารถสร้างได้ ชุดเสียงตัวละครที่กำหนดไว้อย่างดี - แม้แต่สองหรือสามเท่านั้น - ให้คุณเรียกใช้เซ็กเมนต์ที่เกิดซ้ำ นำตัวละครที่รู้จักกลับมาผ่านสตรีมหลาย และสร้างชั้นบันเทิงเฉพาะสำหรับช่อง

เรียกใช้บิตตัวละครสด

การตั้งค่าปฏิบัติ: เชื่อมโยงพรีเซ็ตวายร้ายของคุณกับ F9 และตัวละครลักษณะเลขที่ประกอบกับตัวเล็กน้อยของคุณ ถึง F10 เมื่อคุณต้องการทำบิตตัวละคร ปิดเสียง OBS เพื่อให้ผู้ชมได้ยินเสียงเท่านั้น (ไม่ใช่การสลับใบหน้าของคุณ), เปิดใช้งานคีย์ยอดจากนั้นปิดเสียง และพูดตามตัวละคร โครงสร้างที่เรียบง่ายนี้ทำงานได้เชื่อถือได้แม้กับการตั้งค่าการสตรีมพื้นฐาน

สำหรับเนื้อหาที่ยาวขึ้น คุณสามารถกำหนดพรีเซ็ตต่างกันสำหรับบทบาทในเกมที่แตกต่างกัน - เสียงผู้บรรยายสำหรับคำอธิบาย, เสียงตัวละครสำหรับเซ็กเมนต์บทบาท - และเปลี่ยนอย่างสะอาดระหว่างการเปลี่ยนแปลง การสลับคีย์ยอดใน VoxBooster ทันที และไม่แนะนำช่องว่างเสียงหรือป๊อป

บันทึก vs. Real-Time

สำหรับเนื้อหา pre-recorded (วิดีโอ YouTube, คลิปฟอร์มสั้น) คุณมีตัวเลือกในการบันทึกด้วยเสียงที่ประมวลผล ตรงไป OBS หรือ DAW ของคุณ หรือบันทึก dry และใช้การประมวลผลในโพสต์ การบันทึกโดยตรงนั้นง่ายกว่าและการหน่วงเวลาไม่ใช่ปัจจัย ดังนั้นผู้สร้างเนื้อหาส่วนใหญ่จึงใช้วิธีตรง เอาต์พุตนั้นเป็นเสียงขั้นสุดท้ายแล้ว ไม่จำเป็นต้องมีขั้นตอนการผสมเพิ่มเติม

สำหรับพอดแคสต์หรือการสนทนาบันทึกที่ผู้เข้าร่วมหลายคนอาจมีเสียงตัวละครต่างกัน ผู้เข้าร่วมแต่ละคนเรียกใช้อินสแตนซ์ของตัวเปลี่ยนเสียงของตัวเองบนเครื่องที่เกี่ยวข้อง และเข้าร่วมการโทรด้วยเอาต์พุตที่ประมวลผลแล้วเปิดใช้งาน

ตัดและไฮไลต์

คลิปเสียงการ์ตูนทำงานได้ดีบนแพลตฟอร์มฟอร์มสั้นเพราะเสียงจะมีความแตกต่างทันที เสียงวายร้ายให้ความเห็นเกี่ยวกับช่วงเวลาเล่นเกม หรือลักษณะเลขที่ประกอบกับตัวเล็กน้อยตอบสนองต่อการเล่นที่ไม่ดี มีแนวโน้มที่จะมีคุณภาพที่น่าจำได้ที่การตอบสนองเสียงธรรมชาติไม่มี หากคุณกำลังสร้างแคตตาล็อกคลิป ให้พิจารณากันเวลา 5-10 นาทีต่อเซสชันเพื่อบันทึกบิตตัวละครสั้น ๆ - แม้กระทั่งเนื้อหาที่ไม่ทำให้บันทึก stream หลัก สามารถอยู่ในแบบฟอร์มสั้น

ปัญหาทั่วไป และ วิธีแก้ไข

เสียงฟังเหมือนหุ่นยนต์มากกว่าการ์ตูน นี่โดยปกติหมายถึง formant สูงเกินไปเมื่อเทียบกับพิช ลองลดแผนการของ 10-15% ในขณะที่ให้พิชเหมือนกัน ความสัมพันธ์ระหว่างพิช และ formant ในเสียงธรรมชาติประมาณเชิงเส้น - พิชสูงมากกับแผนการสูงมากเป็นแบบจำลองจริงสำหรับสัตว์เล็ก ๆ แต่หากคุณอยู่ในช่วงปานกลาง การตั้งค่า formant สุดขีดจะแนะนำสิ่งประดิษฐ์

เสียงฟังเหมือนการบันทึกที่เร่งขึ้นมากกว่าตัวละคร พิชได้ถูกเปลี่ยนโดยไม่มีแผนการ เพิ่มแผนการในทิศทางบวกหากคุณเปลี่ยนพิชขึ้น หรือลดลงหากคุณเปลี่ยนพิชลง แม้กระทั่งการเปลี่ยนแผนการที่ปรารถนาขั้นต่ำ +15% พร้อมกับเสียงที่ขึ้นพิช จะให้ตัวละครมากขึ้นทันที

เสียงหรือ glitch เมื่อพูดเร็ว นี่มักเป็นปัญหาการหน่วงเวลาหรือขนาดบัฟเฟอร์ ในการตั้งค่าเสียง VoxBooster ลองเพิ่มขนาดบัฟเฟอร์เล็กน้อย (จาก 128 ถึง 256 ตัวอย่าง) สำหรับการแปลง AI โดยเฉพาะ ความอดทนของบัฟเฟอร์สูงขึ้นเล็กน้อยช่วยปรับปรุงความเสถียรระหว่างการพูดอย่างรวดเร็ว สำหรับเอฟเฟกต์ DSP ที่ latency sub-10ms ปัญหา Glitching นั้นหาได้ยากและโดยทั่วไปบ่งชี้ว่ากระบวนการพื้นหลังนั้นแทรกแซงเธรดเสียง

เอฟเฟกต์ฟังดีในการตรวจสอบ แต่น่ากลัวใน Discord หรือ OBS ตรวจสอบว่าคุณได้เลือก VoxBooster Virtual Microphone เป็นอินพุตใน Discord/OBS ไม่ใช่ไมโครโฟนทางกายภาพของคุณ ความผิดพลาดทั่วไปคือการเลือก mic ทางกายภาพในแอปพลิเคชัน (ซึ่งข้ามการประมวลผลทั้งหมด) ในขณะที่ได้ยินเอาต์พุตที่ประมวลผลในการตรวจสอบ VoxBooster ของตัวเอง

ระดับเสียง กระโดดเมื่อเปลี่ยนพรีเซ็ต ปกติ ระดับเอาต์พุตในแต่ละพรีเซ็ต VoxBooster มีอัตราขาดเอาต์พุตต่อ-พรีเซ็ต; ตั้งค่าพรีเซ็ตทั้งหมดไปยังระดับเสียงที่รับรู้ได้ประมาณเดียวกันก่อนเปิดสด ใช้คลิปอ้างอิง - นับ “หนึ่งสองสาม” ในแต่ละเสียงตัวละคร และปรับจนกว่าเสียงจะตรงกัน

เทคนิคที่เกี่ยวข้องสมควรสำรวจ

เสียงการ์ตูนเป็นแอปพลิเคชันเดียวของเครื่องมือการแปลงเสียงชุดที่กว้างขึ้น หากคุณต้องการไปเพิ่มเติม วิธีการที่เกี่ยวข้องเหล่านี้ก็น่าสำรวจ:

เอฟเฟกต์เสียงชิพมันก์ เป็นเวอร์ชันเฉพาะของต้นแบบลักษณะเลขที่ประกอบกับตัวเล็กน้อยที่ถูกผลักไปที่สุด - คลาสสิก Alvin-style เอฟเฟกต์ที่มีพิช และแผนการสูงมาก บทความนั้นครอบคลุมการตั้งค่าที่แน่นอนสำหรับการสร้างเสียงเฉพาะนั้น

ตัวเปลี่ยนเสียงพิชสูง เทคนิคครอบคลุมช่วงเต็มของเสียงตัวละครพิชสูง รวมถึงเหตุผลเสียงสำหรับเสียงสูงบางเสียงฟังเหมือนธรรมชาติและคนอื่น ๆ ฟังเหมือนเทียม

อธิบายการเปลี่ยน Formant ลงลึกในกลศาสตร์ทางเทคนิคของการมัดมัดแผนการ - มีประโยชน์หากคุณต้องการเข้าใจว่าเหตุใดการตั้งค่าจึงทำงาน แทนที่จะเพียงคัดลอกสูตร

ตัวเปลี่ยนเสียง Low-latency ครอบคลุมด้านเทคนิคของการประมวลผลเสียงแบบเรียลไทม์ - ขนาดบัฟเฟอร์, low-latency audio capture vs. ASIO, และวิธีรับประสิทธิภาพเสียงที่สอดคล้องที่สุดบน Windows

คำถามที่พบบ่อย

ตัวเปลี่ยนเสียงการ์ตูนคืออะไร?

ตัวเปลี่ยนเสียงการ์ตูนคือซอฟต์แวร์ที่ประมวลผลไมโครโฟนสดของคุณและใช้การเปลี่ยนพิช การปรับ formant และเอฟเฟกต์มอดูเลชั่นเพื่อให้คุณฟังเหมือนตัวละครแบบภาพเคลื่อนไหวแบบเรียลไทม์ เครื่องมือที่ดีที่สุดปรับพิช และ formant โดยอิสระเพื่อให้ผลฟังเหมือนตัวละคร ไม่ใช่เพียงแค่เวอร์ชันเร่งตัวหรือลดชะลอตัวของเสียงของคุณเอง

ฉันจะทำให้เสียงของฉันฟังเหมือนตัวละครการ์ตูนได้อย่างไร?

ติดตั้งตัวเปลี่ยนเสียงที่มีการควบคุมพิช และ formant อิสระ สำหรับลักษณะเลขที่ประกอบกับความสูงเพิ่มพิช 8-10 semitone และเปลี่ยน formant ขึ้น 40-50% สำหรับการรับการร้ายแรง ลดพิช 4-6 semitone และลดแผนการ 20-30% เพิ่มการสั่นสะเทือนเบาหรือการขับเคลื่อนเกินที่ลึกลับเพื่อทำให้ภาพลวงตาเสร็จสมบูรณ์ เส้นทางไมโครโฟนเสมือนไป Discord หรือ OBS

ความแตกต่างระหว่างการเปลี่ยนพิช และการเปลี่ยน formant สำหรับเสียงการ์ตูนคืออะไร?

การเปลี่ยนพิช ย้ายความถี่พื้นฐานของเสียงของคุณ สูง หรือต่ำ ฟัง formant shifting ย้ายยอดเขาเรโซแนนซ์ของช่องเสียงของคุณ คุณภาพกลวงที่ให้ตัวละครเสียงและขนาด เสียงการ์ตูนต้องการทั้งคู่: พิช ตั้งค่าบันทึก formant กำหนดว่ามันฟังเหมือนสัตว์ตัวเล็กหรือยักษ์ พิชคนเดียว เพียง ฟังเหมือนการบันทึก ไป อัตราเร็ว

ฉันสามารถใช้ตัวเปลี่ยนเสียงการ์ตูนบน Discord โดยไม่มีซอฟต์แวร์เพิ่มเติมได้หรือไม่?

ใช่ ถ้าตัวเปลี่ยนเสียงของคุณสร้างอุปกรณ์เสียงเสมือน เครื่องมือเช่น VoxBooster ลงทะเบียนไมโครโฟนเสมือน Windows มาตรฐาน คุณเลือกอุปกรณ์นั้นในการตั้งค่า Discord ภายใต้ Voice and Video และเพื่อนของคุณได้ยินเอฟเฟกต์การ์ตูนแบบสดโดยไม่มีซอฟต์แวร์เราเตอร์เสียง หรือเก็บเกาะเก่บสัญญาณเสมือนเพิ่มเติม

การตั้งค่าใดที่สร้างเสียงวายร้ายการ์ตูนที่ดี?

เริ่มด้วยพิชลดลง 4-6 semitone และ formant ลดลง 20-30% เพื่อขยายช่องเสียงที่ชัดเจน เพิ่มเอฟเฟกต์การขับเคลื่อนเกินเบาหรือการบิดเบือนเพื่อนำเสริมที่ gritty ที่พบในพจน์วายร้ายการ์ตูน เก็บ reverb ละเอียดอ่อน - การตั้งค่าห้องสั้นหนึ่งห้องเพิ่มการมีอยู่โดยไม่ล้างเสียง ใช้ vibrato ช้า 3-4 Hz ที่ความลึก 10-15% สำหรับการโต้ตอบ

ตัวเปลี่ยนเสียงการ์ตูนใช้งานได้ในเกมและ OBS พร้อมกันหรือไม่?

ใช่ ไมโครโฟนเสมือนเส้นทางเสียงตลอดระบบบน Windows ตั้งค่าเป็นอินพุตใน OBS และในแชทเสียงเกมของคุณพร้อมกัน ทั้งคู่จับสัญญาณที่ประมวลผลเดียวกัน Hotkey switching ใน VoxBooster ช่วยให้คุณสามารถพลิกระหว่างพรีเซ็ตตัวละครกลางเซสชันโดยไม่ต้องสัมผัสแอปพลิเคชันอื่น

ตัวเปลี่ยนเสียงการ์ตูนปลอดภัยในเกมที่มีการต่อต้านการโกง?

ซอฟต์แวร์ที่ใช้ไมโครโฟนเสมือนผ่านระบบย่อยเสียง Windows มาตรฐานโดยไม่มีไดรเวอร์เคอร์เนล ปลอดภัยกับระบบการต่อต้านการโกงเช่น EAC และ BattlEye VoxBooster ใช้ low-latency audio capture และลงทะเบียนอุปกรณ์เสียงมาตรฐาน ดังนั้นจึงปรากฏต่อระบบปฏิบัติการและเกมเหมือนไมโครโฟนที่ชอบด้วยกฎหมายอื่น ๆ

บทสรุป

การสร้างเสียงการ์ตูนที่แท้จริงต้องคิดถึงสองมิติ: พิช สำหรับว่ามันสูงหรือต่ำเท่าใด และแผนการ สำหรับว่าช่องเสียงที่มองเห็นได้นั้นใหญ่หรือเล็กเท่าใด รับพารามิเตอร์สองตัวนั้นให้เข้ากันสำหรับแต่ละต้นแบบ - ลักษณะเลขที่ประกอบกับตัวเล็กน้อย, วายร้ายดังก้อง, ตัวละคร goofy muzzled, บทบาทเมจัง - และเพิ่มชั้นเอฟเฟกต์ที่เลือกอย่างระมัดระวังหนึ่ง และคุณจะมีเสียงที่อยู่ได้หลายชั่วโมงของการสตรีมแบบสดหรือการเล่นเกมโดยไม่ทำให้ผู้ชมของคุณเหนื่อยหลาย

ความแตกต่างระหว่างเสียงตัวละครที่น่าเชื่อถือและ “คนที่มีตัวกรอง” โดยปกติคือแผนการ คนส่วนใหญ่ข้ามการเปลี่ยนแผนการเพราะเครื่องมือของพวกเขาไม่ได้เปิดเผยมัน หรือเพราะพวกเขาไม่รู้ว่ามันมีอยู่ ตอนนี้คุณทำ การตั้งค่าขึ้นมาเรียบร้อย

VoxBooster จัดการการใช้โซ่ทั้งหมด - พิช DSP และ formant, การแปลงเสียง AI ประสาท สำหรับสไตล์ตัวละครเฉพาะเจาะจง, ปกติ ระดับเอาต์พุต-พรีเซ็ต, และ hotkey switching - บน Windows ฮาร์ดแวร์มาตรฐานโดยไม่มี ไดรเวอร์เคอร์เนลการติดตั้ง การทดลอง 3 วันเป็นวิธีที่เร็วที่สุดเพื่อทดสอบว่าการตั้งค่าของคุณฟังเหมือนที่คุณต้องการก่อนสัญญาว่า ขึ้นมาเพื่อไปไหนสักแห่ง

ดาวน์โหลด VoxBooster และเริ่มต้นด้วยพรีเซ็ตลักษณะเลขที่ประกอบกับตัวเล็กน้อย - มันเร็วที่สุดสำหรับการรับสิทธิ์ และ เกณฑ์มาตรฐานที่ดีสำหรับการปรับเทียบส่วนที่เหลือของหนังสือเก็บของคุณ