เอฟเฟกต์เสียงกรรไกร: ฟังเหมือน Alvin & Chipmunks

เรียนรู้วิธีการทำงานของเอฟเฟกต์เสียงกรรไกรแบบเรียลไทม์ — การเปลี่ยนพิทช์ การขยายแรมแนนท์ และทำไมเทคนิคการเพิ่มความเร็วแบบหลังจากจบจึงล้มเหลวในการแชทเสียงสด

เอฟเฟกต์เสียงกรรไกรเป็นหนึ่งในเกมเสียง gags ที่เป็นที่รู้จักมากที่สุดในวัฒนธรรมป็อบ — เสียงจิกเสียง สดใส สำหรับการ์ตูนที่อ่านทันทีว่าเป็น “ตัวละครแอนิเมชั่นเล็กน้อย” การทำให้มันถูกต้องแบบเรียลไทม์ ในการเรียกเสียงโดยตรงหรือสตรีม ต้องการมากกว่าแค่ปรับตัวเลื่อนพิทช์ คำแนะนำนี้อธิบายกลไกที่แท้จริงเบื้องหลังเอฟเฟกต์ ว่าทำไมวิธีการไร้เดียงสาจึงล้มเหลว และวิธีการตั้งค่าตัวเปลี่ยนเสียง Alvin และ Chipmunks ที่น่าเชื่อถือในแอปพลิเคชัน Windows ใด ๆ”


TL;DR

  • เอฟเฟกต์กรรไกรต้องการพารามิเตอร์สองตัว: การเปลี่ยนพิทช์ (+8-12 semitones) และการเปลี่ยนแรมแนนท์ (+35-50%) — ไม่มีตัวใดเพียงอย่างเดียวก็พอ
  • เทคนิคการเพิ่มความเร็วแบบไร้เดียงสา (เล่นการบันทึกเร็วขึ้น) ไม่สามารถทำงานในแชทเสียงแบบเรียลไทม์ได้ การเปลี่ยนพิทช์ที่ถูกต้องพร้อมการควบคุมแรมแนนท์คือวิธีการที่ถูกต้อง
  • การขยายแรมแนนท์ — จงใจผลักความถี่เรโซแนนต์ให้สูงขึ้น — คือสิ่งที่ทำให้เสียงฟังเหมือนสิ่งมีชีวิตเล็ก ๆ มากกว่าผู้ใหญ่ที่ถูกประมวลผล
  • VoxBooster จัดการทั้งสองพารามิเตอร์อิสระแบบเรียลไทม์บน Windows พร้อมเวลาแฝงเอฟเฟกต์ต่ำกว่า 10ms ไม่มีไดรเวอร์เคอร์เนล ปลอดภัยต่อการต่อต้านโกง
  • ตัวละครสามตัว Chipmunks มีโปรไฟล์เสียงที่แตกต่างกันซึ่งคุณสามารถประมาณได้โดยการปรับอัตราส่วน formant-to-pitch
  • ทำงานใน Discord OBS แชทเสียงเกม Windows ใด ๆ หรือซอฟต์แวร์บันทึกใด ๆ

เอฟเฟกต์เสียงกรรไกรคืออะไร

เอฟเฟกต์เสียงกรรไกรคือการแปลงเสียงที่ทำให้เสียงของผู้พูดฟังเหมือนมันอยู่ในตัวแต่งเต็มจำนวนเล็ก ๆ — จิกเสียงแบบการ์ตูน สดใส และจิกเสียง ชื่อนี้มาจากส่วนที่สามประตูแบบสัมพันธ์ Alvin Simon และ Theodore ซึ่งเสียงที่กำหนดเสียงเมื่อพวกเขาเปิดตัวในการบันทึก novelty 1958 ของ Ross Bagdasarian Sr.

วิธีการผลิตดั้งเดิมนั้นกล: Bagdasarian บันทึกในความเร็วปกติและเล่นเทปกลับไปอย่างเร็วขึ้น การเพิ่มความเร็วการบันทึกจะเพิ่มพิทช์ บีบอัดระยะเวลาคำ และสร้างจังหวะการพูดที่รวดเร็ว bouncy ที่เป็นลายเซ็นของ Chipmunks วิธีการนี้เรียกว่าการบันทึก varispeed และไม่ถูกมองว่าเป็นเวทีมนตร์เสียงในเวลานั้น — มันคือเล่นเพลงเทปมาตรฐาน สิ่งที่ทำให้มันแตกต่างคือการขยายเอฟเฟกต์ที่มีจงใจและการแสดงตัวละครที่อยู่ใต้นั้น”

ซอฟต์แวร์เปลี่ยนเสียงกรรไกรแบบเรียลไทม์สมัยใหม่ไม่สามารถเพิ่มความเร็วของบทพูดของคุณในการเรียกสด — การบีบอัดเวลาคำของคุณในขณะที่คุณพูดจะทำให้คุณฟังเหมือนกำลังเล่นการบันทึกของคนที่พูดเร็ว ไม่ใช่เหมือนคุณพูดเร็ว การเปลี่ยนเสียงกรรไกรแบบเรียลไทม์ทำงานต่างกัน: พวกมันเพิ่มพิทช์ของเสียงของคุณโดยไม่เปลี่ยนความเร็วในการพูด และพวกมันเปลี่ยนลักษณะเรโซแนนต์ของเสียงเพื่อให้ตรงกับแหล่งเสียงที่เล็กกว่า ทำได้ถูกต้อง ผลลัพธ์ก็คล้ายกับเอฟเฟกต์ Chipmunks แม้จะไม่มีการจับเวลาแบบเร่งรัด”

ทำไมเทคนิคการเพิ่มความเร็วดั้งเดิมล้มเหลวแบบเรียลไทม์

การเล่นกลับจะเพิ่มความเร็วในการทำงานหลังเพราะคุณมีการบันทึกเต็มเพื่อบีบอัด หากคุณบันทึกคนพูด “hello” ที่ 60 beats ต่อนาทีและเล่นกลับที่ 120 BPM คำว่า “hello” จะถูกบีบอัดให้เหลือครึ่งเวลาและยกขึ้นหนึ่งอ็คเทฟ สิ่งประดิษฐ์คือเสียงเต่มน้ำตา สดใส ที่พูดอย่างรวดเร็วและไม่มีช่องว่างเวลาที่กังวล”

แชทเสียงแบบเรียลไทม์ล้มเหลวโดยทันที วิธีการนี้ทันที ในการบีบอัดบทพูดของคุณ ซอฟต์แวร์จะต้องบัฟเฟอร์เสียงของคุณ ตรวจหาขอบเขตคำ บีบอัดเวลา แล้วส่งผลลัพธ์ — การแนะนำความล่าช้าตัวบัฟเฟอร์ในลำดับของประโยคทั้งหมดก่อนที่ผู้ฟังจะได้ยินอะไร ซึ่งทำให้การสนทนาเป็นไปไม่ได้”

แทนที่จะเป็นการประมวลผลแบบเรียลไทม์จะใช้การเปลี่ยนพิทช์: เพิ่มความถี่ของตัวอย่างเสียงของคุณตัวอย่างต่อตัวอย่างโดยไม่เปลี่ยนระยะเวลาการเล่น คุณพูดที่ความเร็วปกติของคุณ ผู้ฟังของคุณได้ยินเสียงของคุณที่พิทช์สูงกว่า และความล่าช้าวัดเป็นมิลลิวินาที่ไม่ใช่วินาที นี่คือวิธีการที่ถูกต้องสำหรับการใช้ว่าง แต่มันสร้างปัญหาที่แตกต่างกัน: การเปลี่ยนพิทช์เพียงอย่างเดียวยังฟังเหมือนเสียงผู้ใหญ่ที่ความถี่ที่สูงกว่ามากกว่าเสียงสิ่งมีชีวิตเล็กอย่างแท้จริง นี่คือจุดที่การควบคุมแรมแนนท์กลายเป็นสิ่งจำเป็น”

แรมแนนท์คืออะไรและทำไมมันจึงสำคัญ

เสียงของคุณมีส่วนประกอบเสียงแยกสองตัวที่ผู้ฟังรับรู้พร้อมกัน ประการแรกคือความถี่พื้นฐานของคุณ — พิทช์ที่คุณหา หรือพูด กำหนดโดยความเร็วที่เชือกเสียงของคุณสั่น ประการที่สองคือโครงสร้างแรมแนนท์ — ชุดของยอดเรโซแนนต์ในสเปกตรัมความถี่ที่มีรูปร่างจากเรขาคณิตท่อลมของคุณ: ความยาวจอก ขนาดของโพรงปาก ตำแหน่งลิ้นและริมฝีปาก และรูปร่างของช่องจมูก”

แรมแนนท์คือสิ่งที่ทำให้สระเสียงฟังเหมือนสระเสียงเฉพาะนั้นแทนที่จะเป็นสระเสียงอื่น /a/ ใน “father” มีแรมแนนท์ที่แตกต่างจาก /i/ ใน “feet” แม้ว่าจะร้องที่พิทช์เดียวกันก็ตาม และสิ่งสำคัญ คุณแรมแนนท์คือสิ่งที่ช่วยให้สมองของคุณแยกแยะระหว่างเสียงเล็กและเสียงใหญ่ที่พิทช์เดียวกัน เด็กพูดที่ 300Hz และผู้ใหญ่พูดที่ 300Hz ไม่ฟังเหมือนกัน — แรมแนนท์ของเด็กนั้นสูงกว่าเพราะท่อลมของพวกเขามีขนาดสั้นกว่าทางกายภาพ”

เอฟเฟกต์กรรไกรเลียนแบบท่อลมเล็ก ๆ ไม่ใช่เพียงตัวสูง การเปลี่ยนเพียงความถี่พื้นฐาน (พิทช์) ขณะปล่อยให้แรมแนนท์ไม่เปลี่ยนสร้างความไม่ตรงกันที่สมองรับรู้ทันที: พิทช์พูดว่า “เล็ก” แต่เรโซแนนซ์พูดว่า “ผู้ใหญ่” ผลลัพธ์ฟังเหมือนเสียงที่ถูกประมวลผลมากกว่าตัวละคร นี่คือเหตุผลที่เครื่องเปลี่ยนพิทช์ราคาถูกส่วนใหญ่ล้มเหลวในการสร้างเอฟเฟกต์กรรไกรที่น่าเชื่อถือ”

การรักษาแรมแนนท์กับการขยายแรมแนนท์

ความแตกต่างนี้คุ้มค่าต่อการทำความเข้าใจอย่างชัดเจนเพราะมันเปลี่ยนวิธีที่คุณกำหนดค่าเอฟเฟกต์”

การรักษาแรมแนนท์ ใช้เมื่อคุณต้องการให้นักร้องเปลี่ยนพิทช์โดยไม่เปลี่ยนอักษรของเสียง ซอฟต์แวร์การจับคู่เสียงแบบมืออาชีพจะเปลี่ยนพิทช์ของแทร็คสองเท่าในขณะที่รักษาแรมแนนท์ดั้งเดิม — การจับคู่ฟังเหมือนคนเดียวกัน เพียงแค่ในโน้ตที่แตกต่างกัน สำหรับการร้องแบบป้องกันกีตาร์หรือการแก้ไขพิทช์ การรักษาแรมแนนท์จะรักษาเสียงให้ธรรมชาติ บางตัวประมวลผลทำแบบอัตโนมัติ ซึ่งเป็นสิ่งดีสำหรับการแก้ไขพิทช์ แต่มีผลเสียต่อเอฟเฟกต์กรรไกร”

การขยายแรมแนนท์ ตั้งใจผลักแรมแนนท์ให้สูงกว่าตำแหน่งธรรมชาติ นี่คือสิ่งที่จำลองท่อลมที่เล็กกว่าในทางกายภาพ หากความถี่พื้นฐานและแรมแนนท์ของคุณทั้งคู่เคลื่อนไปด้านบนพร้อมกันในอัตราส่วนที่ถูกต้อง เสียงของคุณจะไปที่ลายเซ็นเสียงของห้องเรโซแนนซ์ที่เล็กกว่า — ลักษณะที่กำหนดตัวละครกรรไกร นี่คือโหมดที่คุณต้องการสำหรับเอฟเฟกต์กรรไกร”

ประการจริง: หากตัวเปลี่ยนเสียงของคุณใช้การเปลี่ยนพิทช์และโดยอัตโนมัติรักษาแรมแนนท์ (ทั่วไปในเครื่องมือแก้ไขพิทช์ที่ใช้ AI) คุณจะไม่ได้เสียงกรรไกร คุณต้องการเครื่องมือที่มีการควบคุมการเปลี่ยนแรมแนนท์อิสระที่คุณสามารถตั้งใจผลักขึ้นได้”

สามตัว Chipmunks — และวิธีการที่เสียงของพวกเขาแตกต่าง

ส่วนหนึ่งของเหตุผลที่บันทึกดั้งเดิมทำงานได้ดีคือแต่ละตัวละครมีโปรไฟล์เสียงที่แตกต่างกันเล็กน้อยแม้ว่าทั้งสามตัวจะผลิตโดยเล่นเพลงเดียวกันที่ใช้กับนักร้องคนเดียวกัน ในแง่เรียลไทม์ คุณสามารถประมาณสิ่งนี้ได้โดยการปรับอัตราส่วนระหว่างการเปลี่ยนพิทช์และแรมแนนท์”

Alvin เป็นที่สูงที่สุดและฟังดูเป็นเสียงแห่งเพ้ห์มากที่สุดของทั้งสามตัวละคร — ตัวละครสร้างปัญหา เสียงของเขานั่นอยู่ที่ยอดสุดของระดับกรรไกร ในแง่เรียลไทม์: พิทช์รอบ +11 semitones แรมแนนท์รอบ +45-50% ตำแหน่งแรมแนนท์สดใสและก้าวร้าวให้เสียงของเขาคุณภาพสัง่เรียกความสนใจ”

Simon ต่ำกว่าเล็กน้อยและฟังดูชัดเจนกว่า — ตัวละครปัญญา เสียงของเขายังคงเป็นกรรไกรที่ชัดเจน แต่น้อยกว่า เทียบเท่าเรียลไทม์: พิทช์รอบ +9 semitones แรมแนนท์รอบ +38-42% แรมแนนท์ที่ต่ำกว่าเล็กน้อยให้พื้นที่วอเคิลบิตมากขึ้นและทำให้บทพูดเข้าใจได้มากขึ้นสำหรับประโยคที่ยาวกว่า”

Theodore มีเสียงกลม ที่นุ่มนวล — ตัวละครที่อ่อนโยน เสียงของเขาฟังเหมือน chunky มากขึ้นและน้อยกว่า shrieky เทียบเท่าเรียลไทม์: พิทช์รอบ +8 semitones แรมแนนท์รอบ +35% การตั้งค่านี้อ่านเป็นคล้ายกรรไกร แต่ยังคงความอบอุ่นและสัน้อยกว่า”

นี่คือการประมาณ — การบันทึกดั้งเดิมเกี่ยวข้องกับนักร้องคนเฉพาะ (Bagdasarian ตัวเอง) ที่มีลักษณะเสียงเฉพาะ และการประมวลผลแบบเรียลไทม์จากเสียงของคุณจะสร้างผลลัพธ์ที่แตกต่างกันตามธรรมชาติ แต่การปรับอัตราส่วนพิทช์-ต่อ-แรมแนนท์เป็นเลเวอร์ที่ถูกต้องเพื่อให้ใกล้เคียงกับรสชาติของแต่ละตัวละคร”

Naive Speed-Up กับการเปลี่ยนพิทช์ที่เหมาะสม: การเปรียบเทียบทางเทคนิค

วิธีการการเปลี่ยนพิทช์Tempo บทพูดเอฟเฟกต์แรมแนนท์สามารถเรียลไทม์คุณภาพตัวละคร
Varispeed เทป (ดั้งเดิม)ตามสัดส่วนความเร็วเร็วกว่าทั้งพิทช์และแรมแนนท์เปลี่ยนพร้อมกันไม่สูง (แต่เวลาเร่งรัด)
ความเร็วง่าย ๆ ในซอฟต์แวร์ตามสัดส่วนความเร็วเร็วกว่าทั้งคู่เปลี่ยนพร้อมกันไม่ (แนะนำความล่าช้า)ดี offline ไม่สามารถใช้ว่าง
เพียงการเปลี่ยนพิทช์ (naif)ปรับได้อิสระไม่เปลี่ยนแรมแนนท์คงอยู่ที่ตำแหน่งธรรมชาติใช่ไม่ดี — ฟังเหมือนได้รับการประมวลผล
การเปลี่ยนพิทช์ + การรักษาแรมแนนท์พิทช์เปลี่ยน แรมแนนท์รักษาไม่เปลี่ยนแรมแนนท์ถูกจำกัดไว้ที่ตำแหน่งแหล่งที่มาใช่การเปลี่ยนพิทช์ธรรมชาติ ไม่มีตัวละคร
การเปลี่ยนพิทช์ + การขยายแรมแนนท์พิทช์เปลี่ยน แรมแนนท์ผลักขึ้นไม่เปลี่ยนแรมแนนท์เปลี่ยนขึ้นอิสระใช่ตัวละครกรรไกรที่น่าเชื่อถือ

แถวล่างสุดคือสิ่งที่เครื่องมือเอฟเฟกต์เสียง VoxBooster นำไปใช้ การจับภาพเสียงตาม low-latency audio capture การเปลี่ยนพิทช์ผ่านการประมวลผล phase vocoder และการเปลี่ยนตำแหน่งแรมแนนท์อิสระ — ทั้งหมดทำงานใน 10ms สำหรับเครื่องมือเอฟเฟกต์ ต่ำพอสำหรับการสนทนาเรียลไทม์โดยไม่มีความล่าช้า”

วิธีการตั้งค่าเอฟเฟกต์เสียงกรรไกรใน VoxBooster

การทำให้เอฟเฟกต์ทำงานใช้เวลาน้อยกว่าห้านาทีในเครื่อง Windows 10 หรือ Windows 11 ใด ๆ”

ขั้นตอน 1 — ติดตั้ง VoxBooster ดาวน์โหลดจาก /download และเรียกใช้ตัวติดตั้ง การตั้งค่าเริ่มต้นทำงานสำหรับระบบส่วนใหญ่ ไม่จำเป็นต้องใช้ซอฟต์แวร์สายเคเบิลเสียงเสมือนเพิ่มเติมหรือการติดตั้งไดรเวอร์เคอร์เนล”

ขั้นตอน 2 — เปิดแผง Voice Effects นี่คือจุดที่ตัวควบคุมพิทช์และแรมแนนท์พร้อมใช้งานเป็นตัวเลื่อนอิสระ”

ขั้นตอน 3 — ตั้งจุดเริ่มต้น สำหรับเอฟเฟกต์เสียงกรรไกรทั่วไป ให้ตั้ง Pitch Shift เป็น +9 semitones และ Formant Shift เป็น +42% นี่คือ Simon-character เทียบเท่า — เสียงกรรไกรที่รู้จักได้ บทพูดที่เข้าใจได้”

ขั้นตอน 4 — พูดและฟัง ใช้หูฟังแทนลำโพง พูดวลีที่อุดมด้วยเสียงเช่น “I can hear it now.” ฟังว่าแรมแนนท์ฟังเหมือนแน่นและสดใสหรือว่าพิทช์สูง แต่เสียงยังคงฟังเหมือนมนุษย์ขนาดเต็ม หากหลัง เพิ่มแรมแนนท์เป็น +45%”

ขั้นตอน 5 — ปรับให้เหมาะสำหรับตัวละครของคุณ ย้ายพิทช์ขึ้นเป็น +11 และแรมแนนท์ไปยัง +48% สำหรับ Alvin วางทั้งคู่ไป +8 semitones และ +35% สำหรับ Theodore การปรับแต่ง 1-2 semitone ขนาดเล็กในพิทช์หรือ 5% ในแรมแนนท์สร้างความแตกต่างได้ยิน”

ขั้นตอน 6 — เส้นทางไปยังแอปพลิเคชัน ใน Discord ไปที่ Settings > Voice & Video และเลือก VoxBooster เป็นอุปกรณ์อินพุต ใน OBS หรือ Streamlabs เลือก VoxBooster เป็นแหล่งเสียงไมโครโฟนของคุณ ในเกม Windows ใด ๆ ที่มีแชทเสียง เลือก VoxBooster เป็นอินพุตไมโครโฟนในการตั้งค่าเสียงของเกม”

ขั้นตอน 7 — ตั้งค่า Hotkey กำหนดชุดคีย์ในการตั้งค่า hotkey VoxBooster เพื่อเปิด/ปิดเอฟเฟกต์กรรไกร สิ่งนี้ช่วยให้คุณสามารถเปลี่ยนระหว่างเสียงปกติและเสียงกรรไกรตรงกลางการสนทนาโดยไม่ต้องเปิดอินเตอร์เฟซ”

ขั้นตอน 8 — ทดสอบก่อนออนไลร์ ใช้การทดสอบไมค์ Discord มิเตอร์เสียง OBS หรือการบันทึกอย่างรวดเร็วเพื่อยืนยันว่าเสียงที่ประมวลผลกำลังส่งไปยังตัวละครกรรไกรที่คาดไว้อย่างถูกต้องก่อนที่คุณจะเข้าร่วมการโทรเป็นกลุ่มหรือเริ่มสตรีม”

ความปลอดภัยของ Anti-Cheat และไดรเวอร์เคอร์เนล

ข้อกังวลเชิงปฏิบัติสำหรับนักเกมที่ใช้เอฟเฟกต์เสียง: เครื่องมือตัวเปลี่ยนเสียงบางตัวต้องการการติดตั้งไดรเวอร์ระดับเคอร์เนลเพื่อสร้างอุปกรณ์เสียงเสมือนของพวกมัน ไดรเวอร์เคอร์เนลทำงานในระดับสิทธิพิเศษสูงสุดของระบบปฏิบัติการ และซอฟต์แวร์ anti-cheat ในเกมที่มีการแข่งขัน — EAC (Easy Anti-Cheat) BattlEye Riot Vanguard — ตรวจสอบกิจกรรมเคอร์เนลเพื่อการสูญเสียที่อาจเกิดขึ้น ไดรเวอร์เสียงระดับเคอร์เนล แม้ว่าจะสุดโต่งไร้ที่ติ ก็สามารถเรียกใจเหล็ก false positive หรือสร้างปัญหาความเข้ากันได้”

VoxBooster ประมวลผลเสียงทั้งหมดผ่าน low-latency audio capture (Windows Audio Session API) ซึ่งเป็นอินเตอร์เฟซเสียงมาตรฐานพื้นที่ผู้ใช้ มันไม่ติดตั้งไดรเวอร์เคอร์เนลใด ๆ ไมโครโฟนเสมือนที่มันลงทะเบียนคือ Windows Audio มาตรฐาน — กลไกเดียวกับที่ใช้โดย Teams Zoom และซอฟต์แวร์การสื่อสารอื่น ๆ สิ่งนี้ทำให้มันเข้ากันได้กับสภาแวดล้อม anti-cheat ในเกมเช่น Valorant Apex Legends Fortnite และ CS2 โดยไม่ต้องการการกำหนดค่าเพิ่มเติม”

หากคุณเปรียบเทียบตัวเลือกและเครื่องมือต้องการการติดตั้งไดรเวอร์ในขั้นตอนการตั้งค่า นั่นคุ้มค่าที่จะสังเกตก่อนที่คุณจะติดตั้งในสภาแวดล้อมเกมที่มีการแข่งขัน คำแนะนำ Discord voice changer ครอบคลุมจุดนี้ในรายละเอียดเพิ่มเติมสำหรับการตั้งค่าเกม Discord ที่เฉพาะเจาะจง”

เอฟเฟกต์เสียงกรรไกรสำหรับการสตรีมมิ่งและการสร้างเนื้อหา

Streamers ใช้เสียงกรรไกรในหลายรูปแบบที่เกิดซ้ำ:

ส่วน Challenge “หากฉันตาย ฉันจะเปลี่ยนเป็นเสียงกรรไกรสำหรับเกมที่เหลือ” คือรูปแบบที่สร้างการเข้าร่วมของผู้ชมที่แท้จริง การประมวลผลเวลาแฝงต่ำหมายความว่าเอฟเฟกต์เสียงซิงค์กับความเห็นปฏิเสธเกมของคุณ — ไม่มีความล่าช้าที่พังจังหวะตลก”

Intros ตัวละคร streamers บางคนรักษาบุคลิกภาพ “chipmunk mode” ที่ปรากฏในส่วนหรือเกมเฉพาะ ด้วย toggle hotkey เปลี่ยนอิน-อินและออกจากการ keypress เดียว”

บิต Reaction อ่าน chat ในเสียงกรรไกร ตอบสนองต่อคลิปในเสียงกรรไกร หรือเปลี่ยนเป็นเสียงกรรไกรในช่วงเวลาตลก — ทั้งหมดนี้ทำให้เอฟเฟกต์ได้แล้วเปิด/ปิดทันทีแทนที่จะต้องเปลี่ยนการตั้งค่า”

สำหรับ YouTube Shorts และ TikTok ขั้นตอนการทำงานจะแตกต่างเล็กน้อย: คุณสามารถบันทึกโดยตรงด้วยเอฟเฟกต์กรรไกรที่ใช้งานอยู่ใน OBS หรือซอฟต์แวร์บันทึกใด ๆ จากนั้นแก้ไขคลิป สิ่งนี้จะลบขั้นตอนการประมวลผลภายหลัง — ไม่จำเป็นต้องเรียกใช้เสียงผ่านตัวประมวลผลพิทช์หลังจากนั้น”

เอฟเฟกต์นี้ ghosts ได้ดีกับเสียงตัวละครอื่น ๆ เปลี่ยนจากกรรไกรไปยัง radio voice effect ตรงกลาง-วิดีโอ หรือซ้อนเอฟเฟกต์กรรไกรบนเอฟเฟกต์เสียงต่างมณฑลสร้างช่วงเวลาตัวละครแบบชั้นวางที่ทำงานสำหรับเนื้อหาสกี”

วิธีการระงับเสียงรบกวนอินเตอร์แอกต์กับการประมวลผล Pitch

รายละเอียดหนึ่งที่ส่งผลกระทบต่อคุณภาพเอาต์พุต: ลำดับที่ขั้นตอนการประมวลผลเสียงทำงานนั้นสำคัญจริง ๆ”

หากการระงับเสียงรบกวนทำงานหลังจากการประมวลผล pitch และ formant มันทำงานในสัญญาณเปลี่ยนความถี่และอาจจำแนกผิด ๆ บางส่วนของเนื้อหาความถี่เปลี่ยนเป็นเสียงรบกวน (โดยเฉพาะในช่วงที่สูงกว่าซึ่งนั่งของเอฟเฟกต์กรรไกร) สิ่งนี้สามารถทำให้เครื่องกำจัดเสียงรบกวนอ่อนผลต่อส่วนของเสียงกรรไกร ลดความชัดเจนของเอฟเฟกต์”

VoxBooster ทำให้การระงับเสียงรบกวนเป็นกำหนดการในกระบวนการ — ก่อนการจัดการพิทช์และแรมแนนท์ สิ่งนี้หมายความว่าตัวกำจัดทำงานบนสัญญาณอินพุตที่สะอาดและเป็นธรรมชาติ ลบเสียงรบกวนพื้นหลังจริง และจากนั้นส่งสัญญาณที่สะอาดไปยังตัวประมวลผล pitch และแรมแนนท์ ผลลัพธ์เป็นเสียงกรรไกรที่มีตัวละครทั้งหมดของมันไว้ได้อย่างสมบูรณ์แทนที่จะเป็นสัญญาณความถี่สูงที่อ่อนแอบางส่วน”

หากคุณใช้ชุดค่าผสมของเครื่องมือที่แตกต่างกัน (ตัวกำจัดเสียงรบกวนแยกและตัวเปลี่ยนพิทช์แยก) ให้เรียกใช้ตัวกำจัดเสียงรบกวนก่อนในห่วงโซ่สัญญาณ Workstations เสียงดิจิทัลส่วนใหญ่และการตั้งค่าเสียงกำหนดเส้นทางอนุญาตให้คุณระบุลำดับการประมวลผลซึ่งเป็นการตั้งค่าเพื่อตรวจสอบ”

AI Voice Cloning เรียลไทม์กับเอฟเฟกต์กรรไกรตามพิทช์

แนวทางทางเลือกเพื่อให้เสียงตัวละครคือการจำลองเสียง AI — ใช้แบบจำลองการแปลงเสียง neural เพื่อแปลงเสียงของคุณเป็นเสียงตัวละครเป้าหมายทั้งหมด สิ่งนี้สามารถสร้างผลลัพธ์ที่สมจริงมากสำหรับเป้าหมายเสียงของมนุษย์ แต่มันทำงานแตกต่างจากเอฟเฟกต์กรรไกรตามพิทช์”

การจำลองเสียง AI เรียนรู้ลักษณะเสียงของเสียงเป้าหมายจากตัวอย่างเสียงและนำไปใช้กับอินพุตของคุณแบบเรียลไทม์ VoxBooster รวมฟีเจอร์การจำลองเสียง AI (การแปลงเสียง neural) สำหรับผู้ใช้ที่ต้องการยอมรับ identities เสียงเฉพาะ สำหรับเสียงกรรไกรรูปแบบการ์ตูน อย่างไรก็ตาม การเปลี่ยนพิทช์และแรมแนนท์โดยทั่วไปเป็นวิธีการปฏิบัติมากขึ้น: คุณสามารถปรับตัวละครเฉพาะแบบเรียลไทม์ เปลี่ยนระหว่างโปรไฟล์ตัวละครทันที และเอฟเฟกต์นั้นมีบ้านอพลิเคชันอย่างสม่ำเสมอโดยไม่คำนึงถึงสิ่งที่คุณพูด”

การแปลงเสียง neural ทำงานได้ดีที่สุดสำหรับเสียงที่มีข้อมูลการฝึกอบรมที่มีอยู่ — เสียงของบุคคลที่ระบุไว้ที่บันทึกไว้ ตัวละคร Chipmunks มีโปรไฟล์เสียงที่เป็นที่รู้จัก แต่การจำลองความแม่นยำผ่านการจำลองเสียง AI จะต้องมีตัวอย่างจากการแสดงดั้งเดิม วิธีการพิทช์-และ-แรมแนนท์อนุญาตให้คุณเข้าใกล้ตัวละครผ่านการปรับแต่งพารามิเตอร์แทนการรวบรวมข้อมูล”

Troubleshooting ปัญหาเสียงกรรไกรทั่วไป

เสียงฟังเหมือนหุ่นยนต์หรือโลหะ สิ่งนี้มักหมายถึงการเปลี่ยนพิทช์นั้นตั้งสูงเกินไป (ส่วนบน +12 semitones) หรือมีสิ่งประดิษฐ์ phase vocoder จากการประมวลผล ลดพิทช์ลง 1-2 semitones และดูว่าคุณภาพโลหะนั้นลดลงหรือไม่ หากมันยังคงอยู่ ตรวจสอบว่าคุณภาพอินพุตไมโครโฟนเพียงพอ — USB microphones บางตัวที่อัตราตัวอย่าง 8kHz สร้างสิ่งประดิษฐ์ที่ค่าเปลี่ยนพิทช์สูง”

เสียงฟังดูสูง แต่ไม่จิก การเปลี่ยนแรมแนนท์นั้นน่าจะเป็นศูนย์หรือต่ำมากแน่นอน เพิ่มแรมแนนท์เป็น +35% และฟังสำหรับการเปลี่ยนแปลงตัวละครเสียง คุณภาพจิกมาจากแรมแนนท์ ไม่ใช่พิทช์”

เสียงนั้นยากที่จะเข้าใจที่พิทช์นี้ คุณอาจผลักพิทช์และแรมแนนท์สูงเกินไป ลดพิทช์ลงไป +8 และแรมแนนท์เป็น +35% ซึ่งให้โปรไฟล์ตัวละคร Theodore — กรรไกรที่เป็นที่รู้จักแต่มีพูดชัดเจนยิ่งขึ้น”

มีเสียงสะท้อนหรือ Umpire ที่ได้ยิน คุณกำลังตรวจสอบเอาต์พุตผ่านลำโพงแทนหูฟัง เสียงกรรไกรข่าวไปยังไมโครโฟนของคุณ สลับไปหูฟังสำหรับการตรวจสอบ”

เอฟเฟกต์ทำงานในหูฟังของฉัน แต่ไม่ใช่ใน Discord Discord ยังไม่เปลี่ยนเป็น VoxBooster เป็นอุปกรณ์อินพุต ไปที่ Discord Settings > Voice & Video > Input Device และเลือก VoxBooster จาก dropdown”

คำถามที่พบบ่อย

ตัวเปลี่ยนเสียงกรรไกรคืออะไรและมันทำงานอย่างไร

ตัวเปลี่ยนเสียงกรรไกรเพิ่มพิทช์ของเสียงของคุณและเปลี่ยนแรมแนนท์ขึ้นเพื่อจำลองท่อลมที่เล็กมากๆ การเปลี่ยนพิทช์อย่างเดียว (โดยไม่มีการปรับแรมแนนท์) ฟังดูผิด — ต้องใช้พารามิเตอร์ทั้งสองพร้อมกันเพื่อสร้างเสียงจิกเสียงตัวละครแอนิเมชั่นที่เกี่ยวข้องกับ Alvin และ Chipmunks”

การตั้งค่าใดที่สร้างเอฟเฟกต์ตัวเปลี่ยนเสียง Alvin และ Chipmunks แบบคลาสสิกที่ดีที่สุด

สำหรับเสียง Alvin แบบคลาสสิก ให้ตั้งพิทช์เป็น +9-11 semitones และแรมแนนท์เป็น +40-50% สิ่งนี้จะสร้างความรู้สึกของท่อลมเล็ก ๆ โดยไม่ทำให้บทพูดเข้าใจไม่ได้ Alvin (เสียงสูงกว่า) นั่งใกล้ +11 semitones ขณะที่ Theodore (เสียงกลม) นั่งใกล้ +8 พร้อมแรมแนนท์ต่ำกว่าเล็กน้อย”

ทำไมการเปลี่ยนพิทช์เพียงอย่างเดียวจึงไม่ฟังเหมือนกรรไกร

เพราะเอฟเฟกต์กรรไกรไม่ได้เกี่ยวกับความถี่เพียงอย่างเดียว — มันเกี่ยวกับขนาดของท่อลม แรมแนนท์คือความถี่เรโซแนนต์ที่เกิดจากจอก ปาก และช่องจมูกของคุณ ไม่มีการเปลี่ยนแรมแนนท์ เสียงพิทช์สูงยังคงมีเรโซแนนซ์ของท่อลมในตัวผู้ใหญ่ และสมองอ่านความไม่ตรงกันทันทีเป็นเสียงที่ถูกประมวลผล ไม่ใช่ตัวละคร”

ความแตกต่างระหว่างการรักษาแรมแนนท์และการขยายแรมแนนท์ในเอฟเฟกต์กรรไกรคืออะไร

การรักษาแรมแนนท์จะรักษาแรมแนนท์ในตำแหน่งธรรมชาติเมื่อคุณเปลี่ยนพิทช์ — ใช้เพื่อให้ผู้พูดยังคงฟังเหมือนพวกเขาในพิทช์ที่แตกต่างกัน การขยายแรมแนนท์จะเจตนาผลักแรมแนนท์ให้สูงขึ้นเพื่อจำลองท่อลมที่เล็กกว่า ซึ่งเป็นสิ่งที่สร้างตัวละครกรรไกร เอฟเฟกต์กรรไกรต้องการการขยาย ไม่ใช่การรักษา”

มันปลอดภัยไหมที่จะใช้เอฟเฟกต์เสียงกรรไกรในเกมต่อต้านโกงเช่น Valorant หรือ Fortnite

ขึ้นอยู่กับวิธีที่เครื่องมือกำหนดเส้นทางเสียง VoxBooster ใช้ low-latency audio capture และไม่ฉีดไดรเวอร์เคอร์เนล ทำให้มันปลอดภัยต่อการต่อต้านโกง เครื่องมือที่ติดตั้งไดรเวอร์เสียงเสมือนระดับเคอร์เนลสามารถถูกทำเครื่องหมายโดยซอฟต์แวร์ต่อต้านโกงแม้ว่าไม่ได้ทำอะไรที่น่าสงสัย ดังนั้นการตรวจสอบสถาปัตยกรรมไดรเวอร์ก่อนใช้ในเกมที่มีการแข่งขันจึงมีความสำคัญ”

ฉันสามารถใช้เอฟเฟกต์เสียงกรรไกรใน Discord โดยไม่มีสายเคเบิลเสียงเสมือนได้หรือไม่

ใช่ ด้วย VoxBooster บน Windows มันลงทะเบียนไมโครโฟนเสมือนที่ Windows และ Discord มองว่าเป็นอุปกรณ์อินพุตมาตรฐาน — ไม่จำเป็นต้องมีสายเคเบิลเสียงเสมือนของบุคคลที่สาม เลือก VoxBooster เป็นไมโครโฟนของคุณใน Discord Settings > Voice & Video และเสียงกรรไกรที่ประมวลผลของคุณจะเสมหมายทันที”

เอฟเฟกต์เสียงกรรไกรเรียกว่าอะไรในแง่เทคนิคเสียง

เอฟเฟกต์รวมการเปลี่ยนพิทช์ (เพิ่มความถี่พื้นฐาน) ด้วยการเปลี่ยนแรมแนนท์ที่เป็นบวก (เพิ่มความถี่เรโซแนนต์ของท่อลมอิสระจากพิทช์) บางตัวประมวลผลเรียกว่าการปรับขนาดท่อลมหรือการเปลี่ยนตำแหน่งแรมแนนท์ สิ่งรวมนี้คือสิ่งที่วิศวกรเสียงใช้เพื่อสร้างสิ่งมีชีวิตเล็กหรือเสียงแอนิเมชั่นที่น่าเชื่อถือ”

บทสรุป

เอฟเฟกต์เสียงกรรไกรย่อมมาเมื่อสองสิ่งเกิดขึ้นพร้อมกัน: พิทช์ขึ้นและแรมแนนท์ขึ้นกับมัน หาใจของหนึ่งในสองอย่างนั้น และคุณได้เสียงที่ประมวลผลฟังผิด ในลักษณะที่ผู้ฟังสามารถรู้สึกแม้ว่าพวกเขาไม่สามารถตั้งชื่อได้ เล็บทั้งสอง และผลลัพธ์คือตัวละครเรียลไทม์ที่น่าเชื่อถือและใช้งานได้ซึ่งทำงานในการเรียกสด สตรีม และเซ็ชั่นเกมโดยไม่ต้อง มีเทคนิคการบีบอัดเวลาที่การบันทึกดั้งเดิมต้องการ”

เครื่องมือเอฟเฟกต์เสียง VoxBooster จัดการทั้งสองพารามิเตอร์อิสระ พร้อมเวลาแฝงการประมวลผลต่ำกว่า 10ms บน Windows และไม่มีการติดตั้งไดรเวอร์เคอร์เนล — หมายความว่ามันทำงานข้างเคียงกับซอฟต์แวร์ anti-cheat และไม่ต้องการการตั้งค่าเสียงเพิ่มเติม หากคุณต้องการไปไกลกว่าเสียงกรรไกร ตัวควบคุมพิทช์และแรมแนนท์เดียวกันครอบคลุมทุกอย่างจาก robot voice effects ไปยังการสร้างตัวละครแบบกำหนดเอง”

ดาวน์โหลด VoxBooster และลองใช้เอฟเฟกต์ในบั้นทึก 3 วัน — เครื่องมือเอฟเฟกต์เต็มรูปแบบพร้อมใช้งานตั้งแต่วันแรก เพื่อให้คุณสามารถสอบเทียมโปรไฟล์ Alvin Simon หรือ Theodore ที่แน่นอนก่อนที่จะจำหน่ายไปยังสิ่งใด ๆ”

ลอง VoxBooster — ทดลองใช้ฟรี 3 วัน

โคลนเสียงเรียลไทม์ ซาวด์บอร์ด และเอฟเฟกต์ — ทุกที่ที่คุณคุย

  • ไม่ต้องใช้บัตรเครดิต
  • ความหน่วง ~30ms
  • Discord · Teams · OBS
ลองฟรี 3 วัน