ตัวเปลี่ยนเสียงสำหรับพอดแคสต์ Actual Play

วิธีที่ผู้สร้างพอดแคสต์ actual play ใช้ตัวเปลี่ยนเสียงสำหรับ D&D และ Pathfinder — การโคลนเสียง AI สำหรับเสียง NPC, soundboard props และความหน่วงเวลาต่ำกว่า 300ms บน Discord และ Riverside

พอดแคสต์ actual play ได้กลายเป็นหนึ่งในรูปแบบการผลิตเสียงที่ต้องการมากที่สุดในสื่อ ผู้มหาเสนเดี่ยวบรรยายเป็น NPC ทุกตัว ควบคุมเพส จัดการกฎเกม และรักษาเรื่องราวส่วนโค้ง 100 ตอนให้สอดคล้องกัน — ทั้งหมดขณะบันทึกแบบเรียลไทม์ ตัวเปลี่ยนเสียงสำหรับการผลิตพอดแคสต์ actual play แก้ปัญหาส่วนที่ยากที่สุด: ทำให้แคสต์ตัวละครฟังเหมือนแตกต่างกันอย่างแท้จริงเมื่อทั้งหมดมาจากบุคคลเดียว

คำแนะนำนี้ครอบคลุมเวิร์กโฟลว์ที่สมบูรณ์: การโคลน AI สำหรับเสียง NPC ที่ยั่งยืน soundboard สำหรับ props และเพลงเสียงรอบข้าง การระงับเสียงสำหรับการบันทึก studio บ้าน และการส่งเสียงแบบเส้นทางหลายแทร็ก ผ่าน Discord และ Riverside ไม่ว่าคุณจะเรียกใช้แคมเปญ D&D 5e homebrew หรือ Pathfinder 2e Adventure Path หลักการเดียวกันนั้นใช้ได้

TL;DR — เวิร์กโฟลว์เสียง Actual Play ในภาพรวม

ต้องการฟีเจอร์เครื่องมือทำไมถึงสำคัญ
เสียง NPC ที่แตกต่างกันการโคลนเสียง AIผู้มหาเสนคนเดียว ตัวละครที่จดจำได้หลายสิบตัว
ความสอดคล้องของบุคลิกภาพในทั้งฤดูกาลโปรไฟล์เสียงที่บันทึกไว้ความชำนาญเดียวกันในตอนที่ 1 และตอนที่ 112
Props และ stinger เสียงรอบข้างSoundboardเสียงห้องเลือด ฟ้าร้อง บอก Combat ในการกด ปุ่มเดียว
การจับสัญญาณบทสนทนาที่สะอาดการระงับเสียงลบ HVAC ลูกเต๋า แป้นพิมพ์ออกจากสัญญาณสดจริง
ความเข้ากันได้ของแพลตฟอร์มการส่งเสียง low-latency audio captureทำงานได้อย่างโปร่งใสกับ Discord และ Riverside
ไม่ต้องติดตั้งไดรเวอร์การสกัด low-latency audio captureทำงานบน Win 10/11 โดยไม่มีการตั้งค่าสายเสมือนเลย

หากคุณต้องการข้ามไปยังการตั้งค่า: ดาวน์โหลด VoxBooster และอ่าน คำแนะนำการตั้งค่า Discord

เหตุใด Actual Play คือกรณีการใช้เสียงที่ยากที่สุด

คำแนะนำตัวเปลี่ยนเสียงส่วนใหญ่เขียนสำหรับนักเล่นเกมที่หลอกเพื่อน Actual play แตกต่างกันโดยหลักการ ข้อกำหนดที่แยกมันออกจากการใช้แบบสุ่มสำหรับคือ:

ความสอดคล้องของตัวละครที่ยั่งยืน เซสชันเกมใช้เวลาสามถึงสี่ชั่วโมง ฤดูกาลใช้เวลาหนึ่งร้อยเซสชัน พ่อค้ากนูมที่คุณให้เสียงในตอนที่สามต้องฟังเหมือนในตอนที่แปดสิบเก้า นั่นต้องใช้โปรไฟล์เสียง ไม่ใช่เพียงตัวเลื่อนระดับเสียงที่คุณเดาได้แตกต่างกันในแต่ละสัปดาห์

ตัวละครหลายตัวพร้อมกัน ผู้มหาเสนในแคมเปญ D&D หรือ Pathfinder ปกติจะเรียกใช้ NPC สี่ถึงสิบตัวในการพบปะครั้งเดียว การสลับระหว่างพวกเขาต้องเร็วพอที่จะไม่ทำลายฉาก — ในอุดมคติน้อยกว่าหนึ่งวินาที ไม่ได้ยิน ผู้ชม

ความเครียดของการแสดงแบบสดจริง Actual play คือละคร ความล่าช้า สิ่งประดิษฐ์ และความเสียหายของฮาร์ดแวร์เกิดขึ้นบนกล้องหรือในการถ่ายทำสด ตัวเปลี่ยนเสียงต้องมั่นคง โคลน 500ms ที่บางครั้งสะดุด เรียบร้อยสำหรับ TikTok เดี่ยว สิ่งใดให้เซสชัน D&D สดจริง

การรวมการผลิตภายหลัง เครื่องมือการบันทึกแบบเส้นทางหลายแทร็กเช่น Riverside และ Zencastr จับผู้เข้าร่วมแต่ละคนบนแทร็กแยกต่างหาก สัญญาณตัวเปลี่ยนเสียงต้องมาถึงแทร็กที่ถูกต้อง อย่างสะอาด โดยไม่มีสิ่งประดิษฐ์การส่งเสียงที่ทำให้การแก้ไขซับซ้อน

การโคลนเสียง AI สำหรับตัวละคร NPC

ฟีเจอร์กลางสำหรับงาน actual play คือการโคลนเสียง AI — ความสามารถในการฝึกโมเดลเสียงบนตัวอย่างเสียงของคุณในตัวละครและจากนั้นสร้างเสียงตัวละครจากสิ่งที่คุณพูดแบบเรียลไทม์ใหม่

วิธีการทำงานในทางปฏิบัติ

คุณบันทึก 30 ถึง 60 วินาทีของตัวคุณพูดเป็นตัวละคร โมเดล AI ได้เรียนรู้ formants ที่พิเศษ เสียงย้อน และซองเสียงของการแสดง จากจุดนั้นไป เมื่อคุณพูดเข้าไมค์ ระบบจะแมปเสียงสดของคุณลงบนโปรไฟล์ที่ฝึกแบบเรียลไทม์ — ต่ำกว่า 300ms ในโหมดความหน่วงเวลาต่ำบนฮาร์ดแวร์ทั่วไป

ผลลัพธ์คือคุณสามารถ:

  • พูดด้วยเสียงตามธรรมชาติและมีผู้นำเซนารี Orc ที่ยุ่งเหยิงออกมาจากปลายอีกด้าน
  • เปลี่ยนไปยังโปรไฟล์อื่นระหว่างฉากเพื่อให้เสียงผู้เล่น NPC ที่แตกต่างไปเลย
  • กลับไปที่โปรไฟล์แรกในภายหลังในเซสชันโดยมีความชำนาญที่เหมือนกัน

การจัดการโปรไฟล์สำหรับแคมเปญที่วิ่งจริง

แคมเปญ actual play ที่จริงจังอาจมี NPC ที่เกิดขึ้นซ้ำสามสิบหรือสี่สิบตัว เวิร์กโฟลว์ที่คงอยู่ในร้อยเซสชันคือ:

  1. สร้างโปรไฟล์ชื่อสำหรับแต่ละตัวละครเมื่อมีการแนะนำ
  2. สำรองไฟล์โปรไฟล์ลงในคลาวด์สโตเรจหลังจากการฝึก
  3. กำหนดแป้นพิมพ์ลัดไปยัง NPC ห้าหรือหกตัวที่มีแนวโน้มที่สุดที่จะปรากฏในเซสชันใดๆ
  4. เก็บส่วนที่เหลือให้เข้าถึงได้ในรายการแถบข้าง สำหรับตัวละครเป็นครั้งคราว

วินัยนี้จ่ายออกในปีที่สองของแคมเปญ เมื่อตัวละครที่ผู้เล่นไม่ได้เห็นมาตั้งแต่ตอนที่สิบสองกลับมาและฟังดูถูกต้องโดยไม่ต้องการการฝึกใหม่

Soundboard สำหรับ Props เสียงรอบข้างและ Stinger ดนตรี

Soundboard คือเครื่องมือหลักที่สองในการตั้งค่า actual play Critical Role และการผลิตที่คล้ายกัน ใช้เสียงเสริมเพื่อส่งสัญญาณการเปลี่ยนฉาก ขีดเส้นใต้ช่วงเวลาที่ดราม่าติกและให้รางวัลการกระทำของผู้เล่นด้วยคำติชมเสียงทันที

กรณีการใช้การผลิตแบ่งออกเป็นสามหมวด:

Loops เสียงรอบข้าง ต่อตอนห้องเลือด หยดชั้นใต้ดิน ลมป่า — สิ่งเหล่านี้ทำงานภายใต้แทร็กเสียงและตั้งค่าฉากโดยไม่ต้องมีนักดนตรีเฉพาะบนการเรียก ทริกเกอร์ที่จุดเริ่มต้นของฉาก เลือนเมื่อทีมย้ายไป

Stingers และ one-shot Thundercrack, door slam, Combat chord — สิ่งเหล่านี้ยิงบนการกดปุ่มและเล่นครั้งเดียว เวลาคือทั้งหมด บ้านแก้มฟ้าร้องที่วางไว้ดีครึ่งวินาทีหลังคำพูด Monologue ของตัวร้ายอ่านมูลค่าการผลิต ไม่ใช่ลักษณ์นุ่นนวม

สัญญาณเพลง ติดตามเพลงเต็มรูปแบบสำหรับการต่อสู้บอส เผยโปรแกรมลึกลับ และฉากอารมณ์ ในการผลิตเต็มรูปแบบเช่น Critical Role สิ่งเหล่านี้เป็นเวลาจริง แต่สำหรับโครงการอิสระ ไลบรารี soundboard ที่คิดมาดี ครอบคลุมอาณาเขตอารมณ์เดียวกัน

ฮาร์ดแวร์ Soundboard และเค้าโครงปุ่มลัด

Ergonomics ของการทริกเกอร์ soundboard ระหว่างการเล่นสดปัญหา คุณพอพูดฉากพร้อมกัน ให้เสียงผู้เล่น NPC และติดตามความคิดริเริ่ม Soundboard ที่ต้องคลิกผ่านเมนูจะไม่ถูกใช้

การตั้งค่ามาตรฐานสำหรับ actual play:

  • กำหนด Ambient loops ให้กับแถวหนึ่งของแป้นฟังก์ชัน
  • One-shot stinger ไปยังแถวที่สองหรือ numpad
  • เก็บ soundboard เปิดบนมอนิเตอร์ที่สองหรือ Stream Deck ที่มีปุ่มที่มีป้ายกำกับ

สำหรับเซสชันการบันทึกบน Riverside หรือ Zencastr ให้ส่งเอาต์พุต soundboard ไปยังช่องเสมือนแยกต่างหากเพื่อให้สามารถปรับสมดุลได้อย่างอิสระในภายหลัง — หรือตัดออกไปยังหมด หากมันรบกวนการแก้ไข

การระงับเสียงในการตั้งค่า Actual Play Home-Studio

พอดแคสต์ actual play อิสระส่วนใหญ่บันทึกในสตูดิโอที่บ้าน — ห้องนอนสำรอง ชั้นใต้ดิน สำนักงานบ้าน พื้นที่เหล่านี้มีเสียงนกวูก เสียงพัดลมคอมพิวเตอร์交通 เสียง และเสียงบังเอิญของเกมเอง: ลูกเต๋าบนโต๊ะ หน้ากระดาษเปลี่ยน ผู้เล่นเลื่อนบนเก้าอี้ของพวกเขา

การระงับเสียงแบบเรียลไทม์จะประมวลผลสัญญาณไมค์ก่อนไปถึงแพลตฟอร์มการบันทึกหรือการถ่ายทำสด ผลลัพธ์ที่จำเป็น:

  • เสียงนกวูกหายไปจากฟีดพอดแคสต์
  • ลูกเต๋ากลิ้งไม่โผล่ขึ้นมาเมื่อห้องเงียบ
  • เสียงแป้นพิมพ์ระหว่างการบันทึกหมายเหตุไม่ปรากฏในเสียง
  • การแพร่ออกอากาศสดฟังเหมือนถ้าบันทึกในห้องที่ถูกบำรุงรักษา แม้ว่าจะไม่ได้ดำเนิน

สำหรับเซสชันผู้เล่นหลายคนที่ผู้เข้าร่วมอยู่ในสถานที่ต่างกันและเข้าร่วมผ่าน Discord การระงับเสียงในแต่ละด้านจะมีคุณค่าเป็นพิเศษ — แป้นพิมพ์กลไกของผู้เล่นหนึ่งคนไม่หลั่งไหลลงในแทร็กของคนอื่นๆ

การส่งเสียงสำหรับการบันทึก Multi-Track Discord และ Riverside

Discord

Discord คือแพลตฟอร์มที่พบบ่อยที่สุดสำหรับกลุ่ม actual play ที่กระจายภูมิศาสตร์ ตัวเปลี่ยนเสียงเชื่อมต่อกับระบบเสียง Windows ผ่าน low-latency audio capture เพื่อให้ Discord จับเสียงที่เปลี่ยนแปลงจากอินพุตไมค์จริงของคุณ — ไม่จำเป็นต้องเลือกอุปกรณ์เสมือนในการตั้งค่าเสียง Discord

สิ่งนี้สำคัญเพราะ Discord บางครั้งรีเซ็ตการเลือกอุปกรณ์เสียงในการอัปเดตหลัก และอุปกรณ์ไมค์เสมือนสามารถใส่ธงเป็นลำดับความสำคัญที่ต่ำกว่าในการกำหนดค่าคุณภาพเสียงเซิร์ฟเวอร์บางอย่าง การสกัดระดับ low-latency audio capture นั้นมองไม่เห็นกับ Discord และการพิสูจน์การอัปเดต

สำหรับเซสชันการบันทึกกลุ่มเต็ม ใช้ Craig bot หรือโหมด multi-track ของ Riverside เพื่อจับผู้เข้าร่วมแต่ละคนบนแทร็กแยกต่างหาก แทร็กตัวเปลี่ยนเสียง GM ที่ต่ำลงบนลำต้นของตัวเอง ซึ่งทำให้การแก้ไข — ตัดถ่าย ปรับระดับ NPC ลบข้อผิดพลาด — ตรงไปยังภายหลัง

Riverside

Riverside.fm บันทึกเสียง lossless ในระดับท้องถิ่นบนเครื่องของผู้เข้าร่วมแต่ละคนและอัปโหลดหลังเซสชัน ซึ่งหมายความว่าสัญญาณตัวเปลี่ยนเสียงที่จับไว้ในระดับท้องถิ่นคือสิ่งที่ Riverside ส่ง ไม่ใช่สตรีมที่ถูกเข้ารหัสใหม่ คุณภาพจะถูกเก็บรักษาโดยตั้งแต่ต้นทาง

การตั้งค่าที่แนะนำสำหรับเซสชัน actual play บน Riverside:

  1. เรียกใช้ตัวเปลี่ยนเสียงด้วยการส่งเสียง low-latency audio capture ที่ทำงาน
  2. เลือกไมค์จริงของคุณใน Riverside — สัญญาณที่ประมวลผลแล้วมาถึง
  3. ส่งเสียง soundboard ไปยังช่องเอาต์พุตแยกต่างหากถ้าใช้ได้ หรือจัดการโพสต์-เซสชัน
  4. เปิดใช้งานการสำรองการบันทึกในระดับท้องถิ่นบนเครื่องผู้เข้าร่วมทั้งหมดในกรณีที่การอัปโหลดล้มเหลว

เปรียบเทียบ: วิธีการเปลี่ยนเสียงสำหรับ Actual Play

วิธีการความสอดคล้องของบุคลิกภาพความเร็วสวิตช์ความหน่วงเวลาความซับซ้อนการตั้งค่า
การโคลน AI แบบเรียลไทม์ (โปรไฟล์ตามอักขระ)ยอดเยี่ยม — โปรไฟล์บันทึกน้อยกว่า 1 วินาที100-300msปานกลาง (การฝึกอบรมจำเป็น)
ปัจจัยเสียงเท่านั้นดี — ด้วยตนเองต่อเซสชันทันที<20msต่ำ
Pitch + Formant shifterปานกลาง — โดยประมาณทันที<30msต่ำ
การโคลน AI แบบเรียลไทม์ + low-latency audio captureยอดเยี่ยมน้อยกว่า 1 วินาทีSub-300msปานกลาง

สำหรับ actual play โดยเฉพาะ pitch shifting เพียงอย่างเดียวไม่ได้แก้ปัญหาความสอดคล้องของบุคลิกภาพ ตัวละครสองตัวที่มีระดับเสียงต่างกันยังคงฟังเหมือนคนเดียวกันในวันต่างๆ เว้นแต่ formants และเสียงย้อนจะถูกสร้างรูปร่างโดยโมเดลที่ฝึกแล้ว

ลิงก์ภายใน — ลงไปลึก

หากคุณกำลังสร้างสแตค actual play production ที่สมบูรณ์ คำแนะนำเหล่านี้ครอบคลุมหัวข้อที่อยู่ติดกัน:

ทรัพยากรภายนอก

  • Actual play — Wikipedia — ประวัติศาสตร์และภาพรวมรูปแบบ
  • Critical Role Productions — การผลิต actual play ที่ได้มาตรฐาน
  • Riverside.fm — แพลตฟอร์มการบันทึกระยะไกลแบบเส้นทางหลายแทร็กที่ใช้กันอย่างแพร่หลายในการผลิต actual play

สิ่งที่ VoxBooster เพิ่มเข้าไปในเวิร์กโฟลว์นี้

VoxBooster จัดการเลเยอร์ด้านเทคนิคของเวิร์กโฟลว์นี้บน Windows 10 และ 11:

  • การส่งเสียง low-latency audio capture เพื่อให้ Discord และ Riverside จับเสียงที่เปลี่ยนแปลงโดยไม่ต้องตั้งค่าอุปกรณ์เสมือน
  • การโคลนเสียง AI ที่มีความหน่วงเวลาต่ำกว่า 300ms สำหรับการสลับ NPC ระหว่างฉากแบบสดจริง
  • Soundboard ที่รวมเข้าด้วยกัน พร้อมการทริกเกอร์ hotkey สำหรับ props และ stinger เสียงรอบข้าง
  • การระงับเสียงแบบเรียลไทม์ ซึ่งทำให้การบันทึก studio บ้านสะอาดก่อนไปถึงแพลตฟอร์มการบันทึก
  • ไม่มีการติดตั้งไดรเวอร์ kernel — ทำงานโดยไม่ต้องสิทธิ์ที่ยกระดับ ไม่มีความเสี่ยง BSOD จากความขัดแย้งของไดรเวอร์

ที่ $6.99/เดือน มันเหมาะกับงบประมาณผู้สร้างอิสระ การโคลนเสียงและ soundboard จะรวมอยู่ในแผนพื้นฐาน — ไม่มีค่าใช้จ่าย add-on แยกต่างหาก

FAQ

บุคคลเดียวสามารถให้เสียงหลาย NPC ที่แตกต่างกันแบบสดจริงโดยไม่หยุดเซสชันได้หรือไม่ ได้ เมื่อใช้การโคลนเสียง AI คุณสามารถสร้างโปรไฟล์เสียงสำหรับแต่ละ NPC ที่เกิดขึ้นซ้ำและเปลี่ยนระหว่างพวกเขาในเวลาน้อยกว่าหนึ่งวินาที ผู้มหาเสนจึงเสียงเต้านั้นออกมาแบบเรียลไทม์ — ผู้เล่นได้ยิน Gornak orcs และ Lady Veth เป็นตัวละครที่แตกต่างกันโดยไม่มีการหยุด

ความหน่วงเวลาใดที่ยอมรับได้สำหรับเซสชันการบันทึก actual play แบบสดจริง ต่ำกว่า 150ms เหมาะสำหรับการเล่นบทบาทแบบสดจริง Sub-300ms คือเพดานปฏิบัติสำหรับการโคลน AI โดยไม่มีความล่าช้าที่ได้ยินระหว่างปากของคุณและสิ่งที่ Discord หรือ Riverside จับ

ฉันต้องใช้สายเสียงเสมือนสำหรับการบันทึก Discord หรือ Riverside หรือไม่ ไม่หากคุณใช้ตัวเปลี่ยนเสียงที่เชื่อมต่อโดยตรงกับระบบเสียง Windows VoxBooster จะส่งเสียงที่เปลี่ยนแปลงไปยัง low-latency audio capture เพื่อให้ Discord และ Riverside เห็นไมค์จริงของคุณและจับสัญญาณที่ประมวลผลแล้ว

ฉันจะเก็บเสียง NPC เดียวกันไว้ได้อย่างสม่ำเสมอในฤดูกาล 100 ตอนหรือไม่ บันทึก NPC แต่ละตัวเป็นโปรไฟล์เสียงที่มีชื่อและสำรองไฟล์โปรไฟล์ โปรไฟล์ที่ฝึกได้บน 30-60 วินาทีของเสียงของคุณในตัวละครจะล็อกความชำนาญ เสียงย้อน และจังหวะอย่างถาวร โหลดที่จุดเริ่มต้นของเซสชันเพื่อให้ได้ผลลัพธ์เดียวกัน ทุกครั้ง

soundboard จะรบกวนการบันทึกบน Riverside หรือไม่ ส่ง props เสียงรอบข้างและเพลงไปยังเอาต์พุต mix-minus แยกต่างหากเพื่อให้แทร็กโฮสต์สะอาด เลเยอร์ soundboard จากนั้นสามารถผสมหรือตัดออกในโพสต์โดยไม่กระทบต่อบทสนทนา

การระงับเสียงช่วยในการตั้งค่า studio บ้าน actual play หรือไม่ อย่างมาก การระงับเสียงแบบเรียลไทม์จะลบเสียงนกวูก คลิกแป้นพิมพ์ ลูกเต๋าม้วน และเขย่ากระดาษออกจากสัญญาณไมค์ก่อนไปถึง Discord หรือ Riverside ช่วยประหยัดชั่วโมงของการทำความสะอาดในการผลิตภายหลัง

การใช้ตัวเปลี่ยนเสียงนั้นถูกกฎหมายหรือไม่ในการผลิต Critical Role แบบจำลอง ใช่ การประมวลผลเสียงเป็นเทคนิคการผลิตมาตรฐาน ไม่มีกฎของแพลตฟอร์มบน Twitch YouTube หรือโฮสต์พอดแคสต์ที่ห้ามใช้ฟิลเตอร์เสียงกับเสียงของคุณเอง


พอดแคสต์ actual play เป็นความมุ่งมั่นทางสร้างสรรค์ที่มีรูปแบบ โครงสร้างพื้นฐานการผลิตที่คุณสร้างในฤดูกาลหนึ่งต้องเก็บไว้ตลอดฤดูกาลที่สามการเรียนรู้วิธีการเปลี่ยนเสียงอย่างถูกต้องตั้งแต่เริ่มต้น — การโคลน AI สำหรับความสอดคล้องของตัวละคร soundboard สำหรับบรรยากาศ การระงับเสียงสำหรับเสียงสะอาด การส่งเสียง low-latency audio capture สำหรับความเข้ากันได้ของแพลตฟอร์ม — หมายความว่าคุณแก้ไขปัญหาทางวิศวกรรมครั้งเดียวแทนที่จะแพตช์พวกมันทุก ๆ ไม่กี่ตอน

ดาวน์โหลด VoxBooster และตั้งค่าโปรไฟล์เสียง NPC แรกของคุณก่อนเซสชันถัดไป

ลอง VoxBooster — ทดลองใช้ฟรี 3 วัน

โคลนเสียงเรียลไทม์ ซาวด์บอร์ด และเอฟเฟกต์ — ทุกที่ที่คุณคุย

  • ไม่ต้องใช้บัตรเครดิต
  • ความหน่วง ~30ms
  • Discord · Teams · OBS
ลองฟรี 3 วัน