ซอฟต์แวร์ระงับเสียง: ลบเสียงรบกวนเบื้องหลัง

เรียนรู้วิธีที่ซอฟต์แวร์ระงับเสียงลบเสียงกระแทกแป้นพิมพ์ เสียงหม้อแปลง และเสียงสะท้อนห้องออกจากไมโครโฟนของคุณในเวลาจริง RNNoise เทียบกับ AI/ML ความล่าช้า การตั้งค่า OBS และอื่น ๆ

ซอฟต์แวร์ระงับเสียง: ลบเสียงรบกวนเบื้องหลังออกจากไมโครโฟนของคุณ

วิธีการลบเสียงรบกวนเบื้องหลังออกจากไมโครโฟนของคุณเป็นหนึ่งในคำถามเกี่ยวกับเสียงที่ค้นหามากที่สุดในบรรดาผู้สตรีมมิง คนงานระยะไกล และนักเล่นเกม - และมีเหตุผลที่ดี เสียงกระแทกแป้นพิมพ์ พัดลมตัวเรือน หน่วยปรับอากาศ และเสียงสะท้อนห้องไหลเข้าไปในไมโครโฟนของคุณมากกว่าที่คุณคิดจนกว่าคุณจะได้ยินการบันทึก stream ของคุณเอง คำแนะนำนี้อธิบายว่าซอฟต์แวร์ระงับเสียงทำงานอย่างไร วิธีการใดที่คุ่มค่า ตำแหน่งที่เทคโนโลยีนี้อยู่ในห่วงโซ่เสียงของคุณ ต้นทุนของมันในแง่ของความล่าช้า และวิธีการกำหนดค่าไม่ว่าคุณจะเลือกเส้นทางตัวกรอง OBS ฟรีหรือแอปพลิเคชันแบบเรียลไทม์ที่ทุ่มเท”


สรุป

  • ซอฟต์แวร์ระงับเสียงวิเคราะห์สัญญาณไมโครโฟนของคุณในเวลาจริง และลดความสำคัญของทุกสิ่งที่ไม่เหมือนเสียง
  • RNNoise (ใช้ใน OBS และเครื่องมือฟรีหลายตัว) เป็นเส้นฐานที่มั่นคง - ประมาณ 10 มิลลิวินาที ความล่าช้า จัดการเสียงคงที่ได้ดี
  • Denoiser ที่ใช้ AI/ML ไปไกลกว่านั้น - พวกเขาจัดการเสียงแป้นพิมพ์และเสียงสุ่มเจอ - ด้วยค่าใช้จ่ายความล่าช้า 10-30 มิลลิวินาที อย่างพอสมควร
  • การระงับเสียงต้องรันก่อนเอฟเฟกต์เสียงในห่วงโซ่ ไม่ใช่หลังจากนั้น หรือคุณจะแนะนำสิ่งประดิษฐ์ที่ตัวระงับต่อมาจะต่อสู้
  • คุณสามารถตั้งค่าได้ฟรีภายใน OBS วันนี้ หรือใช้ซอฟต์แวร์เฉพาะสำหรับปกคลุมทั่วระบบที่ใช้งานใน Discord การโทร และทุกแอปพลิเคชันอื่นพร้อมกัน
  • VoxBooster วางการระงับเสียงไว้เป็นอันดับแรกในห่วงโซ่การประมวลผลโดยอัตโนมัติ ดังนั้นมันจึงใช้งานได้อย่างถูกต้องไม่ว่าคุณจะเปลี่ยนเสียงของคุณหรือเพียงแค่ทำความสะอาดไมโครโฟนดิบ

แพลตฟอร์มการสตรีมมิงบีบอัดเสียงอย่างหนัก การบีบอัดนั้นขยายสิ่งประดิษฐ์เสียงที่ฟังค่อนข้างเบาในการบันทึกดิบ แต่กลายเป็นเสียงฟื่อต่อเนื่องบนวิดีโอ VOD ของ Twitch การควบคุมอัตราขยายอัตโนมัติของ Discord ทำเช่นเดียวกัน - มันเพิ่มสัญญาณเงียบ ซึ่งหมายความว่าเสียงพัดลมของคุณได้รับการเพิ่มขึ้นพอลี่ข้างเสียงของคุณ การรับการระงับเสียงที่เหมาะสมจะแก้ไขปัญหาทั้งสองในครั้งเดียว

ซอฟต์แวร์ระงับเสียงทำอะไรจริง ๆ

การระงับเสียงไม่ได้เพียงแค่ใช้การตัด EQ หรือเกต เกตเงียบเสียงใต้เกณฑ์ - มีประโยชน์สำหรับการเงียบที่สมบูรณ์ระหว่างประโยค แต่ไม่มีประโยชน์สำหรับเสียงที่ทับซ้อนกับเสียงของคุณในความถี่ การตัด EQ ช่วงความถี่คงที่ ซึ่งจะตัดฮาร์มอนิกเสียงด้วย

ซอฟต์แวร์ระงับเสียงสมัยใหม่ทำงานแตกต่างกัน มันถือว่าเสียงเป็นกระแสของเฟรมสั้น ๆ (โดยปกติ 10-20 มิลลิวินาที แต่ละอัน) วิเคราะห์แต่ละเฟรมเพื่อแยกเนื้อหาเสียงจากเนื้อหาเสียง และลดความสำคัญของเสียงในขณะที่ผ่านเสียง ขั้นตอนการวิเคราะห์คือจุดที่วิธีการแตกต่างกัน

การลบสเปกตรัมแบบดั้งเดิม

เครื่องมือที่เก่ากว่าใช้การลบสเปกตรัม: วัดพื้นเสียงในช่วงเงียบ สร้างโปรไฟล์เสียง ลบโปรไฟล์นั้นออกจากทุกเฟรมที่ตามมา สิ่งนี้ใช้งานได้ค่อนข้างดีสำหรับเสียงคงที่เช่นเสียงพัดลมหรือเครื่องปรับอากาศที่อยู่ที่ความถี่และระดับคงที่ มันต่อสู้กับเสียงที่เปลี่ยนแปลง - คลิกแป้นพิมพ์ คลิกเมาส์ ใครบางคนพูดในเบื้องหลัง - เพราะโปรไฟล์ที่วัดได้ในช่วงเงียบไม่ตรงกับสิ่งที่มาถึงกลางประโยค

RNNoise - เส้นฐานปฏิบัติฟรี

RNNoise เป็นตัวระงับเสียงตามเครือข่าย recurrent neural ที่พัฒนาโดย Mozilla และ Jean-Marc Valin มันใช้เครือข่าย GRU (gated recurrent unit) ที่ได้รับการฝึกอบรมในหลายพันชั่วโมงของเสียงที่มีเสียงดังเพื่อจำแนกแต่ละแถบความถี่เป็นเสียงหรือเสียงในทุกเฟรม เนื่องจากเรียนรู้จากการบันทึกจริง มันจัดการกับชั้นเรียนเสียงที่กว้างกว่ามากกว่าการลบสเปกตรัม

RNNoise เป็นโอเพนซอร์ส มีขนาดเท้าที่เล็กมาก (รันบนหนึ่ง CPU core) เพิ่ม 10 มิลลิวินาที ประมาณ และรวมอยู่โดยตรงใน OBS Studio Chromium (เครื่องยนต์อยู่เบื้องหลังแท็บเบราว์เซอร์ Discord) และเครื่องมืออื่น ๆ หลายตัว สำหรับคนส่วนใหญ่ที่สตรีมมิงเป็นการแสดงสดหรือการโทรแบบสั่งซื้อ RNNoise เพียงพอจริงๆ

ที่ RNNoise แสดงข้อ จำกัด: เสียงรบกวนที่ขาดตอนมากมาย (แป้นพิมพ์เครื่องกลที่ WPM สูงขวาข้างไมโครโฟน) เสียงสะท้อนห้อง/reverb และสภาพแวดล้อมอะคูสติกที่ซับซ้อนพร้อมแหล่งเสียงที่แข่งขันกันหลายตัว มันยังมีรุ่นคงที่ - ไม่สามารถปรับแต่งไปยังห้องเฉพาะของคุณได้โดยไม่มีการรีคอมไพล์

Denoiser AI/ML

ซอฟต์แวร์ระงับเสียงที่มีเนื้อหาใหม่กว่าใช้เครือข่ายนิวรอนที่ใหญ่กว่าได้รับการฝึกอบรมในข้อมูลมากขึ้น โดยมีพารามิเตอร์มากขึ้นซึ่งอุทิศให้กับการแยกเสียงจากพื้นหลังที่ซับซ้อน เครื่องมือเช่น Krisp NVIDIA RTX Voice (ส่วนหนึ่งของ NVIDIA Broadcast) และการระงับเสียง VoxBooster อยู่ในหมวดหมู่นี้ การปรับปรุงโดยทั่วไปเมื่อเทียบกับ RNNoise นั้นเห็นได้ชัดเจนที่สุดใน:

  • เสียงแป้นพิมพ์ - typist 60 WPM บนแป้นพิมพ์เครื่องกลเสียงดังขวาข้างไมโครโฟน ซึ่ง RNNoise จัดการได้ไม่ดี
  • เสียงสะท้อนห้องและ reverb - การสะท้อนที่มาถึงไมโครโฟนมิลลิวินาทีหลังจากเสียงดั้งเดิมและทำให้ความชัดเจนของเสียงพูด
  • เสียงพูดเบื้องหลัง - คนอื่นพูดในห้องเดียวกัน ซึ่งมีลักษณะเฉพาะของสเปกตรัมเหมือนเสียงที่สร้างความสับสนให้กับโมเดลที่ง่ายกว่า
  • เสียงระดับตัวแปร - การจราจรที่กระเพื่อมกับทุกคนที่ผ่านไปมา HVAC ที่เปิด/ปิด

ค่าแลกเปลี่ยนคือต้นทุนการคำนวณ โมเดลที่หนักกว่าต้องการ CPU มากขึ้น (หรือ GPU สำหรับตัวแปรที่ใหญ่ที่สุด) ความล่าช้ายังคงอยู่ในช่วง 10-30 มิลลิวินาที สำหรับการใช้งานแบบเรียลไทม์เนื่องจากใช้ขนาดชิ้นเล็ก แต่เวลาการสรุปอนุมานของโมเดลตั้งค่าพื้น

ที่มี Noise Suppression นั่นอยู่ในห่วงโซ่เสียง

นี่คือที่ที่การตั้งค่าส่วนใหญ่ล้มเหลว ตำแหน่งของตัวระงับเสียงที่สัมพันธ์กับขั้นตอนการประมวลผลอื่น ๆ นั้นมีความสำคัญอย่างมาก

ลำดับที่ถูกต้อง: ระงับก่อนอื่น

ไมโครโฟน -> ระงับเสียง -> เอฟเฟกต์เสียง / EQ / การบีบอัด -> เอาต์พุต

หากการระงับเสียงรันก่อน มันจะได้รับข้อมูลเข้าที่สะอาดที่สุดที่เป็นไปได้: เสียงไมโครโฟนดิบก่อนที่การประมวลผลใด ๆ จะเพิ่มสิ่งประดิษฐ์ มันสามารถระบุเสียงกับเสียงได้อย่างแม่นยำเนื่องจากทั้งสองยังไม่ได้ปรับแต่ง

สิ่งที่ผิดเมื่อคุณพลิกมัน

หากคุณวาง pitch-shifter หรือเครื่องเปลี่ยนเสียงก่อนตัวระงับเสียง ห่วงโซ่จะมีลักษณะดังนี้:

ไมโครโฟน -> เครื่องเปลี่ยนเสียง -> ระงับเสียง -> เอาต์พุต

เครื่องเปลี่ยนเสียงสร้างฮาร์มอนิกใหม่ เลื่อน formant และสร้างเนื้อหาสเปกตรัมที่ไม่อยู่ในการบันทึกดั้งเดิม ตัวระงับเสียงจึงพบเหตุการณ์สัญญาณที่ปรับเปลี่ยนนี้และไม่สามารถแยกแยะฮาร์มอนิกเสียง (ขณะนี้ที่ความถี่ไม่คุ้นเคย) จากเสียงได้ผลลัพธ์คือเสียงที่ถูกใช้งานบางส่วนพร้อมกับเสียง - บาง ชุ่มฉ่ำ หรือมีพยัญชนะตัด

VoxBooster บังคับใช้ลำดับที่ถูกต้องภายใน ขั้นตอนการระงับเสียงของมันทำงานที่ด้านบนของห่วงโซ่การประมวลผลโดยไม่คำนึงถึงคุณสมบัติอื่น ๆ ที่คุณมีการทำงาน นี่ไม่ใช่รายละเอียดที่ชัดเจนจนกว่าคุณจะได้ยินว่าลำดับที่ผิดฟังเหมือนไร

ลำดับการได้มาก่อนตัวระงับ

อัลกอริทึมการระงับเสียงมักเทียบเคียงสำหรับช่วงระดับการป้อนข้อมูลเฉพาะ หากไมโครโฟนของคุณมีการได้มาสตรีมเกินไป (สัญญาณที่ล่อแหว่งใกล้ 0 dBFS) สิ่งประดิษฐ์คลิปจะเข้าสู่สัญญาณก่อนการระงับและไม่สามารถลบได้ หากเงียบเกินไป อัลกอริทึมทำงานที่ SNR ต่ำและอาจไม่แยกแยะเสียงจากพื้นเสียงได้อย่างน่าเชื่อถือ ลำดับที่ระดับไมโครโฟนที่เสียงพูดยอดเขา 12 ถึง -6 dBFS ก่อนตัวระงับ

RNNoise กับ Denoiser AI/ML: การเปรียบเทียบแบบ Head-to-Head

คุณสมบัติRNNoiseDenoiser AI/ML (เช่น VoxBooster)
ความล่าช้า~10 ms10-30 ms
การใช้ CPUต่ำมาก (< 5% บน 1 core)ต่ำถึงปานกลาง (5-20% ขึ้นอยู่กับโมเดล)
เสียงคงที่ (พัดลม AC)เยี่ยมยอดเยี่ยมยอด
เสียงแป้นพิมพ์ / คลิกปานกลางเยี่ยมยอด
เสียงสะท้อนห้อง / reverbไม่ดี-ปานกลางดี-เยี่ยมยอด
เสียงพูดเบื้องหลังไม่ดีดี
เสียงระดับตัวแปรดีเยี่ยมยอด
ความแรงที่ปรับได้ไม่มี (เปิด/ปิด)ใช่ (เลื่อนระดับการระงับ)
ทำงานทั่วระบบไม่มี (ต่อแอป)ใช่
ราคาฟรีที่เสียค่า (มีการทดลองใช้)

ตารางทำให้การตัดสินใจค่อนข้างตรงไปตรงมา หากสภาพแวดล้อมอะคูสติกของคุณสะอาดด้วยเสียงพัดลมหรือ AC ที่มั่นคง RNNoise ใน OBS หรือ Discord คือทั้งหมดที่คุณต้องการ - ฟรี ไม่มีการติดตั้ง หากคุณมีเสียงแป้นพิมพ์ เสียงสะท้อน หรือต้องการให้การระงับเสียงทำงานบนแอปพลิเคชันทั้งหมดในเวลาเดียวกัน (ไม่ใช่เพียง OBS) เครื่องมือเฉพาะจะสมเด็จจ่ายสำหรับตัวของมันเอง

ตั้งค่าการระงับเสียงใน OBS

OBS Studio มีการระงับเสียงในตัวผ่านตัวกรองเสียง ต่อไปนี้คือขั้นตอนสำหรับทั้ง RNNoise และ denoiser Speex (ทางเลือก DSP ทดแทน):

เพิ่มตัวกรองระงับเสียงใน OBS

  1. เปิด OBS Studio ในแผง Audio Mixer ให้หาแหล่ง ไมโครโฟนของคุณ
  2. คลิกที่ไอคอนเกียร์ข้าง ๆ แหล่ง mic และเลือก Filters
  3. ในหน้าต่าง Filters ให้คลิก + (Add) -> Noise Suppression
  4. ตั้งชื่อให้กับมันแล้วคลิก OK
  5. ในการตั้งค่าตัวกรอง เลือก RNNoise จากตัวเลือก Method
  6. คลิก Close

นั่นคือการตั้งค่าทั้งหมด OBS ใช้ตัวกรองในเวลาจริงกับไมโครโฟนก่อนที่จะส่งเสียงไปยังสตรีมหรือการบันทึกของคุณ ไม่มีเลื่อนความแรงสำหรับ RNNoise - มันเปิดหรือปิด วิธี Speex มีเลื่อน Suppression Level (dB) หากคุณต้องการตัวเลือกที่ปรับได้

ลำดับตัวกรองที่ถูกต้องใน OBS

OBS ประมวลผลตัวกรองจากบนลงล่างในหน้าต่าง Filters การระงับเสียงควรอยู่ที่ด้านบนของรายการ - เหนือการบีบอัด EQ หรือปลั๊กอินเอฟเฟกต์เสียงอื่น ๆ ลากไปยังตำแหน่ง 1 หากจำเป็น

ตาม เอกสาร OBS เกี่ยวกับตัวกรองเสียง ตัวกรองจะทำงานตามลำดับในรายการ นั่นคือเหตุที่ตำแหน่งมีความสำคัญ

ข้อ จำกัด ของวิธี OBS เท่านั้น

ตัวกรอง OBS ใช้เฉพาะกับเสียงที่ประมวลผลโดย OBS ไมโครโฟน Discord แท็บเบราว์เซอร์ เสียงเกมโต้ตอบและแอปพลิเคชันอื่น ๆ ที่ไม่ได้ถูกเส้นทางผ่าน OBS จะไม่ได้รับประโยชน์ หากคุณต้องการระงับเสียงทั่วระบบ คุณต้องการซอฟต์แวร์ที่แทรกตัวเองที่ระดับไดรเวอร์เสียง Windows - ซึ่งเป็นเครื่องมือเช่น VoxBooster Krisp และ NVIDIA Broadcast

ตั้งค่าการระงับเสียงทั่วระบบด้วยซอฟต์แวร์เฉพาะ

ซอฟต์แวร์ระงับเสียงทั่วระบบลงทะเบียนไมโครโฟนเสมือนใน Windows คุณสลับแอปพลิเคชันของคุณ (Discord OBS Zoom เกมของคุณ) เพื่อใช้ไมโครโฟนเสมือนนี้ และซอฟต์แวร์จัดการการจับภาพจากไมโครโฟนจริงของคุณ ระงับเสียง และป้อนสัญญาณสะอาดให้กับแอปพลิเคชันใด ๆ ที่ฟัง

เวิร์กโฟลว์ทั่วไป

  1. ติดตั้งซอฟต์แวร์และเปิดใช้งาน
  2. ในการตั้งค่าซอฟต์แวร์ ให้ยืนยันว่าไมโครโฟนทางกายภาพของคุณถูกเลือกเป็นอินพุต
  3. เปิดใช้งานการระงับเสียง (และตั้งค่าระดับความแรงหากมีตัวเลือก)
  4. ใน Discord OBS Zoom หรือเกมของคุณ ให้ไปที่การตั้งค่าเสียง/mic และเลือกไมโครโฟนเสมือนที่ซอฟต์แวร์สร้างขึ้นเป็นอุปกรณ์อินพุตของคุณ
  5. ทำการบันทึกทดสอบเพื่อยืนยันว่าสัญญาณสะอาดกำลังออก

การตั้งค่า VoxBooster

ดาวน์โหลด VoxBooster และติดตั้ง ตัวช่วยในการตั้งค่าขอให้คุณเลือกไมโครโฟนทางกายภาพของคุณและตั้งค่าอุปกรณ์เสมือนโดยอัตโนมัติ การระงับเสียงได้รับการเปิดใช้งานตามค่าเริ่มต้นและทำงานก่อนเอฟเฟกต์เสียงใด ๆ ในห่วงโซ่

ในการตั้งค่า VoxBooster:

  • Noise Suppression Strength: เริ่มจาก Medium หากคุณยังได้ยินเสียงพัดลมให้ย้ายไป High หากเสียงของคุณเริ่มฟังประมวลผลหรือหายใจลงมาเพื่อ Medium หรือ Low
  • Voice Activity Detection (VAD): ทำให้จับคู่กับการระงับเสียงเพื่อ - มันเงียบเอาต์พุตทั้งหมดในระหว่างการหยุด ซึ่งจะขจัดพื้นเสียงตกค้างระหว่างประโยค

ไมโครโฟนเสมือนที่ VoxBooster สร้างขึ้นปรากฏในการตั้งค่าเสียง Windows เป็นอุปกรณ์เสียงมาตรฐาน Discord OBS และแอปพลิเคชันอื่น ๆ เห็นมันว่าเป็นไมโครโฟนปกติ

ประเภทของเสียงเฉพาะและวิธีจัดการกับพวกเขา

เสียงพัดลมและเครื่องปรับอากาศ

เสียงคงที่ความถี่ต่ำ RNNoise จัดการสิ่งนี้ได้ดี หากคุณมีส่วนประกอบ 50/60 Hz ที่สำคัญจากการรบกวนทางไฟฟ้า ตัวกรอง EQ การบ่นแคบที่ความถี่นั้นก่อนตัวระงับสามารถช่วยได้ - มันเป็นปัญหาคงที่ที่ EQ แก้ได้อย่างมีประสิทธิภาพมากกว่าการอนุมาน ML

เสียงกระแทกแป้นพิมพ์เครื่องกล

การเปลี่ยน broadband gapped ที่ส่วนที่เข้ามาในกลุ่มแน่นที่ความเร็วการพิมพ์ นี่คือที่ RNNoise แสดงให้เห็นน้อยลงเมื่อเทียบกับ denoiser AI การเปลี่ยนมีขนาดเล็กพอที่จะทับซ้อนกับเสียงพยัญชนะที่พูด (โดยเฉพาะ stop consonants เช่น P T K) ทำให้การจำแนกได้ยากขึ้น

หากคุณใช้แป้นพิมพ์เครื่องกล การบรรเทาทางกายภาพช่วยได้: mat แผ่นใต้แป้นพิมพ์ วงแหวน O บน switches หรือไมโครโฟนแบบทิศทางวางให้ย่อให้น้อยที่สุดการรับของพื้นผิวตั้งโต๊ะ รวมกับ denoiser AI เสียงแป้นพิมพ์กลายเป็นปัญหา

เสียงสะท้อนห้องและ reverb

เสียงสะท้อนคือเสียงที่สะท้อนที่ไมโครโฟนหนึ่งวินาทีหลังจากเสียงดั้งเดิม Reverb คือการสะสมของการสะท้อนที่ทับซ้อนกันหลายแบบที่สร้างเสียง “ห้อง” diffuse ไม่มีอะไรหนึ่งได้รับการจัดการโดย RNNoise ได้ดี

การบำรุงรักษาเชิงกายภาพ (แผ่นโฟมอะคูสติก ตัวกรองการสะท้อนด้านหลังไมโครโฟน ย้ายไมโครโฟนใกล้ปากและลดอัตราขยายตามที่เหมาะสม) เป็นวิธีแก้ไขที่มีประสิทธิภาพมากที่สุด ซอฟต์แวร์สามารถลดเสียงสะท้อนแต่ไม่สามารถได้รับค่าเสียญหาสำหรับห้องที่มี reverb tails ยาว สำหรับการตั้งค่าบ้าน ตัวกรองการสะท้อนด้านหลังไมโครโฟนและลวดโพลาร์เคาดีออยด์เพื่อปฏิเสธเสียงห้องจากด้านหลังทำให้เกิดความแตกต่างมากขึ้นกว่าการตั้งค่าซอฟต์แวร์ใด ๆ

เสียงพูดเบื้องหลัง

Denoiser AI ได้รับการฝึกอบรมเพื่อรับรู้ลวดรูปแบบความถี่เสียงของมนุษย์ เมื่อเสียงเบื้องหลังก็เป็นเสียงของมนุษย์ (สมาชิกครอบครัวพูดทีวีในเบื้องหลัง) ตัวจำแนกมีงานที่ยากกว่า การใช้งาน AI ที่ดีจัดการสิ่งนี้อย่างสมเหตุสมผลโดยมองไปที่เบาะแสเชิงพื้นที่และสเปกตรัม แต่ไม่มีซอฟต์แวร์ที่แยกเสียงสองเสียงพร้อมกันที่ไมโครโฟนเดียวได้อย่างสมบูรณ์ แยกเนื้อหา - ปิดประตู ย้ายไปยังพื้นที่เงียบ - ยังคงเป็นวิธีแก้ปัญหาที่ดีที่สุด

คลิกเมาส์

คล้ายกับเสียงแป้นพิมพ์ แต่มีโปรไฟล์การเปลี่ยนแปลงที่แตกต่างกัน โดยทั่วไปแล้วจะระงับได้ง่ายกว่าเสียงแป้นพิมพ์เพราะอัตราการคลิกต่ำกว่าและการเปลี่ยนแปลงน้อยกว่า Denoiser AI ส่วนใหญ่จัดการกับการคลิกเมาส์อย่างสะอาดที่การตั้งค่าการระงับปานกลาง

ความล่าช้า: สิ่งที่ตัวเลขหมายถึงจริง ๆ

ความกังวลทั่วไปคือว่าการระงับเสียงเพิ่มความล่าช้าที่รับรู้ได้ให้กับเสียงของคุณเอง ต่อไปนี้คือวิธีการคิดเกี่ยวกับเรื่องนี้:

  • ต่ำกว่า 20 ms: ไม่มีการรับรู้โดยสิ้นเชิงในขณะที่พูดสด คุณจะไม่มีวันสังเกต
  • 20-50 ms: มีอยู่ในเชิงเทคนิค แต่ไม่ได้ยินเสียงสะท้อนในระหว่างเสียงพูดปกติ Edge case: หากคุณตรวจสอบไมโครโฟนของคุณเองผ่านหูฟัง บางคนสังเกตเห็นในช่วงนี้
  • 50-100 ms: เริ่มรู้สึกเหมือน lag เล็กน้อย หากคุณตรวจสอบเสียงที่ประมวลผลของคุณในเวลาจริง
  • เหนือ 100 ms: เสียงสะท้อนที่เห็นได้ชัดเจนเมื่อตรวจสอบ ไม่สามารถยอมรับได้สำหรับการใช้งาน live performance

RNNoise เพิ่ม 10 มิลลิวินาที ประมาณ Denoiser AI ในเวลาจริง 15-30 มิลลิวินาที ไม่มีอะไรจึงเป็นปัญหาสำหรับการใช้งานส่วนใหญ่ สถานการณ์เดียวที่ความล่าช้าในการระงับเสียงสำคัญคือหากคุณทำการบันทึกเพลงมืออาชีพด้วยสมาธิการตรวจสอบแบบเรียลไทม์ - ซึ่งมีข้อกำหนดความล่าช้าต่ำของตัวเองที่ใช้ยาวนานก่อนที่การระงับเสียงจะเข้ามา

การระงับเสียงและเครื่องเปลี่ยนเสียง: การสร้างงาน

หากคุณใช้ เครื่องเปลี่ยนเสียง แบบเรียลไทม์ พร้อมกับการระงับเสียง ระงับ ลำดับจากเร็ว ๆ นี้กลายเป็นเสียง ว่าช่วงหลัก Mode ล้มเหลว คือ:

  1. ผู้ใช้เปิดใช้งานการระงับเสียงใน OBS
  2. ผู้ใช้ยังเปิดใช้งานปลั๊กอินเครื่องเปลี่ยนเสียงใน DAW หรือแอปพลิเคชันแยก
  3. เครื่องเปลี่ยนเสียง DAW ประมวลผลไมโครโฟนดิบเป็นครั้งแรก จากนั้นการระงับเสียง OBS ทำงานบนเสียงที่เปลี่ยนแปลง
  4. ตัวระงับเสียง ประสบเนื้อหาสเปกตรัมไม่คุ้นเคยจากเสียงที่เปลี่ยน pitch ลบบางส่วนไปพร้อมกับเสียง

หากคุณเรียกใช้ทั้งสองคุณลักษณะผ่านแอปพลิเคชันแยก ให้แน่ใจว่าสัญญาณไมโครโฟนสะอาดไปยังตัวระงับเสียงเป็นอันดับแรก จากนั้นจึงไปยังเครื่องเปลี่ยนเสียง VoxBooster sidesteps สิ่งนี้โดยสิ้นเชิงเนื่องจากทั้งสองคุณลักษณะถูกรวมเข้ากับแอปพลิเคชันเดียวที่มีลำดับที่ถูกต้องคงที่

สำหรับผู้สตรีมมิงเรียกใช้กล้องเสมือน OBS และเอฟเฟกต์เสียงพร้อมกัน ให้ดูคำแนะนำเกี่ยวกับ วิธีใช้เครื่องเปลี่ยนเสียงบน Discord สำหรับการตั้งค่าการเส้นทางแบบเต็ม

ระงับเสียง Built-In Discord ทำให้ซอฟต์แวร์เฉพาะซ้ำซ้อนหรือไม่

Discord ให้สามระดับของการระงับเสียง (ไม่มี ต่ำ สูง) และสลับยกเลิกเสียงสะท้อนในการตั้งค่า Voice & Video สิ่งเหล่านี้ใช้การรวมกันของการยกเลิกเสียงสะท้อน WebRTC และ denoiser ที่ใช้ ML ที่ใช้กับสัญญาณขาเข้าของคุณในไคลเอนต์

ระงับเสียง Discord ดีสำหรับการโทรแบบสั่งซื้อ ข้อ จำกัด ของมัน:

  • ใช้กับแอปพลิเคชัน Discord เท่านั้น - ไม่มีประโยชน์ใน OBS เกม หรือแอปพลิเคชันอื่น ๆ
  • คุณไม่สามารถควบคุมว่ามันนั่งที่สัมพันธ์กับการประมวลผลอื่น
  • มันแสดงผลเฉพาะในเอาต์พุต Discord ของตัวเอง - การบันทึกสตรีมของคุณผ่าน OBS ไม่ได้รับประโยชน์
  • ที่ระดับ “สูง” บางโทนเสียง (โดยเฉพาะเสียงหญิงที่สูงขึ้น) ฟังอย่างเห็นได้ชัดว่าได้รับการประมวลผล

ปิดระงับเสียง Discord เมื่อใช้ซอฟต์แวร์เฉพาะเพื่อหลีกเลี่ยงการประมวลผลแบบสองครั้ง ซึ่งลดคุณภาพเสียง ยกเลิกเสียงสะท้อน Discord สามารถอยู่อย่างอิสระ หากคุณต้องการ

ประเมินคุณภาพการระงับเสียง

คุณจะตัดสินใจได้อย่างไรว่าการตั้งค่าของคุณมีการทำงานจริง ๆ? บันทึกคลิป 30 วินาทีด้วยไมโครโฟนบนเดสก์ พูดตามธรรมชาติขณะที่แหล่งเสียงของคุณทำงาน (พัดลม AC แป้นพิมพ์) จากนั้นปิดเสียงตัวเองกลางประโยคเป็นเวลา 5 วินาทีเพื่อจับพื้นเสียง

ตรวจสอบ:

  • พื้นเสียง (ส่วนเงียบ 5 วินาที) - อย่างเหมาะสมต่ำกว่า -50 dBFS ต่ำกว่า -60 dBFS ยอดเยี่ยม
  • ความชัดเจนของเสียง - คุณ sibilant (เสียง S) ยังคงฟังธรรมชาติหรือเสียงเสียดสี/ประมวลผล?
  • การรักษาพยัญชนะ - พูดคำที่มีเสียง P T K เสียงที่คมชัดหรือค่อนข้าง muffled?
  • สิ่งประดิษฐ์การเปลี่ยนแปลง - ขวาเมื่อคุณเริ่มพูดหลังจากเงียบ เสียงป๊อปปราศจากความทะเยอทะยาน หรือมีการคลิกสั้น ๆ?

หากคุณผ่านการตรวจสอบทั้งสี่ การระงับเสียงของคุณปรับแต่งได้ดี ปรับความแรงลดลงหากคุณได้ยินการเสื่อมคุณภาพเสียง ปรับสูงขึ้นหากการทดสอบพื้นเสียงอยู่เหนือ -40 dBFS

สำหรับเพิ่มเติมเกี่ยวกับ พื้นฐานของการระงับเสียงเสียง บทความ Wikipedia เกี่ยวกับการลดเสียง ครอบคลุมพื้นหลังการประมวลผลสัญญาณในความลึกที่สามารถอ่านได้ หน้า โครงการ RNNoise มีเสียง demo แบบโต้ตอบเปรียบเทียบบันทึก filtered และ unfiltered

การรวมการระงับเสียงกับคุณสมบัติเสียงอื่น ๆ

ระงับเสียง pairs ดีกับขั้นตอนการประมวลผลเพิ่มเติมเหล่านี้:

  • เกตเสียง - วางหลังตัวระงับเป็นเส้นป้องกันครั้งที่สอง Gate เงียบเสียงคงที่ตกค้างในระหว่างการหยุดชั่วคราวที่ตัวระงับลดลงแต่ไม่ขจัด ตั้งค่าเกตเกณฑ์เพียงเหนือระดับพื้นเสียงที่ระงับ
  • การบีบอัด - หลังจากระงับและการชักระวาง บีบอัดอ่อน (3:1 อัตราส่วน slow attack) เสียงเรียบวลีสัญญาณโวคัลของคุณโดยไม่ re-amplifying เสียง เนื่องจากเสียงถูกลบออกแล้ว การบีบอัดจึงทำงานเพื่อ ความสะอาด
  • เอฟเฟกต์เสียง - สุดท้ายในห่วงโซ่ pitch shift resonance และเอฟเฟกต์อักขระทั้งหมดให้ผลลัพธ์ที่ดีกว่าบนสัญญาณสะอาดและระงับ

หากคุณยังใช้การระงับเสียงพร้อมกับ soundboard โปรดทราบว่าเสียง soundboard มักจะข้ามห่วงโซ่ไมโครโฟนอย่างสมบูรณ์ - มันเส้นทางโดยตรงไปยังเอาต์พุตเสมือน ซึ่งหมายความว่าการระงับเสียงไม่ส่งผลกระทบต่อเสียง soundboard ซึ่งเป็นพฤติกรรมที่ถูกต้อง

คำถามที่พบบ่อย

ฉันจะลบเสียงรบกวนเบื้องหลังออกจากไมโครโฟนของฉันได้อย่างไร

เส้นทางที่มีประสิทธิภาพมากที่สุดคือซอฟต์แวร์ระงับเสียงเฉพาะ ซึ่งประมวลผลสัญญาณไมโครโฟนของคุณในเวลาจริงก่อนที่จะไปถึง Discord OBS หรือแอปพลิเคชันอื่น ๆ เครื่องมือเช่น VoxBooster ใช้การกรองตามปัญญาประดิษฐ์ที่ระดับระบบ ดังนั้นทุกแอปพลิเคชันจึงได้รับประโยชน์โดยอัตโนมัติโดยไม่ต้องมีการกำหนดค่าต่อแอปพลิเคชัน

ซอฟต์แวร์ระงับเสียงที่ดีที่สุดสำหรับการสตรีมมิงคืออะไร

ขึ้นอยู่กับฮาร์ดแวร์และเวิร์กโฟลว์ของคุณ ผู้สตรีมที่ต้องการให้แอปพลิเคชันเดียวจัดการระงับเสียง เอฟเฟกต์เสียง และบอร์ดเสียงพร้อมกันมักชอบ VoxBooster ผู้ที่อยู่ในระบบนิเวศ OBS แล้วมักจะเริ่มต้นด้วยตัวกรอง RNNoise ในตัว ก่อนตัดสินใจอัปเกรดเป็นเครื่องมือเฉพาะ

ซอฟต์แวร์ระงับเสียงเพิ่มความล่าช้าหรือไม่

ใช่ แต่การใช้งานสมัยใหม่ทำให้มันต่ำมาก RNNoise เพิ่ม 10 มิลลิวินาที โดยประมาณ ตัวกรอง AI/ML ที่มีประสิทธิภาพมากขึ้นจะเพิ่ม 10-30 มิลลิวินาที ขึ้นอยู่กับขนาดชิ้นและความซับซ้อนของโมเดล สำหรับเสียงสด เรื่องนี้ไม่มีการรับรู้ โมเดลลบเสียงที่หนักกว่าที่ออกแบบมาสำหรับ post-production สามารถเพิ่ม 100 มิลลิวินาที ขึ้นไป และไม่เหมาะสำหรับการใช้งานแบบเรียลไทม์

ความแตกต่างระหว่างการระงับเสียงและการยกเลิกเสียงคืออะไร

การระงับเสียงกรองเสียงที่ไม่ต้องการออกจากสัญญาณไมโครโฟนในซอฟต์แวร์ - มันวิเคราะห์เสียงและลดความเสีย ทำให้ความถี่ที่ไม่ใช่เสียง การยกเลิกเสียง (เช่นในหูฟัง ANC) ใช้ไมโครโฟนทางกายภาพและลำโพงเพื่อสร้างคลื่นเสียงผกผันที่ยกเลิกเสียงทางอะคูสติก ทั้งคู่มีจุดมุ่งหมายเพื่อให้ได้ผลลัพธ์เดียวกันผ่านวิธีการที่แตกต่างกันมาก

การระงับเสียงทำงานกับไมโครโฟนใด ๆ หรือไม่

ใช่ การระงับเสียงตามซอฟต์แวร์อยู่ในห่วงโซ่การประมวลผลเสียงหลังจากขั้นตอน ADC ดังนั้นจึงใช้งานได้กับ USB mic อินเตอร์เฟส XLR ไมโครโฟนในตัวแล็ปท็อป และ mic ชุดหูฟัง ไมโครโฟนที่ดีกว่าให้ป้อนข้อมูลที่สะอาดกว่าให้กับอัลกอริทึม แต่แม้แต่ไมโครโฟนแล็ปท็อปที่มีเสียงดังก็ยังคงเห็นการปรับปรุงที่ชัดเจน

การระงับเสียงจะส่งผลต่อคุณภาพเสียงของฉันหรือไม่

การระงับเสียงจากน้อยไปปานกลางมีผลกระทบน้อยต่อเสียง การตั้งค่าที่เข้มงวดหรือ อัลกอริทึมคุณภาพต่ำสามารถทำให้เสียงฟังเหมือนเปียก เหมือนหุ่นยนต์ หรือตัด กุญแจคือการปรับความแรงของการระงับเสียงให้เหมาะสมกับสภาพแวดล้อมของคุณ - เพียงพอที่จะฆ่าพื้นเสียง ไม่มากจนกว่าอัลกอริทึมจะเริ่มกินพยัญชนะ

ฉันสามารถใช้การระงับเสียงและเครื่องเปลี่ยนเสียงในเวลาเดียวกันได้หรือไม่

ใช่ และลำดับก็มีความสำคัญ การระงับเสียงจะต้องรันก่อน ก่อนที่เครื่องเปลี่ยนเสียงจะประมวลผลสัญญาณ หากคุณรวมมันไว้ด้วยกันในลำดับที่ผิด เครื่องเปลี่ยนเสียงจะสร้างสิ่งประดิษฐ์ฮาร์มอนิกใหม่ที่ตัวระงับจะพยายามลบออก ซึ่งจะลดคุณภาพ VoxBooster จัดการลำดับที่ถูกต้องภายในตัวเอง ดังนั้นคุณจึงไม่ต้องจัดการด้วยตนเอง

บทสรุป

การลบเสียงรบกวนเบื้องหลังออกจากไมโครโฟนของคุณไม่ใช่การแก้ไขการตั้งค่าเดียว - มันต้องการความเข้าใจว่าการระงับเสียงนั่นอยู่ในห่วงโซ่ของคุณ เทคโนโลยีใดจัดการกับประเภทเสียงไหน และวิธีปรับความแรงโดยไม่ลดคุณภาพเสียง เส้นทางฟรี (RNNoise ใน OBS) ครอบคลุมมากมายและเป็นค่าตัดสินได้ถึงแม้ว่าคุณวางแผนในการย้ายไปที่ซอฟต์แวร์เฉพาะต่อไป สำหรับปกคลุมทั่วระบบ การจัดการแป้นพิมพ์และเสียงสะท้อน และการรวมกับเอฟเฟกต์เสียง เครื่องมือเฉพาะจึงจ่ายสำหรับตัวของมันเอง

VoxBooster รวม AI-based noise suppression เป็นขั้นตอนการประมวลผล first-stage ในตัว ซึ่งหมายความว่าการทำความสะอาดไมโครโฟนของคุณก่อนเอฟเฟกต์เสียง soundboard routing หรืออย่างอื่นที่สัญญาณ ไม่ว่าคุณจะสตรีมมิง ใน Discord calls หรือในการประชุม video คน มันจึงทำงานบนทุกแอปพลิเคชันพร้อมกันผ่านอุปกรณ์ไมโครโฟนเสมือนเดียว ตรวจสอบ หน้า pricing สำหรับตัวเลือกแผน

ดาวน์โหลด VoxBooster - ทดลอง 3 วันฟรี ไม่จำเป็นต้องมีบัตรเครดิต

ลอง VoxBooster — ทดลองใช้ฟรี 3 วัน

โคลนเสียงเรียลไทม์ ซาวด์บอร์ด และเอฟเฟกต์ — ทุกที่ที่คุณคุย

  • ไม่ต้องใช้บัตรเครดิต
  • ความหน่วง ~30ms
  • Discord · Teams · OBS
ลองฟรี 3 วัน