Voice Changer สำหรับ Audacity: คำแนะนำกระบวนการทำงานแบบสมบูรณ์

ใช้ voice changer กับ Audacity 3.6+ ผ่านอินพุต low-latency audio capture, โคลนเสียง AI และการส่งออกส่วนอักษรข้อความ Whisper สำหรับเพียงดนตรีสดและผู้คลั่งไคล

Voice Changer สำหรับ Audacity: คำแนะนำกระบวนการทำงานแบบสมบูรณ์

Audacity เป็น DAW เริ่มต้นสำหรับส่วนใหญ่ของโลกพอดแคสต์ — ฟรี ได้รับการทดสอบ และมีความสามารถจริงสำหรับการทำงานด้านเสียง สิ่งที่ไม่ได้ทำอย่างเป็นธรรมชาติคือการปรับเปลี่ยนเสียงของคุณในเวลาจริง ช่องว่างนั้นคือที่ที่ voice changer ภายนอกเข้ามา และการรวมนั้นสะอาดกว่าที่คนส่วนใหญ่คาดหวัง

คำแนะนำนี้ไปไปจนจบกระบวนการทำงานแบบสมบูรณ์: การกำหนดทางของ voice changer ไปยัง Audacity ผ่าน low-latency audio capture การบันทึก track ที่ประมวลผล การประมวลผลภายหลังด้วยเอฟเฟกต์ในตัว Audacity การใช้โคลนเสียง AI สำหรับตัวละคร และการส่งการบันทึกขั้นสุดท้ายผ่าน Whisper สำหรับส่วนอักษรข้อความบันทึกรายการ


TL;DR

  • Audacity บันทึกอินพุตที่เข้ากันได้กับ low-latency audio capture ใดก็ตาม — voice changer ของคุณกลายเป็นอุปกรณ์บันทึกที่เลือกได้
  • ตั้งค่า voice changer เป็นแหล่งอินพุตในแถบเครื่องมืออุปกรณ์ Audacity; ไม่จำเป็นต้องมีปลั๊กอินหรือส่วนขยายภายใน Audacity
  • เรียกใช้โซ่ Noise Reduction + EQ Audacity หลังการบันทึกเพื่อให้ได้เสียงสุดท้ายที่สะอาด
  • โคลนเสียง AI ช่วยให้คุณสามารถบันทึกตัวละครที่ฟังดูแตกต่างกันอย่างสิ้นเชิง ไม่ใช่เพียงการเปลี่ยน pitch
  • การถอดเสียง Whisper บน WAV ที่ส่งออก สร้างบันทึกรายการในเล็บน้อย
  • กระบวนการทำงานแบบสมบูรณ์ทำงานบนเครื่อง Windows 10/11 ใดก็ตามโดยไม่ต้องมีไดรเวอร์ kernel ที่จะติดตั้ง

ทำไม Audacity ยังคงเป็นตัวเลือกแนะนำสำหรับ Podcasters Indie

Audacity มีอยู่มาตั้งแต่ปี 2000 และยังคงครอบครองพื้นที่พอดแคสต์ indie ด้วยเหตุผลง่ายๆ: ฟรีทั้งหมด ทำงานบนทุกสิ่ง และทำทุกอย่างที่พอดแคสเตอร์ที่เน้นเสียงจริง ๆ ต้องการ เวอร์ชัน 3.6 (ปล่อยในปลายปี 2024) เพิ่มการปรับปรุงการตรวจสอบเรียลไทม์และปรับปรุงการสนับสนุนโฮสต์ low-latency audio capture ที่ทำให้การกำหนดทางเสียงของบริษัทอื่นเชื่อถือได้มากขึ้นอย่างมีนัยสำคัญ

รูปแบบโอเพนซอร์ส ไม่มีการสมัครสมาชิก ไม่มีประตูคุณสมบัติ และไม่มีการพึ่งพา cloud ไป คำว่า Hobbyist ที่เรียกใช้รายการรายสัปดาห์ด้วยงบประมาณจำกัด หรือนักดนตรีที่บันทึก demo vokal ไป โปรไฟล์ต้นทุนศูนย์นั้นมีความสำคัญ คุณสมบัติคือ Audacity ไม่มีการแปลงเสียงเนทีฟ: ก็บันทึกสิ่งที่ได้รับ ประมวลผล หลังจากนั้น และส่งออกเสียงที่สะอาด ผลกระทบแบบไดนามิก เกิดขึ้นนอกมัน

ข้อ จำกัด นั้นจริง ๆ แล้ว เป็นข้อดีของกระบวนการทำงาน เมื่อคุณเข้าใจ Audacity กลายเป็นชั้นการแก้ไขและการส่งออก เครื่องมือแยกต่างหาก จัดการการแปลงเสียงแบบเรียลไทม์ ส่วนประกอบทั้งสองมีความเป็นอิสระ — คุณสามารถสลับอื่น ๆ ได้โดยไม่รบกวนอีกอัน


ทำความเข้าใจ low-latency audio capture: ทำไมมันถึงมีความสำคัญสำหรับ Workflow นี้

low-latency audio capture (Windows Audio Session API) เป็นชั้นอินเทอร์เฟซเสียง latency ต่ำของ Microsoft ซึ่งแนะนำใน Vista และปรับปรุงอย่างมีนัยสำคัญตลอด Windows 10 และ 11 มันอยู่ระหว่างแอปพลิเคชันและฮาร์ดแวร์เสียง การประมวลผลเสียงในพื้นที่ผู้ใช้โดยไม่ต้องมีไดรเวอร์ระดับ kernel

สำหรับพอดแคสเตอร์และนักดนตรี low-latency audio capture มีความสำคัญเพื่อสองเหตุผล:

  1. Latency ที่ต่ำกว่าอินเทอร์เฟซ MME/DirectSound ที่เก่ากว่า — โดยทั่วไป 5-15 ms เทียบกับ 50+ ms สำหรับ MME ในการตรวจสอบเสียงของคุณเองในขณะบันทึก ความแตกต่างนี้ได้ยินได้
  2. การบันทึก loopback low-latency audio capture — คุณสามารถจับเสียงใดก็ตามที่เล่นผ่าน Windows รวมถึงผลลัพธ์ของ voice changer เป็นอินพุตบันทึกใน Audacity เนื่องจากนี่คือกลไก ที่ทำให้ทั้งกระบวนการทำงานเป็นไปได้

ในแถบเครื่องมืออุปกรณ์ Audacity (แถวของ dropdowns ที่ด้านบน) คุณสามารถตั้งค่า Host เป็น Windows low-latency audio capture สิ่งนี้ปลดล็อก low-latency audio capture exclusive mode (latency ต่ำสุด) และอุปกรณ์ loopback low-latency audio capture ใน dropdown อินพุต แอปพลิเคชันใด ๆ ที่ผลลัพธ์เป็นอุปกรณ์ low-latency audio capture — รวมถึง voice changers ที่สร้างจุดสิ้นสุดเสียงเสมือน — จะปรากฏที่นี่


ตั้งค่า Voice Changer ของคุณเป็นอินพุต Audacity

Setup ใช้เวลาประมาณสองนาที:

  1. ติดตั้งและเปิดใช้งาน voice changer ของคุณ ตรวจสอบให้แน่ใจว่ามันกำลังทำงานและประมวลผลเสียงจากไมโครโฟนของคุณ ก่อนเปิด Audacity

  2. เปิด Audacity ในแถบเครื่องมืออุปกรณ์ ตั้งค่า Host เป็น Windows low-latency audio capture

  3. คลิก dropdown อุปกรณ์บันทึก คุณจะเห็นไมโครโฟนทางกายภาพของคุณและอุปกรณ์เสมือน ใดก็ตามที่สร้างโดย voice changer หากตัวเปลี่ยนเสียง ใช้จุดสิ้นสุดเสมือน low-latency audio capture ก็ปรากฏที่นี่ตามชื่อ

  4. เลือกอุปกรณ์เอาต์พุตของ voice changer ซึ่งอาจมีป้ายกำกับว่า “Voice Changer Output” หรือชื่อแอปพลิเคชัน ขึ้นอยู่กับเครื่องมือ

  5. บันทึกคลิป test สั้น เล่นกลับเพื่อยืนยันว่าคุณกำลังฟังเสียงที่ประมวลผล ไม่ใช่สัญญาณไมโครโฟนดิบ

หากอุปกรณ์ไม่ปรากฏ ให้ตรวจสอบสองสิ่ง: voice changer ต้องทำงานอย่างแข็งขัน และต้องตั้งค่าเป็นอุปกรณ์เล่นหลัก หรือเปิดใช้งานอย่างชัดแจ้งในการตั้งค่า Sound Windows เครื่องมือบางตัวต้องให้คุณตั้งค่าอุปกรณ์เสมือนของพวกเขาเป็นค่าเริ่มต้นระบบเพื่อให้ loopback low-latency audio capture เปิดเผยมัน

เครื่องมือที่ใช้ injection low-latency audio capture แทนอุปกรณ์เสมือน — ซึ่งเป็นวิธีการของ VoxBooster — ทำงานแตกต่าง: พวกเขากระตุกเข้าสู่เสียง Windows เพื่อให้ Audacity เห็นไมโครโฟนกายภาพของคุณเป็นอินพุต แต่เสียงที่มาผ่านมันได้รับการประมวลผลแล้ว ในกรณีนี้ เลือกไมโครโฟนกายภาพของคุณใน Audacity และคุณจะบันทึกสัญญาณที่เปลี่ยนแปลงโปร่งใส


บันทึก Sessio ของคุณใน Audacity

ด้วยการกำหนดทางของ voice changer ที่ยืนยัน การปฏิบัติการบันทึก Audacity มาตรฐาน นำไปใช้ การตั้งค่า บางส่วนปรับปรุงสำหรับเสียง:

Sample rate: 44.100 Hz ครอบคลุมความถี่เสียงพูดด้วยห้องพิเศษ 48.000 Hz ก็ได้เช่นกัน — ใช้อย่างไร ้ interface ของคุณสนับสนุนอย่างเป็นธรรมชาติเพื่อหลีกเลี่ยง resampling

Bit depth: บันทึกที่ 32-bit float Audacity ทำงานภายในใน 32-bit float ไม่ว่าจะ ดังนั้นการจับคู่มันจะหลีกเลี่ยงขั้นตอนการแปลง และรักษา headroom สำหรับการประมวลผลภายหลัง EQ และการบีบอัด

Monitoring: เปิดใช้งานการตรวจสอบ overdub (Shift+click ปุ่มบันทึก) เพื่อให้คุณได้ยินเสียงที่ประมวลผลแบบเรียลไทม์ขณะบันทึก ตั้งค่าปริมาณการตรวจสอบเพื่อป้องกันการ ป้อนกลับ

Room acoustics: ตัวเปลี่ยนเสียง ไม่ได้แก้ไขห้องกล่อง ตู้เสื้อผ้าที่มีเสื้อผ้า หรือตัวกรองการสะท้อนแสง ด้านหลังไมโครโฟน ทำให้เกิดความแตกต่างมากขึ้นกับคุณภาพการบันทึกขั้นสุดท้าย มากกว่าโซ่ประมวลผลใด ๆ


Post-Processing ใน Audacity: Standers Voice Chain

เมนู Effect ของ Audacity มีทุกอย่างที่จำเป็นเพื่อทำให้การบันทึก raw ไปยังเสียง release-ready ห่วงโซ่นี้จัดการวัสดุเสียงส่วนใหญ่:

ขั้นตอนที่ 1 — Noise Reduction

หากตัวเปลี่ยนเสียง ไม่ได้ระงับเสียงรบกวนพื้นหลังก่อนการบันทึก ให้ทำที่นี่ก่อน บันทึกสอง วินาทีของ room tone (ความเงียบพร้อมไมโครโฟน live) ที่จุดเริ่มต้นของแต่ละเซสชัน เลือก region นั้น ไปที่ Effect > Noise Reduction คลิก Get Noise Profile จากนั้นเลือกการบันทึก เต็มรูปแบบ และใช้เอฟเฟกต์ด้วย Reduction ประมาณ 12 dB Sensitivity ที่ 6 และ Frequency smoothing ที่ 3

หากตัวเปลี่ยนเสียงของคุณ ได้จัดการการเก็บอักษรรข สไลด์นี้ — การซ้อน starch สองขั้นของการลด noise ลดปลอก ละครเสียง

ขั้นตอนที่ 2 — Normalize

Effect > Normalize ไป -1 dB peak ซึ่งจะนำการบันทึกที่เงียบขึ้นไปยังระดับที่สอดคล้องกันโดยไม่มีการตัดขาด เรียกใช้มีสักครู่ก่อนการบีบอัด เพื่อให้ compressor มองไป ระดับสัญญาณที่คาดเดาได้

ขั้นตอนที่ 3 — Equalization (Filter Curve EQ)

Effect > Filter Curve EQ ให้คุณ parametric EQ ภายใน Audacity สำหรับเสียง:

  • High-pass filter ที่ 80-100 Hz เพื่อตัด rumble ความถี่ต่ำ
  • Slight boost (2-3 dB) ประมาณ 2-4 kHz สำหรับการปรากฏตัว
  • Gentle cut ประมาณ 400-600 Hz หากการบันทึก เสียงกล่อง

หาก คุณบันทึกเสียงที่โคลนโดย AI แนวโน้มความถี่ของเสียงเป้าหมาย แล้วโคมสีพบในสัญญาณที่ประมวลผล ไป feather ด้วย EQ — คุณปรับปรุงห้อง ไม่ได้ร่างละคร เสียง

ขั้นตอนที่ 4 — Compression

Effect > Compressor ที่ไป ratio 3:1 threshold ประมาณ -18 dB attack 0.2 ms decay 1 วินาที สิ่งนี้ทำให้ dynamic range ด้วย sluice ดังนั้นผู้ฟังจึง ไม่ได้ขี่ต้นไม้ปริมาณ สำหรับเสียงโคลนที่มีพลัง เนื้อแน่นอน consistent มากกว่า ธรรมชาติ การบีบอัด lower ratios (2:1 ลดน้อยลง) มักเสียง มากเป็นธรรมชาติ

ขั้นตอนที่ 5 — Loudness Normalization

ปพ็อตแบบฟอร์ม (Spotify Apple Podcasts) ที่ -16 LUFS integrated สำหรับ mono หรือ -14 LUFS สำหรับ stereo Effect > Loudness Normalization ช่วยให้คุณชี้ไป ค่า นี้โดยตรง เรียกใช้นี้ เป็นขั้นตอนสุดท้ายก่อน export


Cloning เสียง AI สำหรับตัวละครัย

AI voice cloning use case แตกต่างจาก pitch shifter หรือเอฟเฟกต์ robot แทนที่จะ warp ทางคณิตศาสตร์เสียงของคุณ ก็ cartographer โรม บรรยาย ไป hồ sơ เสียง เป้าหมาย ภาค real-time — bảo preservation articulation และ timing ขณะ tuyến إن một ได้ยิน คำพูด เสียง

สำหรับ indie podcasters โลก็เปิดอย่างเฉพาะเจาะจง: ตัวละคร เสียง โดยไม่ voice acting skill ต่อเนื่อง shew แนะ ส่วน มีรูป persona แตก tamanho Ř fic fiction ดำหรือตัว ต่อ orang Tertentu ชุด บทช่วย คณะ ได้รับประกอบ คำคุณ

Cloning เสียง AI ของ VoxBooster วิ่ง locally บน Windows 10/11 ใ ไม่ cloud การประมวลผล ไม่ เสียง เด เครื่อง Latency ภายใต้ 300 ms จริง-คือ ซึ่ง ไม่ยืม ใน ไปยัง บันทึก บริหาร (ที่ live การไหลในแนว คบ 200-500 ms) เนื่องจาก ก็ใช้ injection low-latency audio capture มากกว่า kernel driver Windows โต้ เป็น tiêu เสียง สื่อ Audacity merelak ว ไหนป เสียงสะอาด

Alur ker ทำงาน: activate โคลนแนว เสียง ได้ละคร ภาค VoxBooster ก่อน โครงการระดับ record ใน Audacity คำดำ เรียกเล่น ขอการ สำเร็จ track ตะปรับชั้น ช ชั้นเหนือมี subbr ตรวจสอบชั้นชั้นเสียง


Whisper Dossier องค์ประกอบสำหรับบันทึก Chap

Whisper เป็นที่เปิด source ลี ร อ openนี้ ML จ พึ่ง ยิน ให้พอดแคสเตอร์เท ร ดรรม ยู้ สรัปถ มช โปรกลม นี้-บ บ

เพื่อ QED:

  1. Export เสร็จสิ้นโครงการ Audacity ร สิ่ง WAV หรือ FLAC ไฟล์ (File > Export Audio)
  2. เรียกใช้ ไฟล์ Export ผ Whisper โดย ต ตัวอักษร ร-land ทักษะทั่ว ว ภาษา บันทึก เพศต 3 ร 4 ปรด soportar์องให้

มีน ช squ ส จาก Whisper ไปต Eur ร(.) นายก ไป ‘t ร-ตัวอักษร ‐

ไป ใกลรณพบปรมาณริเตร Ler หเก า บบต ทำช்ங สล ชั ( หอบท ละครพวต

ชั้นห เปิ usé r شال้ะทำสำ้บควรภ้ะเศษการ्र้าเสียง ร Whisper เป นสำเร็จน

Track Label Audacity และ Timestamps

Label tracks Audacity อนุญาต mark เขตพบง้าง เท เยสป̀ บ ตัด ฟ. Label ชั้น export ท .txt ล่ร่อง อ เลขเก alas ืจ อ podcast กรม markers ว คำ์ (Overcast Pocket Casts) เ ສ็บช

ชั้นชนัยจ ชั้ว ม หุท กร Whisper และ track Label Audacity ืด ชั้นท้อมด

ลอง VoxBooster — ทดลองใช้ฟรี 3 วัน

โคลนเสียงเรียลไทม์ ซาวด์บอร์ด และเอฟเฟกต์ — ทุกที่ที่คุณคุย

  • ไม่ต้องใช้บัตรเครดิต
  • ความหน่วง ~30ms
  • Discord · Teams · OBS
ลองฟรี 3 วัน