คำแนะนำ Voice Changer บัญชีแอฟริกาใต้

เชี่ยวชาญในการออกเสียงภาษาอังกฤษแอฟริกาใต้: คุณลักษณะพยัญชนะศาสตร์, การตั้งค่า DSP, ขั้นตอนการโคลนเสียง AI และการตั้งค่า mod เสียง saffa สำหรับ Discord และ OBS

คำแนะนำ Voice Changer บัญชีแอฟริกาใต้

ภาษาอังกฤษแอฟริกาใต้เป็นหนึ่งในภาษา ที่มีคุณลักษณะพยัญชนะศาสตร์สมบูรณ์ที่สุดและชั้นสังคมที่สุดในโลกที่พูดภาษาอังกฤษ - และเป็นหนึ่งในสิ่งที่เป็นตัวแทนผิดได้ที่สุดในสื่อ Voice Changer บัญชีแอฟริกาใต้ ต้องมีมากกว่าปุ่ม pitch เพื่อทำให้ถูกต้อง คำแนะนำนี้ครอบคลุมพยัญชนะศาสตร์ที่คุณต้องเข้าใจ, การตั้งค่า DSP ที่พาคุณไปเกือบทั้งหมด และขั้นตอนการโคลน AI ที่ให้ mod เสียง saffa ที่น่าเชื่อถือได้อย่างแท้จริงในเวลาจริง


TL;DR

  • ภาษาอังกฤษแอฟริกาใต้ (SAE) มีคุณลักษณะพยัญชนะศาสตร์ที่แตกต่างกันหลายประการ: สระ KIT ที่เข้มข้น, Kit-Bit split, สระ TRAP ยกขึ้น, และ prosody ที่ถูกตัดทะลุ
  • ประเภท SAE ที่แตกต่างกันมีอยู่ - SAE ขาว, SAE ดำ, SAE อินเดีย, SAE ที่มีแอฟริกัน - และแต่ละประเภทมีโปรไฟล์พยัญชนะศาสตร์ที่แตกต่างกัน; หลีกเลี่ยงการปฏิบัติต่อพวกเขาเป็นอันหนึ่ง
  • ข้อมูลอ้างอิงที่โด่งดัง: Charlize Theron (มีแอฟริกัน), Trevor Noah (ผสม Cape/Joburg), Elon Musk (บันทึกเก่า ๆ ก่อนการเปลี่ยนแปลง US)
  • การตั้งค่า DSP สามารถประมาณลักษณะแห้ง ๆ ของการออกเสียง; การโคลนเสียง AI จับลักษณะนั้นได้อย่างถูกต้อง
  • VoxBooster รองรับการแปลงเสียง AI แบบเรียลไทม์ผ่านการจับภาพเสียง low-latency ที่ sub-300ms บน Win10/11, ไม่จำเป็นต้องใช้ไดรเวอร์เคอร์เนล

ภาษาอังกฤษแอฟริกาใต้: มากกว่าหนึ่งการออกเสียง

ก่อนที่จะแตะสิ่งใดก็ตาม สิ่งที่สำคัญที่สุดที่ต้องเข้าใจเกี่ยวกับ ภาษาอังกฤษแอฟริกาใต้ คือ “การออกเสียงแอฟริกาใต้” ไม่ใช่สิ่งเดียว แอฟริกาใต้มีสิบเอ็ดภาษาราชการ และ SAE สะท้อนถึงความหลากหลายนั้น:

  • ภาษาอังกฤษแอฟริกาใต้ของคนผิวขาว (WSAE): ได้รับการบันทึกอย่างครบถ้วนที่สุดในวรรณกรรมวิชาการ เชื่อมโยงทางประวัติศาสตร์กับผู้พูดสองภาษาแอฟริกัน (SAE ที่มีแอฟริกัน) และผู้พูดที่มีอังกฤษเป็นหลัก มี Kit-Bit split, สระ KIT ที่เข้มข้น, และ TRAP ยกขึ้น
  • ภาษาอังกฤษแอฟริกาใต้ของคนผิวดำ (BSAE): พูดเป็นภาษาที่สอง หรือที่สามโดยผู้พูดจำนวนมากที่มีภูมิหลังภาษา Bantu เช่น Zulu, Xhosa, Sotho หรืออื่น ๆ ลักษณะเด่นด้วยรูปแบบจังหวะที่แตกต่างกัน, การถ่ายโอนสระจากภาษา Bantu และการออกเสียงพยัญชนะที่แตกต่างกัน
  • ภาษาอังกฤษแอฟริกาใต้อินเดีย (ISAE): รวมตัวกันใน KwaZulu-Natal (ภูมิภาค Durban), สะท้อนให้เห็นอิทธิพล Tamil, Telugu, Hindi และ Urdu มี intonation ที่เป็นทางของตัวเอง, ระบบสระ, และอุดมศักดิ์คำศัพท์
  • SAE ที่มีแอฟริกัน: พูดโดยผู้พูดสองภาษาที่มีแอฟริกัน เป็นหลัก แสดงการแทรกแซงจากเสียงแอฟริกัน - รวมถึง /r/ uvular, final devoicing และการถ่ายโอนสระที่มีลักษณะเฉพาะ
  • ภาษาอังกฤษ Cape Flats: ประเภทเมืองจากไคพ์ที่เกี่ยวข้องกับชุมชนผู้มีสีผิว มีรูปแบบสระและ prosody ที่แตกต่างกัน

คำแนะนำนี้เน้นไปที่คุณลักษณะพยัญชนะศาสตร์ที่เชื่อมโยงกับ WSAE และ SAE ที่มีแอฟริกัน เนื่องจากเป็นที่เก็บไว้ที่สุด สำหรับการฝึกอบรมเสียง แต่การมีส่วนร่วมที่เคารพต่อการออกเสียงหมายความว่าต้องยอมรับความกว้างนี้


คุณลักษณะพยัญชนะศาสตร์หลักของภาษาอังกฤษแอฟริกาใต้

สระ KIT และ Kit-Bit Split

คุณลักษณะที่โดดเด่นที่สุดของประเภท SAE บางประเภท คือว่าสระสั้น /i/ (เช่นใน “kit”, “bit”, “sit”) ทำงานอย่างไร ในการออกเสียงหลาย SAE สระนี้ เข้มข้น - ฟังใกล้เคียงกับ schwa /a/ มากกว่า /i/ หน้าที่ได้ยินใน British RP หรือภาษาอังกฤษอเมริกัน

Kit-Bit split โดยเฉพาะหมายถึงว่า sentralisasi นี้ใช้อย่างแข็งแกร่งกับพยางค์ที่ไม่มีความเครียด คำที่ลงท้ายด้วย “-ing”, “-ish”, “-it” ในตำแหน่งที่ไม่มีความเครียดจะใช้สระคล้าย schwa มาก ขณะที่คำสระ KIT ที่เครียดยังคงค่อนข้างสูงกว่า นี่คือการ “ทำให้เรียบ” ลักษณะเฉพาะ SAE ในพยางค์ที่ไม่มีความเครียด - “beginning” ฟังเหมือน /ba-ga-nan/ มากกว่า /bi-gi-nin/

TRAP ยกขึ้น

สระ TRAP /ae/ (เช่นใน “trap”, “cat”, “bad”) ถูกยกขึ้นใน SAE - มันเคลื่อนไปยังอาณาเขต /e/ ดังนั้น “cat” ฟังราวกับว่ามันรัก /e/ มากกว่า /ae/ เรียบของอเมริกา นี่คือเครื่องหมายสำคัญที่แยกแยะ SAE จาก Australian English ซึ่งยกขึ้น TRAP เช่นกัน แต่มีคุณลักษณะประกอบที่แตกต่างกัน

”Yes” ถึง “Yis” เปลี่ยน

เกี่ยวข้องกับ TRAP raising และ sentralization KIT คือแนวโน้มทั่วไปในประเภท SAE บางประเภท เพื่อสร้างสระหน้าสั้นในตำแหน่งที่สูงกว่าหรือตรงกลางมากขึ้น ตัวอย่างที่มีอยู่ในอุดมคติ คือ คำว่า “yes” ฟังใกล้เคียงกับ “yis” - ไม่ใช่ /jis/ อย่างแน่นอน แต่มีสระยกขึ้น, ค่อนข้างเข้มข้นมากกว่า /jes/ หรือ /jas/ เปิดของประเภทอื่น

Retroflex และ Bunched /r/

SAE มีการออกเสียง ที่เด่น ในบางประเภท และไม่มีการออกเสียงในบางประเภท แต่ที่ /r/ ปรากฏ มักจะแสดงลักษณะ retroflex หรือ bunched เบา ๆ - ปลายลิ้นม้วนกลับหรือตัวลิ้นกำลัง creating เสียงสีเข้มที่แตกต่างกันเล็กน้อยจาก tap RP ภาษาอังกฤษหรือ retroflex เต็ม ภาษาอังกฤษอเมริกัน SAE ที่มีแอฟริกัน มักมี /r/ uvular หรือ trilled แทน

Prosody: ถูกตัดทะลุและตรงไปตรงมา

Prosody SAE มีแนวโน้มที่จะถูกตัดทะลุและตรงไปตรงมามากกว่า RP ภาษาอังกฤษ - คำกล่าวอ้างมีการออกเสียงโทนเสียงระดับที่ค่อนข้างสม่ำเสมอและการเพิ่มขึ้นขั้นสุดท้ายน้อยกว่า Australian English จังหวะคือ syllable-timed ในประเภท BSAE และ ISAE (สะท้อนให้เห็นอิทธิพล prosody Bantu และเอเชีย) และใกล้เคียงกับ stress-timed ใน WSAE


เสียงข้อมูลอ้างอิงที่โด่งดังของภาษาอังกฤษแอฟริกาใต้

เมื่อสร้างโมเดลเสียงหรือเรียนรู้ phonetic shadowing, เสียงข้อมูลอ้างอิง ความสำคัญ นี่คือสามตัวที่เป็นที่รู้จักกันอย่างกว้างขวาง - พร้อมกับการเตือนที่สัตย์จริงเกี่ยวกับประเภท ที่แต่ละอันแทน

Charlize Theron

Charlize Theron โตขึ้นใน Benoni, Gauteng พูดแอฟริกัน เป็นภาษาแรกของเธอ ภาษาอังกฤษของเธอ - โดยเฉพาะในการสัมภาษณ์ก่อนหน้านี้ก่อนที่จะจมอยู่ใน US เป็นเวลาหลายสิบปี - คือ SAE ที่มีแอฟริกัน: /r/ uvular หรือ trilled, คุณภาพสระที่มีลักษณะเฉพาะ และ prosody carryover แอฟริกัน การพูดปัจจุบันของเธอมีการ Americanization สูง ดังนั้นการสัมภาษณ์ที่เก่ากว่า (ก่อน 2005) คือแหล่งพยัญชนะศาสตร์ที่ดีกว่า

Trevor Noah

Trevor Noah โตขึ้นใน Johannesburg พูด Zulu, Xhosa, อังกฤษ และแอฟริกัน ภาษาอังกฤษของเขาแทน Johannesburg ป่ากลาง - เกษตรกรรม, code-switching มีองค์ประกอบของ BSAE และ WSAE เขาพูดจำนวนน้อยออกเสียงของเขาสำหรับผู้ชมอเมริกัน แต่บันทึก stand-up ของเขา (โดยเฉพาะวัสดุแอฟริกาใต้) แสดง prosody SAE ช่วงเต็ม แหล่งที่ดีสำหรับ intonation SAE ธรรมชาติและรูปแบบ lexical

Elon Musk (บันทึกเก่า ๆ)

Elon Musk โตขึ้นใน Pretoria พูด SAE ที่มีแอฟริกัน บันทึกและการสัมภาษณ์เก่า ๆ (ก่อน 2000) เก็บรักษาสิ่งนี้อย่างชัดเจน - sentralization KIT, TRAP ยกขึ้น และอิทธิพล prosody แอฟริกัน สามารถได้ยิน การพูดปัจจุบันของเขาเป็นสาระสำคัญ General American ที่มีคุณลักษณะ SAE ตกค้างเป็นครั้งคราว ข้อมูลอ้างอิงทางประวัติศาสตร์ที่มีประโยชน์, ไม่ใช่ข้อมูลอ้างอิงร่วมสมัย


การฝึกอบรมพยัญชนะศาสตร์สำหรับการฝึกอบรมการออกเสียงแอฟริกาใต้

หากคุณต้องการให้โมเดลเสียง AI ของคุณมีประสิทธิภาพมากขึ้น หรือหากคุณต้องการฝึกอบรมการผลิต การฝึกอบรมเหล่านี้ แกน ที่ลักษณะ SAE หลัก:

การฝึกอบรม sentralization KIT: ฝึกคำต่อไปนี้, ผลักดัน /i/ ไปยัง schwa: kit, bit, sit, hit, mix, fix, beginning, finishing, sitting บันทึกตัวเอง, จากนั้น เพลงเสียงใหม่ เปรียบเทียบกับข้อมูลอ้างอิง เป้าหมายไม่ใช่ schwa เต็ม แต่เป็นสระ sentralized, ค่อนข้างต่ำกว่าด้านหน้า

TRAP raising การฝึกอบรม: พูด cat, bat, hat, trap, back, black และมีจิตสำนึก เพิ่มสระ ไปยัง /e/ ขากรรไกรของคุณควรเปิดน้อยกว่า /ae/ ของอเมริกา คิด “cet, bet, het” เป็นเป้าหมาย - ไม่ใช่การรวมกันอย่างสมบูรณ์ แต่การเคลื่อนไหวในทิศทางนั้น

Prosody shadowing: เลือก 2 นาทีส่วน Trevor Noah stand-up Shadow มันเล่น, หยุดชั่วคราว, ทำซ้ำ เน้นที่ที่เขาวาง ความเครียด, วิธี ประโยค สิ้นสุด, และจังหวะของพยางค์ ที่ไม่มีความเครียด ของเขา Prosody SAE เรียนรู้ดีที่สุด ผ่าน การเลียนแบบ, ไม่ใช่กฎ

“Yes → Yis” การฝึกอบรม: ฝึก ประโยค สั้น ๆ ใช้ “yes”, “this”, “bit”, “live” (คณุศัพท์), “win” - คำ โดย สระ หน้า สั้น ยก, เข้มข้น ดัง เด่น บันทึก และ เปรียบเทียบ


การตั้งค่า DSP สำหรับ Mod เสียงภาษาอังกฤษแอฟริกาใต้

แนวทาง DSP บริสุทธิ์ ไม่สามารถ เปลี่ยน พยัญชนะศาสตร์ของคุณ แต่ มันสามารถ ประมาณการ SAE ตัวอักษร เสียง:

พารามิเตอร์การตั้งค่าผล
Pitch shift+1 ถึง +2 semitoneยกระดับ pitch โดยรวม, ประมาณ WSAE สระสูง
Formant shift+1.5 ถึง +2.5 semitoneFormant shift ขึ้น, เพิ่ม SAE ดัง ลักษณะ
Presence boost+3 dB ที่ 3.5-5 kHzนำออก สว่าง, โดยตรง SAE คุณสมบัติ
Low-mid cut-2 dB ที่ 250-400 Hzลด boominess; SAE ค่อนข้าง ผอม ในช่วง นี้
Reverbต่ำสุด (room size <10%)SAE ฟัง ค่อนข้าง แห้ง และ โดยตรง
Noise suppressionบนสัญญาณสะอาด จำเป็น สำหรับ ประการ clarity

การตั้งค่าเหล่านี้ เป็นจุดเริ่มต้น ค่า ที่แน่นอน จะ ขึ้นอยู่กับ คุณลักษณะ formant ของ เสียงของคุณ ธรรมชาติ ทำการ low-latency audio capture loopback monitoring ใน VoxBooster ขณะ ปรับ เพื่อ คุณ ได้ยิน output ในเวลาจริง


ขั้นตอนการโคลนเสียง AI สำหรับภาษาอังกฤษแอฟริกาใต้

สำหรับ ผลลัพธ์ ที่ น่าเชื่อถือ แท้จริง, โคลน เสียง AI คือ ทาง:

ขั้นตอนที่ 1: รวบรวมเสียงข้อมูลอ้างอิง

รวบรวม 10-20 นาทีเสียงสะอาด ที่สม่ำเสมอ จาก ผู้พูด ภาษาอังกฤษแอฟริกาใต้ เพียงคน ดี แหล่ง:

  • Podcast ลักษณะ (Trevor Noah เก่า ๆ สัมภาษณ์แอฟริกาใต้)
  • สารคดี การบรรยาย โดย เจ้าภาพ แอฟริกาใต้
  • หนังสือเสียง ว่าจ้าง โดย SA อังกฤษ ผู้พูด
  • YouTube สัมภาษณ์ (Charlize Theron ก่อน 2005 สำหรับ SAE ที่มีแอฟริกัน)

รักษา เสียง ที่ 44.1 kHz หรือ 48 kHz, สเตอโร หรือ โมโน, ด้วย ต่ำสุด พื้นหลัง เสียง รบกวน ลบ ดนตรี เตียง และ สาธารณชน เสียง ก่อน การฝึกอบรม

ขั้นตอนที่ 2: ทำความสะอาดและแบ่งส่วน

ตัด ความนิ่ง และ ปรับปรุง, ทำให้เป็นมาตรฐาน ถึง -16 LUFS, และ รับรอง ไม่ clipping แบ่ง ใน 5-30 วินาที คลิป แต่ละคน ความสอดคล้อง ของ อะคูสติก สภาพแวดล้อม สำคัญ มากกว่า รวม ความยาว

ขั้นตอนที่ 3: ฝึกอบรมโมเดลเสียง

โหลด สะอาดแล้ว คลิป เข้าไป VoxBooster ของ AI โคลน อินเทอร์เฟซ เลือก GPU ของคุณ (CUDA-enabled แนะนำ) และ ตั้ง ฝึกอบรม ขั้นตอน ถึง 20,000-40,000 สำหรับ ปัญหา คุณภาพ/เวลา ที่สมดุล ฝึกอบรม ปกติ เสร็จสิ้น ใน 30-60 นาที บน GPU ระดับกลาง

ผล โมเดล จับ:

  • ของ ผู้พูด ลักษณะ เสียง และ formant โครงสร้าง
  • KIT sentralization และ TRAP ยก ขึ้น เป็น รหัส ใน โมเดล phoneme แผนที่
  • Prosody รูปแบบ ปัจจุบัน ใน ฝึกอบรม ข้อมูล

ขั้นตอนที่ 4: การตั้งค่าเวลาจริง

เปิด VoxBooster, โหลด ฝึกอบรม SA อังกฤษ โมเดล, และ ตั้ง ไมโครโฟน ของคุณ เป็น อินพุต เปิดใช้งาน low-latency audio capture เอาต์พุต และ ตั้ง VoxBooster เสมือน เอาต์พุต เป็น ไมโครโฟน แหล่ง ในคุณ Discord, OBS, หรือ อื่น ๆ แอป ส่วนใหญ่ ความล่าช้า ปกติ ยอย -300ms - ยอมรับได้ สำหรับ ถ่ายทำสด และ เกม ไอ้พวก chatter


การใช้ Mod เสียงแอฟริกาใต้ใน Discord และ OBS

Discord ตั้งค่า:

  1. ใน Discord → การตั้งค่า → เสียง & วิดีโอ, ตั้ง อินพุต ดีวอยส์ ถึง VoxBooster เสมือน ไมโครโฟน
  2. ปิดใช้งาน Discord ของ เสียง รบกวน การระงับ (VoxBooster จัดการ ธรรมนดาน)
  3. ทดสอบ ใน ไม่ สูง โปรแกรม ก่อน ไป ออนไลน์

OBS ตั้งค่า:

  1. เพิ่ม เสียง อินพุต เก็บ แหล่ง, เลือก VoxBooster เสมือน ไมโครโฟน
  2. ใน เสียง ผสม, ใช้ เพิ่มเติม การประมวลผล - VoxBooster ฮอท สัญญาณ แล้ว
  3. ใช้ OBS ของ การตรวจสอบ คุณสมบัติ เพื่อ ได้ยิน เสียง ของคุณ สด ก่อน การแพร่ภาพ

เคล็ดลับทั่วไป:

  • เรียกใช้ แห้ง/เปียก เปรียบเทียบ (ต้นฉบับ vs. แปลง) ก่อน นั่ง เพื่อ ยืนยัน การออกเสียง คุณลักษณะ บัญชี
  • หลีกเลี่ยง ยิ่งใหญ่ formant shift - สร้างสรรค์ ตั้ง ฟัง ธรรมชาติ มากกว่า ขั้นสูง หนึ่ง
  • หากเอาต์พุต ฟัง “หุ่นยนต์”, ลด การแปลง อัตรา พารามิเตอร์ ใน VoxBooster ของ การตั้งค่า (ต่ำกว่า อัตรา ยกขึ้น บ้าน การออกเสียง ความรุนแรง สำหรับ ธรรมชาติ)

ประเภท เพื่อ สืบสวน เหนือ WSAE

หากคุณ มี นี้ กำหนด สร้างสรรค์ หรือ voice-acting เป้าหมาย พิจารณา ซึ่ง SAE ประเภท คุณ ที่จริง จุดมุ่งหมาย:

  • สำหรับ Durban-Indian SAE เสียง: เน้น ทำนายล่วงหน้า สูง-คะแนน prosody และ ลักษณะ สระ ถ่ายโอน ตัดความสำคัญ สมบูรณ์ เชื่อ มากมาย ข้อมูลอ้างอิง วอยส์ WSAE จาก
  • สำหรับ BSAE: จังหวะ เป็น syllable-timed มากกว่า และ ระบบ สระ สะท้อน Bantu ภาษา พื้นหลัง Zulu-inflected SAE มี ลักษณะ intonation จำนวน ของ formant การเปลี่ยน ฝึกอบรม AI โมเดล โดยเฉพาะ บน a BSAE ผู้พูด เป็น จำเป็น
  • สำหรับ Cape Flats อังกฤษ: ลักษณะปัญหา ประเภท ป่ากลาง มี วัฒนธรรม ตัวตน ของ มัน เอง ปฏิบัติ เป็น ของ มัน เอง เป้าหมาย, ไม่ มหาวิทยาลัย หมูป ถ่ม

นี้ สำคัญ โดยเฉพาะ สำหรับ ไอ้พวก voice นักแสดง และ เนื้อหา สร้าง: ขาด ข้อมูลอ้างอิง สำหรับ ขาด บริบท คือ ทั้ง พยัญชนะศาสตร์ ไม่ถูกต้อง และ อาจ ไม่เคารพ กรรม ที่ ที่ ชนิด เป็นตัวแทน


เปรียบเทียบ: DSP ของ อำนาจ โคลน เสียง AI สำหรับ ภาษาอังกฤษแอฟริกาใต้

คุณสมบัติDSP / ระยะดำเนิน-Formant เปลี่ยนโคลน เสียง AI
KIT sentralizationไม่ เล่นจับ ถ้า อยู่ ใน ฝึกอบรม ข้อมูล
TRAP ยก ขึ้นไม่ เล่นจับ ถ้า อยู่ ใน ฝึกอบรม ข้อมูล
Prosody รูปแบบไม่ เล่นบางส่วน จับ
ความล่าช้า5-30 msยอย-300ms (VoxBooster)
ตั้งค่า ความซับซ้อนต่ำปานกลาง (ฝึกอบรม ขั้นตอน ของ)
Naturalnessต่ำ - การออกเสียง สิ่งประดิษฐ์สูง - เสียง re-synthesis
ดีที่สุด ใช้งานเร็ว ประมาณ, ผลกระทบVoice acting, ถ่ายทำสด, สร้างสรรค์ งาน

ภายนอก ทรัพยากร


บ่อยครั้ง ถามคำถาม

สิ่งที่ทำให้ภาษาอังกฤษแอฟริกาใต้ฟังแตกต่างคืออะไร? ภาษาอังกฤษแอฟริกาใต้ (SAE) เกิดจากลักษณะพยัญชนะศาสตร์หลายประการ: สระ KIT ที่เข้มข้น (short /i/ เปลี่ยนเป็น /a/), Kit-Bit split, /r/ retroflex หรือ bunched เบา ๆ และสระ TRAP ยกขึ้น คำพูดของมันก็ถูกตัดทะลุมากกว่า British RP ซึ่งให้จังหวะเฉพาะตัวของ SAE

มี Voice Changer บัญชีแอฟริกาใต้แบบเรียลไทม์หรือไม่? แอป ‘saffa voice mod’ เฉพาะไม่มีอยู่ แต่คุณสามารถบรรลุผลลัพธ์ที่น่าเชื่อได้โดยการโหลดโมเดลเสียง AI ที่ได้รับการฝึกอบรมบนผู้พูดภาษาอังกฤษแอฟริกาใต้เข้าในตัวแปลงเสียง AI แบบเรียลไทม์เช่น VoxBooster โมเดลนำลักษณะการออกเสียงของผู้พูดมาและสังเคราะห์เสียงพูดของคุณใหม่แบบเรียลไทม์

ฉันจะฝึกโมเดลเสียงภาษาอังกฤษแอฟริกาใต้แบบกำหนดเอง ได้อย่างไร? รวบรวมเสียงสะอาด 10-20 นาทีจากผู้พูดภาษาอังกฤษแอฟริกาใต้พื้นเมือง - ปอดแคสต์, สารคดี หรือหนังสือเสียง ทั้งหมดนี้ใช้ได้ดี ส่งเสียงเข้าสู่ขั้นตอนการโคลนเสียง AI ของ VoxBooster การฝึกอบรมใช้เวลา 30-60 นาทีบน GPU ระดับกลาง และสร้างโมเดลที่บันทึกคุณภาพเสียงและรูปแบบ prosody ของผู้พูด

Charlize Theron และ Trevor Noah เป็นข้อมูลอ้างอิงที่ดีสำหรับ SA English หรือไม่? ทั้งคู่เป็นผู้พูดภาษาอังกฤษแอฟริกาใต้ที่เป็นที่ยอมรับกันอย่างกว้างขวาง แต่พวกเขาแทนประเภท ที่ต่างกัน Charlize Theron เติบโตขึ้นมาพูด SAE ที่มีแอฟริกัน Trevor Noah พูด Cape Town/Johannesburg แบบผสม ทั้งคู่ไม่ได้เป็นตัวแทนของภาษาอังกฤษแอฟริกาใต้ของคนผิวดำหรือภาษาอังกฤษแอฟริกาใต้ของอินเดีย

การตั้งค่า DSP ใดที่ประมาณการออกเสียงแอฟริกาใต้? การเลื่อน formant เบา ๆ ขึ้น (ประมาณ +2 semitone) รวมกับการเพิ่มระดับเสียง เบา ๆ และการเพิ่ม presence ที่ 3-5 kHz บันทึกลักษณะแห้ง ๆ บางส่วนของภาษาอังกฤษแอฟริกาใต้ นี่คือการประมาณ - คุณลักษณะพยัญชนะศาสตร์ที่แท้จริง ต้องใช้โมเดลเสียง AI ไม่ใช่แค่ DSP

Voice Changer บัญชีแอฟริกาใต้จะทำงานใน Discord หรือไม่? ใช่. ตั้งค่าตัวแปลงเสียง AI ของคุณเป็นแหล่งไมโครโฟนในการตั้งค่าเสียง Discord VoxBooster รวมเข้าผ่านลูปการจับภาพเสียง low-latency บน Windows 10/11 ดังนั้น Discord, OBS และแอปที่เข้ากันได้อื่น ๆ จึงรับเสียงที่แปลงแล้วโดยไม่มีไดรเวอร์เคอร์เนล


พร้อมจะลอง?

โคลน เสียง AI ของ VoxBooster ทำการ ในเครื่อง บน Windows 10/11 เครื่อง - ไม่ ก้อย ไว้ระวัง รอบเที่ยว, ยอย-300ms ความล่าช้า, ไม่ เคอร์เนล ไดรเวอร์ คุณ สามารถ สร้าง และ ทดสอบ SA อังกฤษ เสียง โมเดล ในเวลา ของ ฟรี การทดลอง, จากนั้น กำจัด มันถ้า มัน ทำงาน สำหรับ คุณ โครงการ

ดาวน์โหลด VoxBooster และ โหลด แรก ของคุณ SA อังกฤษ เสียง โมเดล วันนี้

ลอง VoxBooster — ทดลองใช้ฟรี 3 วัน

โคลนเสียงเรียลไทม์ ซาวด์บอร์ด และเอฟเฟกต์ — ทุกที่ที่คุณคุย

  • ไม่ต้องใช้บัตรเครดิต
  • ความหน่วง ~30ms
  • Discord · Teams · OBS
ลองฟรี 3 วัน