การโคลนเสียงสำหรับการฝึกปรับปรุงทักษะสังคมสำหรับผู้ป่วย Autism
การฝึกเสียงทักษะสังคม autism ต่างหากเป็นศูนย์กลางที่ตึง: การฝึกที่มีประสิทธิภาพมากที่สุดเกิดขึ้นซ้ำ ๆ ในบริบทที่สมจริง ด้วยเดิมพันต่ำ - แต่การเข้าถึงคู่ฝึกมนุษย์ที่สามารถทำได้ด้วยความอดทนและความสอดคล้องกันนั้นมีจำกัด การโคลนเสียง AI ปิดส่วนที่มีความหมายของช่องว่างนั้น คำแนะนำนี้อธิบายสิ่งที่การวิจัยกล่าวว่า วิธีที่ Social Stories ได้รับประโยชน์จากเสียงส่วนบุคคล สิ่งที่ SLP ขอแนะนำ และวิธีการตั้งค่าเสียงที่เป็นมิตรต่ออารมณ์สำหรับผู้เรียน autism ทั่วทุกระดับการสนับสนุน
ประเด็นหลัก
- การโคลนเสียงช่วยให้ผู้เรียน autism ฝึกสนทนาสังคมด้วยเสียงที่เชื่อถือได้ที่คุ้นเคย - ไม่ใช่หุ่นยนต์ TTS หนาว - ซึ่ง SLP รายงานอย่างมีนัยสำคัญมีการมีส่วนร่วมที่ดีขึ้น
- Social Stories (วิธี Carol Gray) มีประสิทธิภาพมากขึ้นเมื่อบรรยายโดยเสียงที่โคลนที่คุ้นเคยแทนที่จะเป็น text-to-speech ทั่วไป
- ผู้ใช้ AAC สามารถรับเสียงสังเคราะห์ส่วนบุคคลที่ฟังเหมือนมนุษย์ แทนที่เสียงอุปกรณ์ที่ไม่เป็นไปตามส่วนบุคคล
- การตั้งค่าเสียงที่เป็นมิตรต่ออารมณ์ (อัตราการพูดปกติ ไม่มีการส่งผ่านสัญญาณหนัก จังหวะที่สอดคล้องกัน) เหมือนกับความสำคัญของเสียงตัวมันเอง
- การประมวลผลในเครื่องทำให้ข้อมูลเสียงที่บันทึกอยู่บนอุปกรณ์ - ไม่จำเป็นต้องอัปโหลด cloud
- การฝึกนำโดยเด็ก: ผู้เรียนควบคุมความเร็วในการเล่น การทำซ้ำ และเมื่อจะสำเร็จจบ
ทำไมการฝึกปรับปรุงทักษะสังคม Autism ต้องการเครื่องมือที่ดีกว่า
การฝึกสอนทักษะสังคมเป็นหนึ่งในการแทรกแซงที่ศึกษาวิจัยมากที่สุดสำหรับบุคคล autism การฝึกอบรมที่มีโครงสร้าง - ฝึกการสวัสดี สลับสินค้าสนทนา แสดงความต้องการ หรือสำรวจการเปลี่ยนแปลงทางสังคมที่ไม่คาดคิด - ให้ผลการปรับปรุงที่วัดได้เมื่อเกิดขึ้นบ่อยครั้งและมีความเครียดทางอารมณ์ต่ำ
ปัญหาคือการส่งมอบ คู่ฝึกมนุษย์ (นักบำบัด ผู้ปกครอง เพื่อน) พร้อมใช้งานสำหรับหน้าต่างที่จำกัด ชั้นเรียนทักษะสังคมของกลุ่มแนะนำความไม่แน่นอนเดียวกันที่ทำให้การโต้ตอบทางสังคมยากสำหรับผู้เรียน autism ตั้งแต่เริ่มต้น เครื่องมือ text-to-speech ทั่วไปสำหรับ Social Stories หรือ AAC มักจะสร้างเสียงที่รู้สึกแปลกปลอม หุ่นยนต์ หรือไม่ทันสมัย - ซึ่งสร้างการทำให้เสื่อมสลายความรู้สึกก่อนที่การเรียนรู้จะเริ่มต้น
การโคลนเสียง AI解决 ปัญหาการส่งมอบหลายประการโดยไม่ต้องแทนที่นักเรียนคลินิกมนุษย์ เสียงที่โคลนสามารถ:
- บรรยาย Social Stories ในเสียงจริงของพ่อแม่หรือผู้บำบัด ทำให้เนื้อหารู้สึกคุ้นเคยและปลอดภัย
- ให้คำสั่งแบบเดิมซ้ำ ๆ โดยไม่เหน็ดเหนื่อย ความไม่อดทน หรือการแปรผันเสียงรองซ้อนที่ผู้เรียน autism อาจตรวจสอบและตีความผิด
- ให้ผู้ใช้ AAC มีเสียงที่ปรับแต่งเองตามตัวตนของพวกเขาแทนที่จะเป็นเสียงอุปกรณ์ค่าเริ่มต้น
- ให้ผู้เรียนควบคุมจังหวะ - เล่นซ้ำ หยุด ชะลอ - โดยไม่มีความกดดันทางสังคม
เพื่อดูการใช้งาน AI เสียงสำหรับความท้าทายในการสื่อสารที่เกี่ยวข้องกับความกังวล โปรดดูที่คำแนะนำของเราเกี่ยวกับการโคลนเสียงและความกังวล
ทำความเข้าใจระดับการสนับสนุน Autism และความเหมาะสมของการโคลนเสียง
DSM-5 อธิบายความผิดปกติของสเปกตรัม autism ในสามระดับการสนับสนุน และการฝึกการโคลนเสียง - ที่มีการปรับแต่งต่างกัน - ในทุกระดับ
| ระดับการสนับสนุน | ลักษณะ | กรณีการใช้การโคลนเสียง |
|---|---|---|
| ระดับ 1 (ต้องการการสนับสนุน) | ความท้าทายในการสื่อสารทางสังคม; ส่วนใหญ่เป็นอิสระ | ฝึก Social Stories อิสระ สคริปต์ไปร.ษณ์สอบถาม ผู้เปิดสนทนา |
| ระดับ 2 (ต้องการการสนับสนุนที่มากขึ้น) | ความท้าทายที่ชัดเจนขึ้น; อาจใช้ AAC บางส่วน | Social Stories ที่ได้รับการสนับสนุนจากผู้ดูแล การปรับเสียง AAC ส่วนบุคคล ฝึก scénario |
| ระดับ 3 (ต้องการการสนับสนุนอย่างมาก) | ความท้าทายที่มีนัยสำคัญ; มักจะไม่พูดหรือพูดได้น้อยที่สุด | การสร้างเสียง AAC จากการบันทึกครอบครัว สคริปต์ปรับความรู้สึก |
ที่ทุกระดับ หลักการออกแบบหลัก: ผู้เรียนควบคุมประสบการณ์ การเดินหน้าอัตโนมัติหรือพร็อมพ์ที่มีกำหนดเวลาซึ่งก้าวหน้าโดยไม่มีสัญญาณจากผู้เรียนสามารถสร้างความกดดันเดียวกันที่ทำให้การโต้ตอบสังคมในโลกแห่งความเป็นจริงมีความยากลำบาก เครื่องมือควรรอ
Social Stories และ Voice Cloning: วิธี Carol Gray
Carol Gray ได้พัฒนา Social Stories ในปี 1991 เป็นบทโรจน์คนแรกอันสั้น ๆ ที่อธิบายสถานการณ์สังคม มุมมองของผู้อื่นที่เกี่ยวข้อง และการตอบสนองพฤติกรรมที่เหมาะสม ขณะนี้เป็นหนึ่งในการแทรกแซงที่ได้รับการสนับสนุนจากหลักฐานมากที่สุดในการศึกษา autism โดยใช้ SLP ผู้ศึกษาด้านพิเศษ และผู้ปกครองทั่วโลก
Social Story แบบดั้งเดิมอาจอ่าน:
“เมื่อฉันไปถึงโรงเรียน ฉันจึงเดินไปยังห้องเรียนของฉัน เด็กอื่น ๆ อาจพูดดัง นั่นเป็นเรื่องปกติ - พวกเขารู้สึกตื่นเต้น ฉันสามารถพูดได้ว่า ‘สวัสดีตอนเช้า’ กับครูของฉัน ครูของฉันชอบเมื่อฉันพูดว่า ‘สวัสดีตอนเช้า’”
ความท้าทายกับ Social Stories ที่พิมพ์คือการมีส่วนร่วม โดยเฉพาะอย่างยิ่งสำหรับผู้เรียนที่ตอบสนองได้ดีกว่ากับเสียง เสียง TTS ทั่วไปทำให้เนื้อหารู้สึกไม่เป็นส่วนบุคคล เรื่องที่บรรยายด้วยเสียงจริงของพ่อแม่ - หรือเสียงของผู้เรียนเอง - รู้สึกต่างออกไป Prosody ที่คุ้นเคย จังหวะที่คุ้นเคย timbre ที่คุ้นเคย: สัญญาณเหล่านี้ส่งผ่านความปลอดภัยแทนที่จะเป็นของใหม่
วิธีการสร้าง Social Story ที่มีเสียงโดยใช้ AI สำหรับการโคลนเสียง:
- เขียนข้อความ Social Story ตามแนวทางของ Carol Gray (พร้อมใช้งานบนเว็บไซต์ของเธอ)
- บันทึกเสียงที่สะอาด 5-10 นาทีจากแบบจำลองเสียงที่เลือก (ผู้ปกครอง ผู้บำบัด หรือ - ด้วยความยินยอม - ผู้เรียนจากการบันทึกก่อนหน้า)
- ฝึกโคลนเสียงในเครื่องบน Windows โดยใช้ VoxBooster - แบบจำลองทำงานบนอุปกรณ์ ดังนั้นเสียงจึงไม่ลบหรือไปยังคลินิก
- สร้างเสียง Social Story ที่บรรยายโดยพิมพ์สคริปต์ลงในอินเทอร์เฟซการสังเคราะห์เสียง
- ส่งออกเป็นไฟล์ MP3 หรือ WAV และโหลดไปยังแท็บเล็ต โทรศัพท์ หรืออุปกรณ์ AAC ที่ผู้เรียนใช้อยู่แล้ว
- ให้ผู้เรียนควบคุมการจ่ายเสียง
ขั้นตอนการทำงาน ทั้งหมดนี้สามารถตั้งค่าโดยผู้ดูแลโดยไม่มีพื้นฐานด้านวิศวกรรมเสียง SLP ให้สคริปต์ ผู้ปกครองให้บันทึกเสียง VoxBooster จัดการการสังเคราะห์
สำหรับผู้เรียนที่ได้รับประโยชน์จากการสร้างแบบจำลองการออกเสียง โปรดดูคำแนะนำของเราเกี่ยวกับการโคลนเสียงและการฝึกออกเสียงด้วย
ผู้ใช้ AAC บนสเปกตรัม Autism: เสียงสังเคราะห์ที่ปรับแต่งเอง
Augmentative and Alternative Communication (AAC) ครอบคลุมวิธีการใด ๆ - เทคโนโลยีต่ำ (บอร์ดรูป) หรือเทคโนโลยีสูง (อุปกรณ์ที่สร้างคำพูด) - ที่สนับสนุนหรือแทนที่ภาษาพูด สำหรับบุคคล autism ที่ไม่พูดหรือพูดได้น้อยที่สุด AAC เทคโนโลยีสูงโดยปกติจะสร้างคำพูดสังเคราะห์ และคุณภาพของเสียงสังเคราะห์นั้นมีความสำคัญมากกว่าที่นักเรียนคลินิกหลายคนตระหนักในตอนแรก
การวิจัยจากเขตข้อมูล AAC แสดงว่าคู่ของการสื่อสารตอบสนองต่างกันสำหรับคำพูดที่สร้างขึ้นโดยอุปกรณ์ขึ้นอยู่กับคุณภาพเสียงและการจับคู่ตัวตนที่เห็น เด็กชายวัยรุ่นที่ใช้เสียงตัวเมีย หนึ่งผู้ใหญ่ทั่วไปสร้างความไม่ตรงกันที่ส่งผลกระทบต่อวิธีที่เพื่อน ๆ และผู้ใหญ่โต้ตอบกับเขา - ซึ่งในทางกลับกัน ส่งผลกระทบต่อแรงจูงใจของผู้เรียนในการสื่อสาร
AI สำหรับการโคลนเสียงสามารถให้ผู้ใช้ AAC มีเสียงสังเคราะห์ที่:
- จับคู่อายุ เพศ และลำเพง ภูมิภาคของพวกเขาใกล้เคียงที่สุด
- ดึงมาจากสมาชิกครอบครัวที่มีโปรไฟล์เสียงคล้ายกันเมื่อผู้ใช้ไม่มีบันทึกที่ใช้ได้
- บันทึก “ธนาคาร” ของเสียงผู้เรียนจากช่วงเวลาการพูดก่อนหน้า (ก่อนโรค บาดเจอ หรือการถดถอย) เพื่อให้ผลลัพธ์ AAC ในอนาคตฟังเหมือนพวกเขา
ขั้นตอนธรรมชาติสำหรับธนาคารเสียง AAC:
- บันทึกเสียงเป้าหมายในห้องเงียบโดยใช้ไมโครโฟนที่ดี - แม้แต่ไมโครโฟนสมาร์ทโฟนจะทำงานหากควบคุมเสียงพื้นหลัง
- เป้าหมายอย่างน้อย 300 ประโยคที่มีความหลากหลายซึ่งครอบคลุมเสียงสระต่างกัน การผัน intonation คำถาม และสมดุลทางอารมณ์
- ฝึกแบบจำลองเสียงใน VoxBooster ซอฟต์แวร์ทำงานในเครื่อง ซึ่งสำคัญสำหรับการพิจารณาความเป็นส่วนตัวของการแพทย์
- รวมเสียงที่ส่งออกลงในระบบ AAC อุปกรณ์และแอปพลิเคชัน AAC สมัยใหม่ส่วนใหญ่ยอมรับไฟล์เสียงที่กำหนดเอง
SLP ที่เชี่ยวชาญใน AAC สามารถช่วยครอบครัวระบุเมื่อธนาคารเสียงเหมาะสมและประโยคใดที่จะบันทึกเพื่อให้ได้ช่วงเสียง phonetic สูงสุด เครือข่าย ISAAC (องค์กรสากลเพื่อการสื่อสารเพิ่มเติมและสำรอง) ให้บริการทรัพยากรผู้บริหาร
การกำหนดค่าเสียงที่เป็นมิตรต่ออารมณ์
สำหรับผู้ฟัง autism - โดยเฉพาะอย่างยิ่งผู้ที่มีความสัมผัสด้านการได้ยิน - คุณสมบัติเสียงของเสียงสามารถตัดสินใจได้ว่าเซสชั่นมีประสิทธิผลหรือล้นพ้น นี่ไม่ใช่เรื่องเกี่ยวกับการกำหนดเองสำหรับบางบุคคล ลักษณะเสียงบางอย่าง สร้างปฏิกิริยาความรู้สึกที่แท้จริงซึ่งขัดขวางการประมวลผล
การตั้งค่าเพื่อปรับเสียงให้เหมาะสม:
| พารามิเตอร์ | เป้าหมายที่เป็นมิตรต่ออารมณ์ | สิ่งที่ต้องหลีกเลี่ยง |
|---|---|---|
| อัตราการพูด | 130-150 คำต่อนาที | การพูดอย่างรวดเร็ว (>170 wpm) |
| โครงร่างระดับเสียง | ค่อนข้างอุ่นขึ้น ความแปรผันปานกลาง | ระดับเสียงแหลมที่เฉียบพลัน โมโนโทนหุ่นยนต์ |
| ซองจดหมายระดับเสียง | สอดคล้องกัน ไม่มีการกระโดดที่ฉับพลัน | การเน้นเสียงดังบนสัญญาณเสียง |
| การส่งผ่านสัญญาณเสียง | ทำให้อ่อน หลีกเลี่ยงการส่งผ่านสัญญาณ “p / t / k” | การส่งผ่านสัญญาณ plosive ที่ไม่ได้กรอง |
| Reverb / Gating ห้อง | ต่ำสุด (สัญญาณแห้งหรือเกือบแห้ง) | การสะท้อนเสียงห้อง สิ่งประดิษฐ์ reverb |
| เสียงพื้นหลัง | ไม่มี - เพียงเสียงที่สะอาด | เสียงรอบข้าง |
เมื่อใช้ VoxBooster ในการสร้างคำเล่า ท่อ synthesis ได้ประมวลผลเสียงที่ระดับแบบจำลอง ปรับเปลี่ยนเพิ่มเติมสามารถทำได้เมื่อส่งออก: ตัวกรองสูงผ่านแบบสบาย ๆ เหนือ 8 kHz และเครื่องบีบอัดเบา ๆ ด้วยการโจมตีที่ช้า (≥20ms) ช่วยให้เรียบสิ่งประดิษฐ์ transient โดยไม่ลบคุณลักษณะเสียง
ทดสอบความเข้าที่อารมณ์: ผู้พิพากษาที่ดีที่สุดคือผู้เรียน ก่อนที่จะมุ่งมั่นกับชุดเสียง Social Story เต็มรูปแบบ ให้สร้างตัวอย่าง 30 วินาทีและเล่นผ่านอุปกรณ์ที่ผู้เรียนจะใช้จริง ๆ (ลำโพงแท็บเล็ต ชุดหูฟัง ฯลฯ) ให้พวกเขาระบุว่ามันรู้สึกสบายใจหรือไม่ ผู้ใช้ที่ไม่พูดสามารถส่งสัญญาณด้วยสัญลักษณ์ใช่/ไม่ใช่หรือท่าทาง
การเรียนรู้ที่นำโดยเด็ก: หลักการออกแบบสำหรับผู้เรียน Autism
การตัดสินใจออกแบบที่สำคัญที่สุดในการฝึกอบรมที่รับการสนับสนุนโดยการโคลนเสียงคือใครควบคุมจังหวะ ซอฟต์แวร์ฝึกสอนทักษะแบบดั้งเดิมมักจะเดินหน้าอัตโนมัติ ซึ่งขจัดความรู้สึกของตัวตนของผู้เรียนและจำลองแรงกดดันทางสังคมที่ทำให้ปฏิสัมพันธ์สด ๆ มีความยากลำบาก
หลักการสำหรับการฝึกเสียงที่นำโดยเด็ก:
- ไม่มีการเดินหน้าโดยอัตโนมัติ แต่ละข้อความจะเล่นครั้งหนึ่ง จากนั้นรอ ผู้เรียนเริ่มข้อความถัดไป
- การทำซ้ำไม่มีขีด จำกัด โดยไม่มีการตัดสิน ระบบจะไม่ “หมดเวลา” หรือแสดงสัญญาณความผิดหวัง
- เสียงที่สอดคล้องกันทั่วทั้งเซสชัน การใช้เสียงโคลนเดียวกันแต่ละครั้งจะช่วยลดความกังวลที่เกี่ยวข้องกับความใหม่ การสลับเสียงต้องตั้งใจและประกาศล่วงหน้า
- จุดเริ่มต้นและจุดสิ้นสุดที่ชัดเจน ผู้เรียน autism มักได้รับประโยชน์จากบทเปิด (“ขอเล่นทำให้เหน็ดเหนื่อยใจกันน”) และปิด (“ทำให้เหน็ดเหนื่อยใจกันน เสร็จสิ้นวันนี้”) เพื่อส่งสัญญาณขอบเขตเซสชัน
- ตัวเลือกสถานการณ์ หากทำได้ ให้ผู้เรียนเลือกว่าจะฝึกสคริปต์สังคมใด แทนที่จะกำหนดมัน การเลือกตามความชอบจะเพิ่มแรงจูงใจและการโอนไปยังสถานการณ์จริง
- ความล้มเหลวเป็นส่วนตัว การฝึกโคลนเสียงเกิดขึ้นเพียงอย่างเดียวหรือกับผู้ใหญ่ที่เชื่อถือได้คนหนึ่ง - ไม่มีเพื่อน ๆ ที่มองหา ไม่มีการตัดสินทางสังคมสำหรับการสะดุดลง
หลักการเหล่านี้ตรงกับกรอบการปฏิบัติ Neurodiversity-Affirming ซึ่งได้กลายเป็นมาตรฐานในการฝึก SLP ซึ่งเน้นการยืนยัน autism แทนการแทรกแซง
ข้อเสนอแนะ SLP: วิธีที่นักเรียนคลินิกใช้ Voice AI
นักบำบัดสำหรับคำพูดและภาษาที่ทำงานในบริบท autism และ AAC เป็นผู้ใช้ในช่วงเริ่มต้นของเครื่องมือโคลนเสียง เพราะลูกค้าของพวกเขาอยู่ในประวัติศาสตร์ที่ได้รับบริการจากระบบ TTS ทั่วไป SLP รายงานการใช้ voice AI ในสามวิธีหลัก:
1. การฝึกซ้อม ๆ ระหว่างเซสชัน SLP ออกแบบสคริปต์และกำหนดการบรรยายอ้างอิงเสียงเป็นการฝึกซ้อม ๆ (เทียบเท่ากับการบ้านในการบำบัดแบบดั้งเดิม) ผู้เรียนฝึกซ้อมด้วยเสียงโคลนของนักบำบัด ลดแรงกดดันในการแสดงของเซสชั่นสด
2. การฝึกสอนของผู้ปกครอง SLP สอนผู้ปกครองในการสร้าง Social Stories ที่มีเสียงอย่างเป็นอิสระ นี่เพิ่มความถี่ของการฝึกอบรมอย่างมาก เนื่องจากผู้ปกครองสามารถสร้าง stories ใหม่สำหรับสถานการณ์ใหม่ (วันแรกที่โรงเรียนใหม่ การแพทย์ งานเลี้ยงวันเกิด) โดยไม่รอนัดหมายคลินิกถัดไป
3. ธนาคารเสียงสำหรับผู้ใช้ AAC SLP เริ่มการสนทนาธนาคารเสียงในช่วงต้น - โดยเฉพาะอย่างยิ่งก่อนที่ผู้เรียนจะสูญเสียคำพูดที่มีนัยสำคัญ - และชี้นำครอบครัวผ่านกระบวนการบันทึก จำนวนมากของ SLP ตอนนี้ถือว่านี่เป็นส่วนหนึ่งของการประเมิน AAC มาตรฐาน
ทรัพยากรภายนอกที่มีประโยชน์คือพอร์ทัลการปฏิบัติของ ASHA บน AAC ซึ่งรวมคำแนะนำทางคลินิกเกี่ยวกับคุณภาพเสียงที่ส่งออกและตัวเลือกการเลือกเทคโนโลยี
สำหรับผู้เรียนที่ยังใช้การฝึกเสียงสำหรับเป้าหมายความพร้อมสำหรับงาน โปรดดูคำแนะนำของเราเกี่ยวกับการโคลนเสียงและการเตรียมการสัมภาษณ์งาน
ข้อควรพิจารณาด้านจริยธรรม: การยินยอมและความปลอดภัยของข้อมูล
บริบทการฝึกซ้อม Autism แนะนำข้อพิจารณาด้านจริยธรรมเฉพาะที่ไม่ใช้สำหรับกรณีการใช้การโคลนเสียงทั่วไป
ความเห็นชอบ: บุคคล autism - รวมถึงผู้ที่ไม่พูด - สมควรได้รับการยินยอมที่สำนึกสติในการตัดสินใจเกี่ยวกับข้อมูลเสียงของตนเอง “Meaningful” หมายถึงการปรับให้เข้ากับความต้องการในการสื่อสารของพวกเขา: แบบฟอร์มความเห็นชอบตามรูปภาพ ภาษาอย่างง่าย เวลาในการประมวลผล และวิธีการบอกว่าไม่มีผลที่ตามมา สำหรับเด็ก ต้องมีการยินยอมของผู้ปกครอง แต่การยินยอมจากเด็กควรยังขอได้ในลักษณะที่สามารถเข้าถึงได้
การจัดเก็บข้อมูลเสียง: การโต้แย้งความปลอดภัยข้อมูลที่แข็งแกร่งที่สุดสำหรับการประมวลผล AI เสียงในเครื่อง (เทียบกับบริการบนคลาวด์) คือข้อมูลการฝึก - ซึ่งรวมถึงการบันทึกเสียงของบุคคล - ไม่เคยออกจากอุปกรณ์ สำหรับครอบครัวที่นำทางบริบททางการแพทย์ การศึกษา หรือกฎหมาย ความแตกต่างนี้มีความสำคัญ VoxBooster ทำงานแบบจำลองเสียงทั้งหมดบน PC Windows ทำให้เหมาะสมสำหรับการตั้งค่าคลินิกและโรงเรียนที่มีข้อกำหนดการปกครองข้อมูลที่เข้มงวด
ตัวตนของเสียงและศักดิ์ศรี: เสียงโคลนเป็นตัวแทนของตัวตนของบุคคล มันควรใช้ได้เพียงในลักษณะที่บุคคลนั้น (หรือครอบครัว สำหรับเด็กเล็ก ๆ) ยินยอม และไม่ควรได้รับการแก้ไขให้พูดสิ่งต่างๆ ที่บิดเบือนบุคคลนั้นหรือทำให้เสียใจ
ผลลัพธ์เสียงเชิงพาณิชย์: หากเสียงโคลนของผู้เรียนเคยใช้ในผลิตภัณฑ์ (เช่น แอปพลิเคชัน AAC ที่เล่าขาน ขายให้คนอื่น) มันจะเข้าไปในอาณาเขตเชิงพาณิชย์ต้องใบอนุญาตอย่างชัดเจน สำหรับการฝึกการศึกษาและส่วนตัว ข้อกังวลนี้ไม่ได้ใช้
สำหรับกรอบที่ครอบคลุมมากขึ้น โปรดดูคำแนะนำของเราเกี่ยวกับการโคลนเสียงและจริยธรรม
การเตรียมเซสชัน: ทีละขั้นตอน
นี่คือขั้นตอนการทำงานของผู้ปกครองหรือ SLP ที่สร้างเซสชั่นการฝึกโคลนเสียงแรกสำหรับผู้เรียน autism
ก่อนที่คุณจะเริ่มต้น:
- เขียน Social Stories 3-5 เป้าหมายปัจจุบัน IEP หรือเป้าหมายการบำบัด
- รวบรวมการบันทึกที่สะอาด 5-10 นาทีจากแบบจำลองเสียงที่เลือก (ผู้ปกครองหรือนักบำบัด)
- มีแท็บเล็ตหรืออุปกรณ์ที่ผู้เรียนใช้อย่างสบายใจ
การตั้งค่า (ครั้งเดียว 30-60 นาที):
- ติดตั้ง VoxBooster บน Windows 10/11 เริ่มการทดลองใช้ฟรี 3 วัน - ไม่จำเป็นต้องใช้บัตรเครดิต
- เปิดส่วนการโคลนเสียง AI และนำเข้าการบันทึกเสียง
- ฝึกแบบจำลองเสียง การประมวลผลใช้เวลา 10-30 นาทีขึ้นอยู่กับ PC
- พิมพ์สคริปต์ Social Story แรกลงในหน้าต่างการสังเคราะห์ ฟังการแสดงตัวอย่าง
- ปรับอัตราการพูดในการตั้งค่าผลลัพธ์เป็น 140 คำต่อนาทีหากค่าเริ่มต้นรู้สึกว่าเร็ว
- ส่งออกเรื่องที่บรรยายเป็นไฟล์ WAV หรือ MP3
- โหลดไฟล์ลงในอุปกรณ์ของผู้เรียน
แต่ละเซสชั่นการฝึก (5-15 นาที):
- ผู้เรียนเลือกเรื่องที่จะฟัง (บอร์ดตัวเลือกภาพทำงานได้ดี)
- เรื่องเล่น ผู้เรียนควบคุมการเล่นซ้ำ/หยุด ผ่านอินเทอร์เฟซปุ่มขนาดใหญ่หรือผู้ดูแล
- หลังเรื่อง ผู้บำบัดหรือผู้ดูแลถามคำถามความเข้าใจ 1-2 ข้อหรือส่งเสริมการตอบสนองการสวมบท
- ทำเครื่องหมายเซสชั่นในบันทึกติดตาม (เรื่องไหน เล่นซ้ำ กี่ครั้ง การมีส่วนร่วมที่สังเกต)
- จบด้วยวลีปิดที่สอดคล้องกัน
เมื่อผู้เรียนมีความก้าวหน้า สคริปต์สามารถนำเสนอความซับซ้อนที่มากขึ้น - เหตุการณ์ที่ไม่คาดคิด การแก้ไขความขัดแย้ง การเอกสิทธิ์มุมมอง - ตามเสียงเดียวกันที่พวกเขารู้สึกว่าน่าเชื่อถือแล้ว
คำถามที่พบบ่อย
การโคลนเสียงสามารถช่วยผู้ที่เป็น autism ด้วยทักษะสังคมได้หรือไม่
ได้ การโคลนเสียง AI ช่วยให้บุคคลที่เป็น autism ฝึกสนทนาจริงในสภาพแวดล้อมที่มีความเครียดต่ำ เล่นสถานการณ์ซ้ำในกระบวนการของพวกเขาและได้ยินเสียงที่คุ้นเคยในการบรรยายเรื่องราว Social Stories SLP หลายคนรายงานว่าความกังวลลดลงเมื่อเซสชั่นการฝึกใช้เสียงที่เชื่อถือได้แทนลำโพง text-to-speech ที่ไม่คุ้นเคย
เรื่อง Social Story คืออะไรและการโคลนเสียงปรับปรุงมันอย่างไร
Social Story (พัฒนาโดย Carol Gray) เป็นการบรรยายคนแรกอันสั้น ๆ ที่อธิบายสถานการณ์สังคมและการตอบสนองที่เหมาะสม การเพิ่มเสียงโคลน - โดยอุดมคติคือพ่อแม่ ผู้บำบัด หรือเสียงของผู้เรียนเอง - ทำให้เรื่องรู้สึกส่วนตัวและคุ้นเคย ซึ่งเพิ่มการมีส่วนร่วมและการเก็บรักษาเมื่อเทียบกับเสียง TTS ทั่วไป
การโคลนเสียง AI ปลอดภัยสำหรับเด็ก autism หรือไม่
เมื่อตั้งค่าโดยผู้ดูแลหรือ SLP และทำงานในเครื่องบน Windows (ไม่มีการอัปโหลดเสียงของเด็กไปยัง cloud) ถือว่าปลอดภัย การประมวลผลในเครื่องหมายความว่าข้อมูลเสียงที่บันทึก ไม่เคยออกจากอุปกรณ์ ได้รับการยินยอมที่สำนึกสติจากเด็กและครอบครัวเสมอก่อนโคลนเสียงใด ๆ และปฏิบัติตามนโยบายการปกป้องข้อมูลของโรงเรียนหรือคลินิกของคุณ
ลักษณะเสียงใดที่เป็นมิตรกับความรู้สึกสำหรับผู้ฟังที่เป็น autism
เสียงที่เป็นมิตรต่ออารมณ์มี: อัตราการพูดปกติ (130-150 คำต่อนาที) โครงร่างสนามไทยหรืออุ่นเล็กน้อย ไม่มีการแลดกระแสเสียงหรือการส่งผ่านสัญญาณเฉียบพลัน การสะท้อนเสียงหรือเสียงสะท้อนห้องน้อยที่สุด และจังหวะที่สอดคล้องกัน หลีกเลี่ยงเสียงเดียวแบบหุ่นยนต์ (ไม่น่าสนใจ) และเสียงที่มีการเคลื่อนไหวมากเกินไป (มีศักยภาพในการล้นไปหมด) เสียงที่คุ้นเคยซึ่งถูกโคลนตามธรรมชาติเข้าถึงเกณฑ์ส่วนใหญ่เหล่านี้
บุคคลที่เป็น autism ซึ่งไม่พูดคุยสามารถใช้การโคลนเสียงสำหรับ AAC ได้หรือไม่
ได้ ผู้ใช้ AAC - รวมถึงผู้ที่พูดน้อยหรือไม่พูดคุย - สามารถมีเสียงสังเคราะห์ส่วนบุคคลที่สร้างขึ้นจากการบันทึกที่ทำในช่วงเวลาการพูดก่อนหน้านี้ จากสมาชิกครอบครัวที่มีโปรไฟล์เสียงคล้ายกัน หรือจากตัวอย่างสั้น ๆ ของเสียงที่ต้องการใด ๆ สิ่งนี้ให้ผลลัพธ์ AAC คุณภาพมนุษย์ที่ใกล้เคียงกับบุคคลมากกว่าเสียงอุปกรณ์ทั่วไป
การใช้เสียงโคลนแทนที่หมอ Speech-language pathologist ได้หรือไม่
ไม่ การโคลนเสียงเป็นเครื่องมือฝึกสอน ไม่ใช่นักเรียนคลินิก SLP ออกแบบสคริปต์ทางสังคม ปรับความยากจะเพิ่มขึ้น ตีความการตอบสนองของผู้เรียนและตัดสินใจว่าจะเมื่อใด การเพิ่มขึ้น เสียงที่โคลนเพียงแค่ส่งคำแนะนำการฝึกอบรมในรูปแบบที่ผู้เรียน autism มักจะพบว่าสามารถเข้าถึงได้มากขึ้น ให้คิดว่ามันเป็นการบ้านที่บันทึกด้วยเสียงที่คุ้นเคย ไม่ใช่การบำบัดตัวมันเอง
ระดับการสนับสนุน autism ใดได้ประโยชน์มากที่สุดจากการฝึกการโคลนเสียง
การวิจัยเกี่ยวกับการฝึกทักษะสังคมที่ได้รับการสนับสนุนโดยเทคโนโลยีครอบคลุมระดับ 1 ถึงระดับ 3 บุคคล autism ระดับ 1 และ 2 มีแนวโน้มที่จะเข้าร่วมอย่างเป็นอิสระมากที่สุดกับการฝึกการโคลนเสียง ผู้ใช้ระดับ 3 ได้รับประโยชน์เมื่อผู้ดูแลอยู่ด้วยกัน ชี้นำการโต้ตอบกับเสียง ไม่มีระดับใดที่ถูกแยกออก - วิธีนี้เข้ากับผู้เรียน
บทสรุป
การฝึกเสียงทักษะสังคม autism รับเครื่องมือที่มีประสิทธิผลอย่างแท้จริงเมื่อการโคลนเสียง AI เข้ามาในภาพ - ไม่ใช่เป็นการแทนที่การบำบัดที่ได้รับการชี้นำจาก SLP แต่เป็นกลไกการจัดส่งที่ทำให้การฝึกอบรมสามารถเข้าถึง ส่วนบุคคล และนำมาซ้ำได้มากกว่าสิ่งใดที่มีอยู่ก่อนหน้านี้ Social Stories ที่บรรยายด้วยเสียงที่คุ้นเคย ระบบ AAC ที่มีการพูดสังเคราะห์ที่ตรงกับตัวตน และข้อความเสียง AI ความสื่อสารสัตว์ Autism ที่ทำงานในเครื่องและส่วนตัวบน PC Windows นั้นสมจริงวันนี้ ไม่ใช่สมมติฐาน
ข้อมูลเชิงลึกหลักจากนักเรียนคลินิกที่ทำงานในพื้นที่นี้: บุคคล autism ไม่ต้านการฝึกอบรม - พวกเขามักจะต้านทุกสภาพแวดล้อมที่สร้างขึ้นโดยการฝึกอบรมแบบดั้งเดิม (เสียงไม่คุ้นเคย ความเครียดทางสังคม การจัดส่งที่ไม่สอดคล้องกัน เครื่องมือไม่เป็นส่วนบุคคล) เปลี่ยนกลไกการจัดส่งและการมีส่วนร่วมตามมา
VoxBooster ทำงานแบบจำลองเสียงในเครื่องบน Windows 10/11 ฝึกในแต่ละนาทีของเสียงที่บันทึก และส่งออกเป็นรูปแบบเสียงมาตรฐานที่โหลดโดยตรงไปยังแท็บเล็ต อุปกรณ์ AAC หรือเครื่องเล่นมีเดีย การทดลองใช้ฟรี 3 วันไม่ต้องใช้บัตรเครดิต หากเซสชั่น Social Story แรกของคุณดำเนินไปอย่างดี คุณจะมีความคิดที่ชัดเจนว่าสิ่งนี้เข้ากับกล่องเครื่องมือของคุณหรือไม่ ก่อนที่จะใช้จ่าย
สำหรับ SLP ที่สร้างห้องสมุดการฝึกอบรมที่ได้รับการสนับสนุนโดย voice-AI คำแนะนำของเราเกี่ยวกับการโคลนเสียงและ voiceover ครอบคลุมคุณภาพเสียงและขั้นตอนการส่งออกในรายละเอียดที่มากขึ้น