การโคลนเสียงสำหรับการฝึกปรับปรุงทักษะสังคมสำหรับผู้ป่วย Autism

การฝึกเสียงทักษะสังคม autism ต่างหากเป็นศูนย์กลางที่ตึง: การฝึกที่มีประสิทธิภาพมากที่สุดเกิดขึ้นซ้ำ ๆ ในบริบทที่สมจริง ด้วยเดิมพันต่ำ - แต่การเข้าถึงคู่ฝึกมนุษย์ที่สามารถทำได้ด้วยความอดทนและความสอดคล้องกันนั้นมีจำกัด การโคลนเสียง AI ปิดส่วนที่มีความหมายของช่องว่างนั้น คำแนะนำนี้อธิบายสิ่งที่การวิจัยกล่าวว่า วิธีที่ Social Stories ได้รับประโยชน์จากเสียงส่วนบุคคล สิ่งที่ SLP ขอแนะนำ และวิธีการตั้งค่าเสียงที่เป็นมิตรต่ออารมณ์สำหรับผู้เรียน autism ทั่วทุกระดับการสนับสนุน

ประเด็นหลัก

การโคลนเสียงช่วยให้ผู้เรียน autism ฝึกสนทนาสังคมด้วยเสียงที่เชื่อถือได้ที่คุ้นเคย - ไม่ใช่หุ่นยนต์ TTS หนาว - ซึ่ง SLP รายงานอย่างมีนัยสำคัญมีการมีส่วนร่วมที่ดีขึ้น
Social Stories (วิธี Carol Gray) มีประสิทธิภาพมากขึ้นเมื่อบรรยายโดยเสียงที่โคลนที่คุ้นเคยแทนที่จะเป็น text-to-speech ทั่วไป
ผู้ใช้ AAC สามารถรับเสียงสังเคราะห์ส่วนบุคคลที่ฟังเหมือนมนุษย์ แทนที่เสียงอุปกรณ์ที่ไม่เป็นไปตามส่วนบุคคล
การตั้งค่าเสียงที่เป็นมิตรต่ออารมณ์ (อัตราการพูดปกติ ไม่มีการส่งผ่านสัญญาณหนัก จังหวะที่สอดคล้องกัน) เหมือนกับความสำคัญของเสียงตัวมันเอง
การประมวลผลในเครื่องทำให้ข้อมูลเสียงที่บันทึกอยู่บนอุปกรณ์ - ไม่จำเป็นต้องอัปโหลด cloud
การฝึกนำโดยเด็ก: ผู้เรียนควบคุมความเร็วในการเล่น การทำซ้ำ และเมื่อจะสำเร็จจบ

ทำไมการฝึกปรับปรุงทักษะสังคม Autism ต้องการเครื่องมือที่ดีกว่า

การฝึกสอนทักษะสังคมเป็นหนึ่งในการแทรกแซงที่ศึกษาวิจัยมากที่สุดสำหรับบุคคล autism การฝึกอบรมที่มีโครงสร้าง - ฝึกการสวัสดี สลับสินค้าสนทนา แสดงความต้องการ หรือสำรวจการเปลี่ยนแปลงทางสังคมที่ไม่คาดคิด - ให้ผลการปรับปรุงที่วัดได้เมื่อเกิดขึ้นบ่อยครั้งและมีความเครียดทางอารมณ์ต่ำ

ปัญหาคือการส่งมอบ คู่ฝึกมนุษย์ (นักบำบัด ผู้ปกครอง เพื่อน) พร้อมใช้งานสำหรับหน้าต่างที่จำกัด ชั้นเรียนทักษะสังคมของกลุ่มแนะนำความไม่แน่นอนเดียวกันที่ทำให้การโต้ตอบทางสังคมยากสำหรับผู้เรียน autism ตั้งแต่เริ่มต้น เครื่องมือ text-to-speech ทั่วไปสำหรับ Social Stories หรือ AAC มักจะสร้างเสียงที่รู้สึกแปลกปลอม หุ่นยนต์ หรือไม่ทันสมัย - ซึ่งสร้างการทำให้เสื่อมสลายความรู้สึกก่อนที่การเรียนรู้จะเริ่มต้น

การโคลนเสียง AI解决 ปัญหาการส่งมอบหลายประการโดยไม่ต้องแทนที่นักเรียนคลินิกมนุษย์ เสียงที่โคลนสามารถ:

บรรยาย Social Stories ในเสียงจริงของพ่อแม่หรือผู้บำบัด ทำให้เนื้อหารู้สึกคุ้นเคยและปลอดภัย
ให้คำสั่งแบบเดิมซ้ำ ๆ โดยไม่เหน็ดเหนื่อย ความไม่อดทน หรือการแปรผันเสียงรองซ้อนที่ผู้เรียน autism อาจตรวจสอบและตีความผิด
ให้ผู้ใช้ AAC มีเสียงที่ปรับแต่งเองตามตัวตนของพวกเขาแทนที่จะเป็นเสียงอุปกรณ์ค่าเริ่มต้น
ให้ผู้เรียนควบคุมจังหวะ - เล่นซ้ำ หยุด ชะลอ - โดยไม่มีความกดดันทางสังคม

เพื่อดูการใช้งาน AI เสียงสำหรับความท้าทายในการสื่อสารที่เกี่ยวข้องกับความกังวล โปรดดูที่คำแนะนำของเราเกี่ยวกับการโคลนเสียงและความกังวล

ทำความเข้าใจระดับการสนับสนุน Autism และความเหมาะสมของการโคลนเสียง

DSM-5 อธิบายความผิดปกติของสเปกตรัม autism ในสามระดับการสนับสนุน และการฝึกการโคลนเสียง - ที่มีการปรับแต่งต่างกัน - ในทุกระดับ

ระดับการสนับสนุน	ลักษณะ	กรณีการใช้การโคลนเสียง
ระดับ 1 (ต้องการการสนับสนุน)	ความท้าทายในการสื่อสารทางสังคม; ส่วนใหญ่เป็นอิสระ	ฝึก Social Stories อิสระ สคริปต์ไปร.ษณ์สอบถาม ผู้เปิดสนทนา
ระดับ 2 (ต้องการการสนับสนุนที่มากขึ้น)	ความท้าทายที่ชัดเจนขึ้น; อาจใช้ AAC บางส่วน	Social Stories ที่ได้รับการสนับสนุนจากผู้ดูแล การปรับเสียง AAC ส่วนบุคคล ฝึก scénario
ระดับ 3 (ต้องการการสนับสนุนอย่างมาก)	ความท้าทายที่มีนัยสำคัญ; มักจะไม่พูดหรือพูดได้น้อยที่สุด	การสร้างเสียง AAC จากการบันทึกครอบครัว สคริปต์ปรับความรู้สึก

ที่ทุกระดับ หลักการออกแบบหลัก: ผู้เรียนควบคุมประสบการณ์ การเดินหน้าอัตโนมัติหรือพร็อมพ์ที่มีกำหนดเวลาซึ่งก้าวหน้าโดยไม่มีสัญญาณจากผู้เรียนสามารถสร้างความกดดันเดียวกันที่ทำให้การโต้ตอบสังคมในโลกแห่งความเป็นจริงมีความยากลำบาก เครื่องมือควรรอ

Carol Gray ได้พัฒนา Social Stories ในปี 1991 เป็นบทโรจน์คนแรกอันสั้น ๆ ที่อธิบายสถานการณ์สังคม มุมมองของผู้อื่นที่เกี่ยวข้อง และการตอบสนองพฤติกรรมที่เหมาะสม ขณะนี้เป็นหนึ่งในการแทรกแซงที่ได้รับการสนับสนุนจากหลักฐานมากที่สุดในการศึกษา autism โดยใช้ SLP ผู้ศึกษาด้านพิเศษ และผู้ปกครองทั่วโลก

Social Story แบบดั้งเดิมอาจอ่าน:

“เมื่อฉันไปถึงโรงเรียน ฉันจึงเดินไปยังห้องเรียนของฉัน เด็กอื่น ๆ อาจพูดดัง นั่นเป็นเรื่องปกติ - พวกเขารู้สึกตื่นเต้น ฉันสามารถพูดได้ว่า ‘สวัสดีตอนเช้า’ กับครูของฉัน ครูของฉันชอบเมื่อฉันพูดว่า ‘สวัสดีตอนเช้า’”

ความท้าทายกับ Social Stories ที่พิมพ์คือการมีส่วนร่วม โดยเฉพาะอย่างยิ่งสำหรับผู้เรียนที่ตอบสนองได้ดีกว่ากับเสียง เสียง TTS ทั่วไปทำให้เนื้อหารู้สึกไม่เป็นส่วนบุคคล เรื่องที่บรรยายด้วยเสียงจริงของพ่อแม่ - หรือเสียงของผู้เรียนเอง - รู้สึกต่างออกไป Prosody ที่คุ้นเคย จังหวะที่คุ้นเคย timbre ที่คุ้นเคย: สัญญาณเหล่านี้ส่งผ่านความปลอดภัยแทนที่จะเป็นของใหม่

วิธีการสร้าง Social Story ที่มีเสียงโดยใช้ AI สำหรับการโคลนเสียง:

เขียนข้อความ Social Story ตามแนวทางของ Carol Gray (พร้อมใช้งานบนเว็บไซต์ของเธอ)
บันทึกเสียงที่สะอาด 5-10 นาทีจากแบบจำลองเสียงที่เลือก (ผู้ปกครอง ผู้บำบัด หรือ - ด้วยความยินยอม - ผู้เรียนจากการบันทึกก่อนหน้า)
ฝึกโคลนเสียงในเครื่องบน Windows โดยใช้ VoxBooster - แบบจำลองทำงานบนอุปกรณ์ ดังนั้นเสียงจึงไม่ลบหรือไปยังคลินิก
สร้างเสียง Social Story ที่บรรยายโดยพิมพ์สคริปต์ลงในอินเทอร์เฟซการสังเคราะห์เสียง
ส่งออกเป็นไฟล์ MP3 หรือ WAV และโหลดไปยังแท็บเล็ต โทรศัพท์ หรืออุปกรณ์ AAC ที่ผู้เรียนใช้อยู่แล้ว
ให้ผู้เรียนควบคุมการจ่ายเสียง

ขั้นตอนการทำงาน ทั้งหมดนี้สามารถตั้งค่าโดยผู้ดูแลโดยไม่มีพื้นฐานด้านวิศวกรรมเสียง SLP ให้สคริปต์ ผู้ปกครองให้บันทึกเสียง VoxBooster จัดการการสังเคราะห์

สำหรับผู้เรียนที่ได้รับประโยชน์จากการสร้างแบบจำลองการออกเสียง โปรดดูคำแนะนำของเราเกี่ยวกับการโคลนเสียงและการฝึกออกเสียงด้วย

ผู้ใช้ AAC บนสเปกตรัม Autism: เสียงสังเคราะห์ที่ปรับแต่งเอง

Augmentative and Alternative Communication (AAC) ครอบคลุมวิธีการใด ๆ - เทคโนโลยีต่ำ (บอร์ดรูป) หรือเทคโนโลยีสูง (อุปกรณ์ที่สร้างคำพูด) - ที่สนับสนุนหรือแทนที่ภาษาพูด สำหรับบุคคล autism ที่ไม่พูดหรือพูดได้น้อยที่สุด AAC เทคโนโลยีสูงโดยปกติจะสร้างคำพูดสังเคราะห์ และคุณภาพของเสียงสังเคราะห์นั้นมีความสำคัญมากกว่าที่นักเรียนคลินิกหลายคนตระหนักในตอนแรก

การวิจัยจากเขตข้อมูล AAC แสดงว่าคู่ของการสื่อสารตอบสนองต่างกันสำหรับคำพูดที่สร้างขึ้นโดยอุปกรณ์ขึ้นอยู่กับคุณภาพเสียงและการจับคู่ตัวตนที่เห็น เด็กชายวัยรุ่นที่ใช้เสียงตัวเมีย หนึ่งผู้ใหญ่ทั่วไปสร้างความไม่ตรงกันที่ส่งผลกระทบต่อวิธีที่เพื่อน ๆ และผู้ใหญ่โต้ตอบกับเขา - ซึ่งในทางกลับกัน ส่งผลกระทบต่อแรงจูงใจของผู้เรียนในการสื่อสาร

AI สำหรับการโคลนเสียงสามารถให้ผู้ใช้ AAC มีเสียงสังเคราะห์ที่:

จับคู่อายุ เพศ และลำเพง ภูมิภาคของพวกเขาใกล้เคียงที่สุด
ดึงมาจากสมาชิกครอบครัวที่มีโปรไฟล์เสียงคล้ายกันเมื่อผู้ใช้ไม่มีบันทึกที่ใช้ได้
บันทึก “ธนาคาร” ของเสียงผู้เรียนจากช่วงเวลาการพูดก่อนหน้า (ก่อนโรค บาดเจอ หรือการถดถอย) เพื่อให้ผลลัพธ์ AAC ในอนาคตฟังเหมือนพวกเขา

ขั้นตอนธรรมชาติสำหรับธนาคารเสียง AAC:

บันทึกเสียงเป้าหมายในห้องเงียบโดยใช้ไมโครโฟนที่ดี - แม้แต่ไมโครโฟนสมาร์ทโฟนจะทำงานหากควบคุมเสียงพื้นหลัง
เป้าหมายอย่างน้อย 300 ประโยคที่มีความหลากหลายซึ่งครอบคลุมเสียงสระต่างกัน การผัน intonation คำถาม และสมดุลทางอารมณ์
ฝึกแบบจำลองเสียงใน VoxBooster ซอฟต์แวร์ทำงานในเครื่อง ซึ่งสำคัญสำหรับการพิจารณาความเป็นส่วนตัวของการแพทย์
รวมเสียงที่ส่งออกลงในระบบ AAC อุปกรณ์และแอปพลิเคชัน AAC สมัยใหม่ส่วนใหญ่ยอมรับไฟล์เสียงที่กำหนดเอง

SLP ที่เชี่ยวชาญใน AAC สามารถช่วยครอบครัวระบุเมื่อธนาคารเสียงเหมาะสมและประโยคใดที่จะบันทึกเพื่อให้ได้ช่วงเสียง phonetic สูงสุด เครือข่าย ISAAC (องค์กรสากลเพื่อการสื่อสารเพิ่มเติมและสำรอง) ให้บริการทรัพยากรผู้บริหาร

การกำหนดค่าเสียงที่เป็นมิตรต่ออารมณ์

สำหรับผู้ฟัง autism - โดยเฉพาะอย่างยิ่งผู้ที่มีความสัมผัสด้านการได้ยิน - คุณสมบัติเสียงของเสียงสามารถตัดสินใจได้ว่าเซสชั่นมีประสิทธิผลหรือล้นพ้น นี่ไม่ใช่เรื่องเกี่ยวกับการกำหนดเองสำหรับบางบุคคล ลักษณะเสียงบางอย่าง สร้างปฏิกิริยาความรู้สึกที่แท้จริงซึ่งขัดขวางการประมวลผล

การตั้งค่าเพื่อปรับเสียงให้เหมาะสม:

พารามิเตอร์	เป้าหมายที่เป็นมิตรต่ออารมณ์	สิ่งที่ต้องหลีกเลี่ยง
อัตราการพูด	130-150 คำต่อนาที	การพูดอย่างรวดเร็ว (>170 wpm)
โครงร่างระดับเสียง	ค่อนข้างอุ่นขึ้น ความแปรผันปานกลาง	ระดับเสียงแหลมที่เฉียบพลัน โมโนโทนหุ่นยนต์
ซองจดหมายระดับเสียง	สอดคล้องกัน ไม่มีการกระโดดที่ฉับพลัน	การเน้นเสียงดังบนสัญญาณเสียง
การส่งผ่านสัญญาณเสียง	ทำให้อ่อน หลีกเลี่ยงการส่งผ่านสัญญาณ “p / t / k”	การส่งผ่านสัญญาณ plosive ที่ไม่ได้กรอง
Reverb / Gating ห้อง	ต่ำสุด (สัญญาณแห้งหรือเกือบแห้ง)	การสะท้อนเสียงห้อง สิ่งประดิษฐ์ reverb
เสียงพื้นหลัง	ไม่มี - เพียงเสียงที่สะอาด	เสียงรอบข้าง

เมื่อใช้ VoxBooster ในการสร้างคำเล่า ท่อ synthesis ได้ประมวลผลเสียงที่ระดับแบบจำลอง ปรับเปลี่ยนเพิ่มเติมสามารถทำได้เมื่อส่งออก: ตัวกรองสูงผ่านแบบสบาย ๆ เหนือ 8 kHz และเครื่องบีบอัดเบา ๆ ด้วยการโจมตีที่ช้า (≥20ms) ช่วยให้เรียบสิ่งประดิษฐ์ transient โดยไม่ลบคุณลักษณะเสียง

ทดสอบความเข้าที่อารมณ์: ผู้พิพากษาที่ดีที่สุดคือผู้เรียน ก่อนที่จะมุ่งมั่นกับชุดเสียง Social Story เต็มรูปแบบ ให้สร้างตัวอย่าง 30 วินาทีและเล่นผ่านอุปกรณ์ที่ผู้เรียนจะใช้จริง ๆ (ลำโพงแท็บเล็ต ชุดหูฟัง ฯลฯ) ให้พวกเขาระบุว่ามันรู้สึกสบายใจหรือไม่ ผู้ใช้ที่ไม่พูดสามารถส่งสัญญาณด้วยสัญลักษณ์ใช่/ไม่ใช่หรือท่าทาง

การเรียนรู้ที่นำโดยเด็ก: หลักการออกแบบสำหรับผู้เรียน Autism

การตัดสินใจออกแบบที่สำคัญที่สุดในการฝึกอบรมที่รับการสนับสนุนโดยการโคลนเสียงคือใครควบคุมจังหวะ ซอฟต์แวร์ฝึกสอนทักษะแบบดั้งเดิมมักจะเดินหน้าอัตโนมัติ ซึ่งขจัดความรู้สึกของตัวตนของผู้เรียนและจำลองแรงกดดันทางสังคมที่ทำให้ปฏิสัมพันธ์สด ๆ มีความยากลำบาก

หลักการสำหรับการฝึกเสียงที่นำโดยเด็ก:

ไม่มีการเดินหน้าโดยอัตโนมัติ แต่ละข้อความจะเล่นครั้งหนึ่ง จากนั้นรอ ผู้เรียนเริ่มข้อความถัดไป
การทำซ้ำไม่มีขีด จำกัด โดยไม่มีการตัดสิน ระบบจะไม่ “หมดเวลา” หรือแสดงสัญญาณความผิดหวัง
เสียงที่สอดคล้องกันทั่วทั้งเซสชัน การใช้เสียงโคลนเดียวกันแต่ละครั้งจะช่วยลดความกังวลที่เกี่ยวข้องกับความใหม่ การสลับเสียงต้องตั้งใจและประกาศล่วงหน้า
จุดเริ่มต้นและจุดสิ้นสุดที่ชัดเจน ผู้เรียน autism มักได้รับประโยชน์จากบทเปิด (“ขอเล่นทำให้เหน็ดเหนื่อยใจกันน”) และปิด (“ทำให้เหน็ดเหนื่อยใจกันน เสร็จสิ้นวันนี้”) เพื่อส่งสัญญาณขอบเขตเซสชัน
ตัวเลือกสถานการณ์ หากทำได้ ให้ผู้เรียนเลือกว่าจะฝึกสคริปต์สังคมใด แทนที่จะกำหนดมัน การเลือกตามความชอบจะเพิ่มแรงจูงใจและการโอนไปยังสถานการณ์จริง
ความล้มเหลวเป็นส่วนตัว การฝึกโคลนเสียงเกิดขึ้นเพียงอย่างเดียวหรือกับผู้ใหญ่ที่เชื่อถือได้คนหนึ่ง - ไม่มีเพื่อน ๆ ที่มองหา ไม่มีการตัดสินทางสังคมสำหรับการสะดุดลง

หลักการเหล่านี้ตรงกับกรอบการปฏิบัติ Neurodiversity-Affirming ซึ่งได้กลายเป็นมาตรฐานในการฝึก SLP ซึ่งเน้นการยืนยัน autism แทนการแทรกแซง

ข้อเสนอแนะ SLP: วิธีที่นักเรียนคลินิกใช้ Voice AI

นักบำบัดสำหรับคำพูดและภาษาที่ทำงานในบริบท autism และ AAC เป็นผู้ใช้ในช่วงเริ่มต้นของเครื่องมือโคลนเสียง เพราะลูกค้าของพวกเขาอยู่ในประวัติศาสตร์ที่ได้รับบริการจากระบบ TTS ทั่วไป SLP รายงานการใช้ voice AI ในสามวิธีหลัก:

1. การฝึกซ้อม ๆ ระหว่างเซสชัน SLP ออกแบบสคริปต์และกำหนดการบรรยายอ้างอิงเสียงเป็นการฝึกซ้อม ๆ (เทียบเท่ากับการบ้านในการบำบัดแบบดั้งเดิม) ผู้เรียนฝึกซ้อมด้วยเสียงโคลนของนักบำบัด ลดแรงกดดันในการแสดงของเซสชั่นสด

2. การฝึกสอนของผู้ปกครอง SLP สอนผู้ปกครองในการสร้าง Social Stories ที่มีเสียงอย่างเป็นอิสระ นี่เพิ่มความถี่ของการฝึกอบรมอย่างมาก เนื่องจากผู้ปกครองสามารถสร้าง stories ใหม่สำหรับสถานการณ์ใหม่ (วันแรกที่โรงเรียนใหม่ การแพทย์ งานเลี้ยงวันเกิด) โดยไม่รอนัดหมายคลินิกถัดไป

3. ธนาคารเสียงสำหรับผู้ใช้ AAC SLP เริ่มการสนทนาธนาคารเสียงในช่วงต้น - โดยเฉพาะอย่างยิ่งก่อนที่ผู้เรียนจะสูญเสียคำพูดที่มีนัยสำคัญ - และชี้นำครอบครัวผ่านกระบวนการบันทึก จำนวนมากของ SLP ตอนนี้ถือว่านี่เป็นส่วนหนึ่งของการประเมิน AAC มาตรฐาน

ทรัพยากรภายนอกที่มีประโยชน์คือพอร์ทัลการปฏิบัติของ ASHA บน AAC ซึ่งรวมคำแนะนำทางคลินิกเกี่ยวกับคุณภาพเสียงที่ส่งออกและตัวเลือกการเลือกเทคโนโลยี

สำหรับผู้เรียนที่ยังใช้การฝึกเสียงสำหรับเป้าหมายความพร้อมสำหรับงาน โปรดดูคำแนะนำของเราเกี่ยวกับการโคลนเสียงและการเตรียมการสัมภาษณ์งาน

ข้อควรพิจารณาด้านจริยธรรม: การยินยอมและความปลอดภัยของข้อมูล

บริบทการฝึกซ้อม Autism แนะนำข้อพิจารณาด้านจริยธรรมเฉพาะที่ไม่ใช้สำหรับกรณีการใช้การโคลนเสียงทั่วไป

ความเห็นชอบ: บุคคล autism - รวมถึงผู้ที่ไม่พูด - สมควรได้รับการยินยอมที่สำนึกสติในการตัดสินใจเกี่ยวกับข้อมูลเสียงของตนเอง “Meaningful” หมายถึงการปรับให้เข้ากับความต้องการในการสื่อสารของพวกเขา: แบบฟอร์มความเห็นชอบตามรูปภาพ ภาษาอย่างง่าย เวลาในการประมวลผล และวิธีการบอกว่าไม่มีผลที่ตามมา สำหรับเด็ก ต้องมีการยินยอมของผู้ปกครอง แต่การยินยอมจากเด็กควรยังขอได้ในลักษณะที่สามารถเข้าถึงได้

การจัดเก็บข้อมูลเสียง: การโต้แย้งความปลอดภัยข้อมูลที่แข็งแกร่งที่สุดสำหรับการประมวลผล AI เสียงในเครื่อง (เทียบกับบริการบนคลาวด์) คือข้อมูลการฝึก - ซึ่งรวมถึงการบันทึกเสียงของบุคคล - ไม่เคยออกจากอุปกรณ์ สำหรับครอบครัวที่นำทางบริบททางการแพทย์ การศึกษา หรือกฎหมาย ความแตกต่างนี้มีความสำคัญ VoxBooster ทำงานแบบจำลองเสียงทั้งหมดบน PC Windows ทำให้เหมาะสมสำหรับการตั้งค่าคลินิกและโรงเรียนที่มีข้อกำหนดการปกครองข้อมูลที่เข้มงวด

ตัวตนของเสียงและศักดิ์ศรี: เสียงโคลนเป็นตัวแทนของตัวตนของบุคคล มันควรใช้ได้เพียงในลักษณะที่บุคคลนั้น (หรือครอบครัว สำหรับเด็กเล็ก ๆ) ยินยอม และไม่ควรได้รับการแก้ไขให้พูดสิ่งต่างๆ ที่บิดเบือนบุคคลนั้นหรือทำให้เสียใจ

ผลลัพธ์เสียงเชิงพาณิชย์: หากเสียงโคลนของผู้เรียนเคยใช้ในผลิตภัณฑ์ (เช่น แอปพลิเคชัน AAC ที่เล่าขาน ขายให้คนอื่น) มันจะเข้าไปในอาณาเขตเชิงพาณิชย์ต้องใบอนุญาตอย่างชัดเจน สำหรับการฝึกการศึกษาและส่วนตัว ข้อกังวลนี้ไม่ได้ใช้

สำหรับกรอบที่ครอบคลุมมากขึ้น โปรดดูคำแนะนำของเราเกี่ยวกับการโคลนเสียงและจริยธรรม

การเตรียมเซสชัน: ทีละขั้นตอน

นี่คือขั้นตอนการทำงานของผู้ปกครองหรือ SLP ที่สร้างเซสชั่นการฝึกโคลนเสียงแรกสำหรับผู้เรียน autism

ก่อนที่คุณจะเริ่มต้น:

เขียน Social Stories 3-5 เป้าหมายปัจจุบัน IEP หรือเป้าหมายการบำบัด
รวบรวมการบันทึกที่สะอาด 5-10 นาทีจากแบบจำลองเสียงที่เลือก (ผู้ปกครองหรือนักบำบัด)
มีแท็บเล็ตหรืออุปกรณ์ที่ผู้เรียนใช้อย่างสบายใจ

การตั้งค่า (ครั้งเดียว 30-60 นาที):

ติดตั้ง VoxBooster บน Windows 10/11 เริ่มการทดลองใช้ฟรี 3 วัน - ไม่จำเป็นต้องใช้บัตรเครดิต
เปิดส่วนการโคลนเสียง AI และนำเข้าการบันทึกเสียง
ฝึกแบบจำลองเสียง การประมวลผลใช้เวลา 10-30 นาทีขึ้นอยู่กับ PC
พิมพ์สคริปต์ Social Story แรกลงในหน้าต่างการสังเคราะห์ ฟังการแสดงตัวอย่าง
ปรับอัตราการพูดในการตั้งค่าผลลัพธ์เป็น 140 คำต่อนาทีหากค่าเริ่มต้นรู้สึกว่าเร็ว
ส่งออกเรื่องที่บรรยายเป็นไฟล์ WAV หรือ MP3
โหลดไฟล์ลงในอุปกรณ์ของผู้เรียน

แต่ละเซสชั่นการฝึก (5-15 นาที):

ผู้เรียนเลือกเรื่องที่จะฟัง (บอร์ดตัวเลือกภาพทำงานได้ดี)
เรื่องเล่น ผู้เรียนควบคุมการเล่นซ้ำ/หยุด ผ่านอินเทอร์เฟซปุ่มขนาดใหญ่หรือผู้ดูแล
หลังเรื่อง ผู้บำบัดหรือผู้ดูแลถามคำถามความเข้าใจ 1-2 ข้อหรือส่งเสริมการตอบสนองการสวมบท
ทำเครื่องหมายเซสชั่นในบันทึกติดตาม (เรื่องไหน เล่นซ้ำ กี่ครั้ง การมีส่วนร่วมที่สังเกต)
จบด้วยวลีปิดที่สอดคล้องกัน

เมื่อผู้เรียนมีความก้าวหน้า สคริปต์สามารถนำเสนอความซับซ้อนที่มากขึ้น - เหตุการณ์ที่ไม่คาดคิด การแก้ไขความขัดแย้ง การเอกสิทธิ์มุมมอง - ตามเสียงเดียวกันที่พวกเขารู้สึกว่าน่าเชื่อถือแล้ว

คำถามที่พบบ่อย

การโคลนเสียงสามารถช่วยผู้ที่เป็น autism ด้วยทักษะสังคมได้หรือไม่

ได้ การโคลนเสียง AI ช่วยให้บุคคลที่เป็น autism ฝึกสนทนาจริงในสภาพแวดล้อมที่มีความเครียดต่ำ เล่นสถานการณ์ซ้ำในกระบวนการของพวกเขาและได้ยินเสียงที่คุ้นเคยในการบรรยายเรื่องราว Social Stories SLP หลายคนรายงานว่าความกังวลลดลงเมื่อเซสชั่นการฝึกใช้เสียงที่เชื่อถือได้แทนลำโพง text-to-speech ที่ไม่คุ้นเคย

Social Story (พัฒนาโดย Carol Gray) เป็นการบรรยายคนแรกอันสั้น ๆ ที่อธิบายสถานการณ์สังคมและการตอบสนองที่เหมาะสม การเพิ่มเสียงโคลน - โดยอุดมคติคือพ่อแม่ ผู้บำบัด หรือเสียงของผู้เรียนเอง - ทำให้เรื่องรู้สึกส่วนตัวและคุ้นเคย ซึ่งเพิ่มการมีส่วนร่วมและการเก็บรักษาเมื่อเทียบกับเสียง TTS ทั่วไป

การโคลนเสียง AI ปลอดภัยสำหรับเด็ก autism หรือไม่

เมื่อตั้งค่าโดยผู้ดูแลหรือ SLP และทำงานในเครื่องบน Windows (ไม่มีการอัปโหลดเสียงของเด็กไปยัง cloud) ถือว่าปลอดภัย การประมวลผลในเครื่องหมายความว่าข้อมูลเสียงที่บันทึก ไม่เคยออกจากอุปกรณ์ ได้รับการยินยอมที่สำนึกสติจากเด็กและครอบครัวเสมอก่อนโคลนเสียงใด ๆ และปฏิบัติตามนโยบายการปกป้องข้อมูลของโรงเรียนหรือคลินิกของคุณ

ลักษณะเสียงใดที่เป็นมิตรกับความรู้สึกสำหรับผู้ฟังที่เป็น autism

เสียงที่เป็นมิตรต่ออารมณ์มี: อัตราการพูดปกติ (130-150 คำต่อนาที) โครงร่างสนามไทยหรืออุ่นเล็กน้อย ไม่มีการแลดกระแสเสียงหรือการส่งผ่านสัญญาณเฉียบพลัน การสะท้อนเสียงหรือเสียงสะท้อนห้องน้อยที่สุด และจังหวะที่สอดคล้องกัน หลีกเลี่ยงเสียงเดียวแบบหุ่นยนต์ (ไม่น่าสนใจ) และเสียงที่มีการเคลื่อนไหวมากเกินไป (มีศักยภาพในการล้นไปหมด) เสียงที่คุ้นเคยซึ่งถูกโคลนตามธรรมชาติเข้าถึงเกณฑ์ส่วนใหญ่เหล่านี้

บุคคลที่เป็น autism ซึ่งไม่พูดคุยสามารถใช้การโคลนเสียงสำหรับ AAC ได้หรือไม่

ได้ ผู้ใช้ AAC - รวมถึงผู้ที่พูดน้อยหรือไม่พูดคุย - สามารถมีเสียงสังเคราะห์ส่วนบุคคลที่สร้างขึ้นจากการบันทึกที่ทำในช่วงเวลาการพูดก่อนหน้านี้ จากสมาชิกครอบครัวที่มีโปรไฟล์เสียงคล้ายกัน หรือจากตัวอย่างสั้น ๆ ของเสียงที่ต้องการใด ๆ สิ่งนี้ให้ผลลัพธ์ AAC คุณภาพมนุษย์ที่ใกล้เคียงกับบุคคลมากกว่าเสียงอุปกรณ์ทั่วไป

การใช้เสียงโคลนแทนที่หมอ Speech-language pathologist ได้หรือไม่

ไม่ การโคลนเสียงเป็นเครื่องมือฝึกสอน ไม่ใช่นักเรียนคลินิก SLP ออกแบบสคริปต์ทางสังคม ปรับความยากจะเพิ่มขึ้น ตีความการตอบสนองของผู้เรียนและตัดสินใจว่าจะเมื่อใด การเพิ่มขึ้น เสียงที่โคลนเพียงแค่ส่งคำแนะนำการฝึกอบรมในรูปแบบที่ผู้เรียน autism มักจะพบว่าสามารถเข้าถึงได้มากขึ้น ให้คิดว่ามันเป็นการบ้านที่บันทึกด้วยเสียงที่คุ้นเคย ไม่ใช่การบำบัดตัวมันเอง

ระดับการสนับสนุน autism ใดได้ประโยชน์มากที่สุดจากการฝึกการโคลนเสียง

การวิจัยเกี่ยวกับการฝึกทักษะสังคมที่ได้รับการสนับสนุนโดยเทคโนโลยีครอบคลุมระดับ 1 ถึงระดับ 3 บุคคล autism ระดับ 1 และ 2 มีแนวโน้มที่จะเข้าร่วมอย่างเป็นอิสระมากที่สุดกับการฝึกการโคลนเสียง ผู้ใช้ระดับ 3 ได้รับประโยชน์เมื่อผู้ดูแลอยู่ด้วยกัน ชี้นำการโต้ตอบกับเสียง ไม่มีระดับใดที่ถูกแยกออก - วิธีนี้เข้ากับผู้เรียน

บทสรุป

การฝึกเสียงทักษะสังคม autism รับเครื่องมือที่มีประสิทธิผลอย่างแท้จริงเมื่อการโคลนเสียง AI เข้ามาในภาพ - ไม่ใช่เป็นการแทนที่การบำบัดที่ได้รับการชี้นำจาก SLP แต่เป็นกลไกการจัดส่งที่ทำให้การฝึกอบรมสามารถเข้าถึง ส่วนบุคคล และนำมาซ้ำได้มากกว่าสิ่งใดที่มีอยู่ก่อนหน้านี้ Social Stories ที่บรรยายด้วยเสียงที่คุ้นเคย ระบบ AAC ที่มีการพูดสังเคราะห์ที่ตรงกับตัวตน และข้อความเสียง AI ความสื่อสารสัตว์ Autism ที่ทำงานในเครื่องและส่วนตัวบน PC Windows นั้นสมจริงวันนี้ ไม่ใช่สมมติฐาน

ข้อมูลเชิงลึกหลักจากนักเรียนคลินิกที่ทำงานในพื้นที่นี้: บุคคล autism ไม่ต้านการฝึกอบรม - พวกเขามักจะต้านทุกสภาพแวดล้อมที่สร้างขึ้นโดยการฝึกอบรมแบบดั้งเดิม (เสียงไม่คุ้นเคย ความเครียดทางสังคม การจัดส่งที่ไม่สอดคล้องกัน เครื่องมือไม่เป็นส่วนบุคคล) เปลี่ยนกลไกการจัดส่งและการมีส่วนร่วมตามมา

VoxBooster ทำงานแบบจำลองเสียงในเครื่องบน Windows 10/11 ฝึกในแต่ละนาทีของเสียงที่บันทึก และส่งออกเป็นรูปแบบเสียงมาตรฐานที่โหลดโดยตรงไปยังแท็บเล็ต อุปกรณ์ AAC หรือเครื่องเล่นมีเดีย การทดลองใช้ฟรี 3 วันไม่ต้องใช้บัตรเครดิต หากเซสชั่น Social Story แรกของคุณดำเนินไปอย่างดี คุณจะมีความคิดที่ชัดเจนว่าสิ่งนี้เข้ากับกล่องเครื่องมือของคุณหรือไม่ ก่อนที่จะใช้จ่าย

สำหรับ SLP ที่สร้างห้องสมุดการฝึกอบรมที่ได้รับการสนับสนุนโดย voice-AI คำแนะนำของเราเกี่ยวกับการโคลนเสียงและ voiceover ครอบคลุมคุณภาพเสียงและขั้นตอนการส่งออกในรายละเอียดที่มากขึ้น