Bộ Thay Đổi Giọng Nói Stephen Hawking: Âm Thanh Synth Biểu Tượng
Bộ thay đổi giọng nói stephen hawking là một trong những yêu cầu bất thường hơn trong thế giới hiệu ứng giọng nói - không phải vì nó khó về kỹ thuật, mà vì bản gốc chính nó là một phần của phần mềm. Hawking không điều chỉnh giọng nói tự nhiên của anh ấy qua một bộ lọc; anh ấy đã gõ, và một bộ tổng hợp giọng nói đã nói cho anh ấy. Hiểu được sự phân biệt đó thay đổi cách bạn tiếp cận tái tạo âm thanh, và nó hoá ra con đường kỹ thuật thú vị hơn hầu hết mọi người mong đợi.
Bài viết này bao gồm toàn bộ câu chuyện: giọng nói asli thực sự là gì, tại sao nó nghe như vậy ở một mức xử lý tín hiệu, cách âm thanh trở thành biểu tượng văn hóa, và cách thực tế nhất để tái tạo một giọng nói tổng hợp robot tương tự để streaming, Discord, gaming, hoặc dự án sáng tạo năm 2026.
TL;DR
- Giọng nói của Hawking được tạo ra bởi một hệ thống TTS dựa trên DECtalk sử dụng preset “Perfect Paul”, không phải giọng nói tự nhiên đã sửa đổi
- Âm thanh đặc trưng đến từ tổng hợp formant: nguyên âm và phụ âm được tạo từ các mô hình toán học của kênh giọng nói, không phải lời nói được ghi âm
- Tái tạo nó yêu cầu đầu ra TTS cộng với DSP nhẹ: biến đổi pitch được làm phẳng, bộ lọc low-pass nhẹ, và cấu trúc điện tử tinh tế
- Các công cụ TTS hiện đại kết hợp với phần mềm hiệu ứng giọng nói có thể được gần đáng ngạc nhiên
- Hiệu ứng hoạt động trong Discord, OBS, và bất kỳ ứng dụng nào chấp nhận một micrô ảo
- Bảng TTS VoxBooster + hiệu ứng giọng nói robot bao gồm quy trình công việc này end-to-end
Giọng Nói Thực Sự Của Stephen Hawking Là Gì?
Hầu hết mọi người cho rằng Hawking đã sử dụng một loại bộ lọc trên giọng nói của anh ấy. Anh ấy đã không. Sau khi mất khả năng nói sau phẫu thuật tracheotomy khẩn cấp năm 1985, anh ấy giao tiếp đầu tiên bằng cách nâng lông mày để lựa chọn các ký tự từ một thẻ chi phí, sau đó sử dụng một cảm biến cơ bào để cho phép anh ấy lựa chọn các từ từ một giao diện cuộn trên máy tính xe lăn của anh ấy.
Máy tính sau đó nói xác định văn bản to rõ bằng một bộ tổng hợp giọng nói. Phần cứng asli được xây dựng bởi Words+ và sử dụng DECtalk, một hệ thống text-to-speech kỹ thuật số được phát triển bởi Digital Equipment Corporation. Cụ thể, preset giọng nói được gọi là “Perfect Paul,” một trong một số giọng nói ký tự được tích hợp vào hệ thống DECtalk.
DECtalk là state-of-the-art cho thời đại của nó. Thay vì ghép các mẫu phoneme được ghi âm trước đó (cách tiếp cận mà hầu hết các hệ thống TTS hiện đại sử dụng), nó sử dụng một phương pháp gọi là tổng hợp formant - một mô hình tính toán của kênh giọng nói con người tạo ra âm thanh giọng nói từ nguyên tắc đầu tiên bằng các phương trình toán học. Kết quả có một chất lượng đặc biệt: nó có thể nhận diện được như lời nói, nhưng các formant (các đỉnh tần số cộng hưởng giúp đặc tính nguyên âm) được tạo ra bởi một filterbank chứ không phải một cổ họng và miệng thực sự. Đó là những gì làm cho giọng nói có chất lượng hơi rỗng, nhất quán hoàn hảo, không phải con người.
Hawking giữ giọng nói ngay cả khi phần cứng cơ bản được nâng cấp nhiều lần trong hàng chục năm. Khi mọi người đề xuất các lựa chọn thay thế nghe tự nhiên hơn, anh ấy từ chối. Giọng nói đã trở thành danh tính của anh ấy - được công nhận quốc tế theo cách mà không có giọng nói con người nào có thể so sánh sau nhiều năm xuất hiện công khai, bài giảng, và tài liệu.
Tại Sao Tổng Hợp Formant Nghe Khác Với TTS Hiện Đại?
Để hiểu rõ chữ ký âm thanh mà bạn đang cố gắng tái tạo, sẽ hữu ích nếu biết tại sao tổng hợp formant nghe theo cách nó so với các hệ thống TTS đương đại.
TTS Hiện Đại - bao gồm các giọng nói được tích hợp vào Windows, macOS, và các dịch vụ đám mây như Google Cloud TTS - thường sử dụng các mạng thần kinh được đào tạo trên các bộ dữ liệu lớn về lời nói con người được ghi âm. Đầu ra nghe tự nhiên vì mô hình đã học các mẫu âm thanh của hiệu suất vokal thực tế: hô hấp, coarticulation, biến thể pitch siêu nhỏ, de-emphasis tinh tế của các sílaba không được nhấn. Khi bạn nhắm mắt lại, bạn thường có thể nhầm lẫn cho một người thực sự.
Tổng hợp formant không có bất kỳ cái nào trong số đó. Nó mô hình hóa vật lý của kênh giọng nói - glotis, họng, buồng miệng, môi - như một loạt các ống cộng hưởng và bộ lọc. Các tham số cho mỗi phoneme được chỉ định toán học. Kết quả là:
- Prosody phẳng: đường cong intonation giữa các sílaba đều đặn hơn nhiều, với chuyển tiếp pitch đột ngột chứ không phải dần dần
- Không có tiếng ồn hô hấp: không có sự hô hấp, không có ma sát tinh tế trên fricatives, không có room tone chảy máu
- Formants nhất quán: mỗi vowal “o” nghe giống với mỗi vowal “o” khác, đó không phải cách con người nói chuyện
- Cấu trúc điện tử: tín hiệu nguồn (xung “glottal” điều khiển mô hình kênh giọng nói) có chất lượng hơi rất hơn sự rung động của các nếp gấp giọng nói sinh học
Những đặc điểm này xếp chồng lên nhau để tạo ra thứ gì đó nghe như giọng nói và máy cùng một lúc - đó là chính xác những gì nó là.
Trọng Lượng Văn Hóa Của Giọng Nói
Sẽ không hoàn tất để thảo luận về chủ đề này hoàn toàn từ một góc độ xử lý tín hiệu. Giọng nói tổng hợp của Hawking trở thành một trong những giọng nói được công nhận nhiều nhất trên thế giới, xuất hiện trong các tài liệu, các xuất hiện trên truyền hình, bài giảng tại các đại học hàng đầu, và thậm chí trong âm nhạc. Pink Floyd đã bao gồm một bản ghi âm của giọng nói anh ấy trong “Keep Talking” trên The Division Bell (1994). Anh ấy có một vai trò khách lặp đi lặp lại trên The Simpsons. Anh ấy xuất hiện trong Star Trek: The Next Generation chơi poker với Newton, Einstein, và Data.
Giọng nói trở thành được kết hợp rất nhiều với trí thông minh, trí tuệ, và thẩm quyền khoa học mà nhiều người báo cáo thấy tổng hợp kiểu DECtalk có uy tín trí tuệ hơn lời nói tự nhiên trong các bối cảnh nhất định - một phản hồi hoàn toàn chủ quan, nhưng được ghi chép. Đối với người phát trực tiếp và những người sáng tạo nội dung, tái tạo thẩm mỹ chung của một giọng nói tổng hợp yên tĩnh, phẳng mang lại sự cộng hưởng văn hóa đó ngay cả khi những người nghe không có ý định nhận ra tham chiếu.
Cách Tái Tạo Âm Thanh: Cách Tiếp Cận Kỹ Thuật
Có hai con đường chính để tái tạo một giọng nói tổng hợp kiểu Hawking, và lựa chọn tốt hơn phụ thuộc vào những gì bạn đang sử dụng nó cho.
Con Đường 1 - Text-to-Speech Với Shine DSP
Đây là cách tiếp cận chính xác về mặt lịch sử và hoạt động tốt nhất cho nội dung ngoài khóa học, video, hoặc các tình huống mà bạn đang gõ những gì bạn muốn nói chứ không phải nói.
Ý tưởng là lấy bất kỳ công cụ TTS nào và áp dụng xử lý sau để làm cho nó nghe giống như tổng hợp formant hơn:
- Chọn một giọng nói TTS với sự biểu cảm thấp hơn. Các giọng nói thần kinh có sự biểu cảm cao sẽ chống lại bạn - họ thay đổi pitch và tốc độ để mô phỏng các mẫu lời nói tự nhiên. Một giọng nói TTS monotone kiểu cũ cung cấp một điểm khởi đầu tốt hơn.
- Làm phẳng biến đổi cao độ. Hiệu ứng hiệu chỉnh cao độ nhẹ hoặc lượng tử hóa cao độ giảm phạm vi giữa điểm cao độ cao nhất và thấp nhất làm hẹp đường cong prosody hướng tới cách giao tiếp phẳng của tổng hợp formant.
- Áp dụng một bộ lọc low-pass. Cắt các tần số trên khoảng 4.000-6.000 Hz. Điều này loại bỏ các phụ âm sáng và fricatives giúp TTS thần kinh nghe giòn và tự nhiên. Kết quả là một ký tự hơi tắt, nặng tần số trung bình của phần cứng bộ tổng hợp lạc hậu.
- Thêm một bóp méo harmonics rất nhẹ hoặc ring modulator. Thậm chí 2-5% bóp méo harmonics thêm một buzz điện tử từ tín hiệu nguồn mà không rõ ràng nghe giống như quá tải gitar.
- Chuẩn hóa một âm lượng nhất quán. Tổng hợp formant tạo ra amplitudo gần như giống nhau trên tất cả các âm thanh. Chạy một bộ nén lembut với một tỷ lệ cao chuẩn hóa động lực theo cách mà lời nói con người không bao giờ khá đạt được.
Con Đường 2 - Live Voice Changer Cho Cách Sử Dụng Thời Gian Thực
Nếu bạn muốn nói tự nhiên và giọng nói của bạn được biến đổi trong thời gian thực - cho các cuộc gọi Discord, phiên gaming, hoặc streaming trực tiếp - một bộ thay đổi giọng nói chạy trên micrô của bạn là một tùy chọn thực tế.
Chuỗi DSP ở đây tương tự về khái niệm nhưng được áp dụng cho âm thanh trực tiếp:
- Hiệu chỉnh cao độ đến một mục tiêu cố định hoặc phạm vi hẹp. Làm phẳng biến đổi cao độ tự nhiên của bạn là bước duy nhất quan trọng nhất. Nếu giọng nói của bạn tự nhiên trượt lên các câu hỏi và xuống các tuyên bố, một hiệu chỉnh cao độ chặt loại bỏ những cái cong đó.
- Formant shift về phía trung tính. Dịch chuyển formants hơi về phía một kênh giọng nói trung bình loại bỏ chữ ký âm thanh cá nhân của giọng nói của bạn.
- Bộ lọc low-pass, các tham số tương tự như trên. Khoảng 4-6 kHz cutoff, độ dốc mềm.
- Ring modulation tinh tế hoặc hiệu ứng vocoder. Thậm chí một lượng tối thiểu của ring modulation ở một tần số mang thấp (khoảng 80-120 Hz) thêm ký tự điện tử mà không làm ngập giọng nói vào tính bất bình.
- Cổng tiếng ồn mềm để loại bỏ tiếng ồn hô hấp. Vì tổng hợp formant không có bất kỳ hô hấp nào cả, gating ngắt giữa các từ giúp duy trì cảm giác tổng hợp.
So Sánh: Các Cách Tiếp Cận Khác Nhau Đối Với Giọng Nói Synth Robot
| Phương Pháp | Chủ Nghĩa Hiện Thực | Dễ Dàng Thiết Lập | Thời Gian Thực | Tốt Nhất Cho |
|---|---|---|---|---|
| TTS Thuần Túy (không có DSP) | Giữa | Rất dễ | Không (gõ) | Video ngoài khóa học, lời nói |
| TTS + xử lý DSP sau | Cao | Giữa | Không | Nội dung YouTube, podcast |
| Live voice changer (chỉ DSP) | Giữa | Dễ | Có | Discord, gaming |
| Live voice changer + bảng TTS | Cao | Giữa | Cả hai chế độ | Streaming, sử dụng toàn năng |
| Dedicated formant synthesizer | Cao nhất | Khó | Bộ phận | Engineering audio, nghiên cứu |
Điểm ngọt cho hầu hết những người sáng tạo nội dung là cách tiếp cận kết hợp TTS + live voice changer. Bạn có thể chuyển đổi giữa gõ các dòng ngoài khóa học và nói tự nhiên (với các hiệu ứng được áp dụng) để có cuộc trò chuyện tự phát.
Thiết Lập Cho Discord
Nhận được hiệu ứng hoạt động trong Discord là một quá trình ba bước.
Bước 1 - Cấu Hình Micrô Ảo Của Bạn
Bất kỳ bộ thay đổi giọng nói nào định tuyến qua một micrô ảo sẽ hoạt động ở đây. VoxBooster cài đặt một micrô ảo Windows chuẩn xuất hiện trong trình quản lý thiết bị và cài đặt ứng dụng giống như một micrô vật lý. Mở ứng dụng VoxBooster, tải preset giọng nói robot/synth, và xác nhận micrô ảo hoạt động.
Bước 2 - Đặt Thiết Bị Đầu Vào Discord
Mở Discord, tới Cài Đặt Người Dùng, sau đó Suara và Video. Dưới Thiết Bị Đầu Vào, chọn micrô ảo VoxBooster (hoặc bất kỳ thiết bị ảo nào bộ thay đổi giọng nói của bạn tạo). Chạy bài kiểm tra Độ Nhạy Đầu Vào để xác nhận Discord đang chụp audio.
Bước 3 - Kiểm Tra và Điều Chỉnh
Nói vào micrô thực tế của bạn. Bạn sẽ nghe thấy giọng nói được xử lý trong tai nghe của bạn nếu bạn có chế độ monitor bật, và những người khác trong cuộc gọi của bạn sẽ nghe thấy hiệu ứng. Nếu giọng nói nghe quá được xử lý hoặc robot đến điểm mà nó khó hiểu, giảm cường độ ring modulation và nâng cutoff bộ lọc low-pass một chút - khả năng hiểu rõ ràng quan trọng hơn sự trung thành estetika chính xác.
Đối với chế độ TTS, quá trình tương tự nhưng bạn gõ vào bảng TTS VoxBooster và giọng nói tổng hợp tự động phát qua micrô ảo.
Thiết Lập Cho OBS Và Streaming
OBS đọc âm thanh từ định tuyến âm thanh của hệ thống của bạn, vì vậy thiết lập hơi khác từ Discord.
Sử Dụng Làm Nguồn Micrô
Thêm micrô ảo của bạn như một nguồn Audio Input Capture trong OBS. Định tuyến nó đến track bạn muốn (track 1 cho output stream là tiêu chuẩn, cộng với một track riêng biệt cho recording cục bộ nếu bạn muốn giọng nói thô trên một track khác). Áp dụng bộ lọc Noise Suppression tích hợp OBS nếu bạn muốn một lượt làm sạch bổ sung, mặc dù một bộ thay đổi giọng nói tốt sẽ đã xử lý nó.
Monitoring Trong Thời Gian Thực
Trong Cài Đặt Audio OBS, đặt thiết bị monitoring của bạn thành tai nghe của bạn và kích hoạt “Monitor and Output” trên nguồn micrô ảo. Điều này cho phép bạn nghe những gì stream đang nhận được, điều quan trọng để bắt các tạo tác không mong muốn trong chuỗi xử lý giọng nói synth.
Một tip thực hành: chạy một bài kiểm tra pre-stream ngắn với một người bạn trong cộng đồng của bạn. Giọng nói kiểu Hawking ngồi trong một jendela intelligibility hẹp - những người nghe cần nghe một vài câu để hiệu chỉnh, và sau đó nó nhấp. Bắt đầu một stream lạnh với nó thường gây nhầm lẫn cho mọi người trong 30 giây đầu tiên, điều quan trọng để giữ lại trên các nền tảng clip.
Hiệu Ứng Này Có An Toàn Chống Gian Lận Không?
Câu trả lời thành thật là: nó phụ thuộc vào cách bộ thay đổi giọng nói hoạt động bên dưới, không phải trên hiệu ứng nào bạn đang áp dụng.
Các hệ thống chống gian lận như Easy Anti-Cheat, BattlEye, và Vanguard Riot giám sát hoạt động cấp kernel để tìm dấu hiệu của tiêm mã hoặc thao tác bộ nhớ. Họ không giám sát đường dẫn âm thanh per se, nhưng một số phần mềm bộ thay đổi giọng nói sử dụng các trình điều khiển hạt nhân hoặc tiêm vào các quá trình hệ thống âm thanh theo cách có thể kích hoạt dương tính giả.
VoxBooster sử dụng API âm thanh low-latency audio capture Windows trực tiếp - không có trình điều khiển hạt nhân, không tiêm vào quá trình trò chơi. Micrô ảo nó tạo ra là một thiết bị audio Windows chuẩn được đăng ký qua stack trình điều khiển thiết bị bình thường. Cách tiếp cận này có thể xác minh được an toàn cho các môi trường chống gian lận. Nếu bạn đang sử dụng một công cụ khác, hãy kiểm tra xem nó có ghi lại một cách tiếp cận low-latency audio capture hoặc user-mode audio cụ thể hay không.
Thừa Kế DECtalk Trong Audio Hiện Đại
DECtalk không chỉ là giọng nói của một nhà khoa học nổi tiếng. Đó là một hệ thống được triển khai rộng rãi trong những năm 1980 và 1990 cho các hệ thống dịch vụ khách hàng điện thoại, các công cụ khả năng tiếp cận, và các ứng dụng điện toán sơ khai. Các giọng nói - Perfect Paul, Beautiful Betty, Huge Harry, và những người khác - trở thành các tạo tác văn hóa tình cờ.
Các nhà sản xuất âm nhạc đã lấy mẫu và thao tác tổng hợp kiểu DECtalk trong hàng chục năm. Các nhà soạn nhạc chipmusic sơ khai và demoscene đã sử dụng nó. Nghệ sĩ Daft Punk xây dựng một toàn bộ thẩm mỹ một phần quanh vocoder và thẩm mỹ giọng nói synth. Giọng nói của GLaDOS trong các trò chơi Portal rút ra từ một dòng dõi của lời nói tổng hợp mà DECtalk giúp xác định.
Năm 2023, một triển khai hoàn toàn mã nguồn mở của công cụ DECtalk asli đã được phát hành trên GitHub, điều này đã tái sinh lại mối quan tâm đến hồ sơ âm thanh cụ thể. Đối với các kỹ sư audio và nhà sản xuất âm nhạc quan tâm đến tổng hợp formant xác thực, điều đó vẫn là tuyến đường trực tiếp nhất đến âm thanh gốc. Đối với mọi người khác, các công cụ TTS hiện đại với chuỗi DSP được mô tả ở trên đi được hầu hết con đường ở đó với ma sát ít hơn nhiều.
Vai Trò Của VoxBooster Trong Quy Trình Công Việc Này
VoxBooster xử lý cả hai phía của quy trình công việc này trong một ứng dụng. Công cụ voice changer xử lý micrô của bạn qua một chuỗi hiệu ứng DSP trong thời gian thực, với một preset giọng nói robot/synth xử lý flattening pitch và cấu trúc điện tử. Bảng text-to-speech cho phép bạn gõ văn bản và có nó được nói qua micrô ảo - bao gồm các kịch bản nơi lời nói trực tiếp không thực tế.
Trang định giá có chi tiết về những gì được bao gồm trong mỗi kế hoạch, và bạn có thể kiểm tra mọi thứ trong dùng thử miễn phí 3 ngày mà không nhập thông tin thanh toán. Để sử dụng gaming anti-cheat-safe, định tuyến low-latency audio capture là một phần của thiết lập cơ sở, không phải một add-on cao cấp.
Nếu bạn đang kết hợp cái này với các clip soundboard - chẳng hạn, phát lại một clip audio DECtalk thực tế làm một giọng nói tham chiếu hoặc âm thanh giới thiệu - tài liệu soundboard bao gồm hotkey binding và định tuyến OBS.
Các Thiết Lập Liên Quan Đáng Được Đọc
Nếu hướng giọng nói synth robot quan tâm bạn, một vài thiết lập liên quan đáng có trong bộ công cụ của bạn:
- Robot Voice Effect - phân tích cụ thể của các chuỗi DSP để xử lý giọng nói robot, với chi tiết hơn trên các tham số ring modulation
- Radio Voice Effect - thẩm mỹ bộ lọc điện thoại và walkie-talkie chia sẻ một số DNA đường tín hiệu với tổng hợp formant
- Low Latency Voice Changer - ghi chú kỹ thuật về việc giảm thiểu độ trễ xử lý để các hiệu ứng giọng nói trực tiếp được đồng bộ trong các cuộc gọi Discord và trò chơi
- Cách Sử Dụng Voice Changer trên Discord - hướng dẫn từng bước thiết lập cho mỗi cấu hình giọng nói Discord
Câu Hỏi Thường Gặp
Bộ thay đổi giọng nói Stephen Hawking là gì?
Nó đề cập đến phần mềm sao chép giọng nói tổng hợp đơn điệu, robot mà Hawking sử dụng qua hệ thống DECtalk. Bạn có thể xấp xỉ nó bằng cách kết hợp một công cụ text-to-speech với hiệu chỉnh pitch, một bộ lọc low-pass nhẹ, và làm phẳng formant nhẹ để loại bỏ inflection giọng nói tự nhiên.
Thiết bị tổng hợp giọng nói nào mà Stephen Hawking đã sử dụng?
Hawking đã sử dụng một bộ tổng hợp giọng nói dựa trên DECtalk chạy một preset giọng nói tích hợp được gọi là Perfect Paul. Phần cứng sau đó được thay thế bằng một triển khai phần mềm, nhưng hồ sơ giọng nói được giữ theo yêu cầu của anh ấy để những người nghe sẽ tiếp tục nhận ra âm thanh đặc trưng của anh ấy.
Làm cách nào để tôi có thể nhận được một giọng nói text-to-speech robot như Hawking?
Chạy bất kỳ công cụ TTS nào qua một chuỗi hiệu ứng giọng nói làm phẳng biến đổi pitch (giảm phạm vi intonation), áp dụng một bộ lọc low-pass nhẹ cắt trên 4-6 kHz, thêm một buzz điện tử rất nhẹ hoặc formant narrowing, và chuẩn hóa âm lượng. Kết quả có giọng nói tự nhiên và một tones sine-wave thuần túy.
Tôi có thể sử dụng giọng nói Stephen Hawking trên Discord không?
Có. Định tuyến đầu ra TTS của bạn qua một micrô ảo bằng cách sử dụng một công cụ như VoxBooster, sau đó chọn micrô ảo đó trong cài đặt Discord. Gõ văn bản vào bảng TTS và Discord nhận được âm thanh tổng hợp như thể nó là một micrô trực tiếp, vì vậy nó hoạt động trong bất kỳ máy chủ hoặc cuộc gọi nào.
Có phải tái tạo giọng nói Stephen Hawking tôn trọng không?
Cách sử dụng thông tin hoặc sáng tạo của giọng nói tổng hợp cho sự tôn vinh, giáo dục, hoặc giải trí được chấp nhận rộng rãi. Tránh sử dụng nó theo cách đặt những từ giả lên miệng anh ấy về những chủ đề nhạy cảm hoặc có thể bị nhầm lẫn với những tuyên bố asli. Giọng nói đó là một tạo tác kỹ thuật, không phải là đại diện cho tình trạng y tế của anh ấy.
Có phải VoxBooster có một hiệu ứng giọng nói robot hoặc synth không?
VoxBooster bao gồm một bảng TTS thời gian thực và một bộ hiệu ứng giọng nói bao gồm các preset robot và đơn điệu. Bạn có thể gõ văn bản và có nó được nói qua micrô ảo, hoặc áp dụng các hiệu ứng cho micrô trực tiếp của bạn để làm phẳng intonation và thêm cấu trúc điện tử đặc trưng.
Sự khác biệt giữa bộ thay đổi giọng nói và text-to-speech cho hiệu ứng này là gì?
Bộ thay đổi giọng nói xử lý đầu vào micrô trực tiếp của bạn trong thời gian thực, áp dụng các hiệu ứng DSP. TTS tạo ra lời nói từ văn bản được gõ. Đối với âm thanh kiểu Hawking, TTS thường chính xác hơn vì bản gốc là một hệ thống TTS. Kết hợp cả hai cung cấp cho bạn tính linh hoạt: TTS để chính xác, bộ thay đổi giọng nói cho cuộc trò chuyện trực tiếp.
Kết Luận
Câu hỏi bộ thay đổi giọng nói stephen hawking hoá ra là một trong những góc mặt thú vị hơn về kỹ thuật trong thế giới hiệu ứng giọng nói. Không giống như hầu hết các yêu cầu giọng nói ký tự nơi bạn đang áp dụng các bộ lọc cho giọng nói tự nhiên, âm thanh Hawking đã được tổng hợp từ đất - sản phẩm của một mô hình saluran giọng nói toán học chạy trên phần cứng những năm 1980. Tái tạo nó có nghĩa là hiểu tổng hợp formant đủ tốt để biết những gì bạn đang lắng nghe, và sau đó sử dụng các công cụ hiện đại để xấp xỉ các thuộc tính âm thanh giống nhau.
Giọng nói “Perfect Paul” DECtalk là một mảnh asli của lịch sử audio xứng đáng nhận được mức độ tôn trọng và hiểu biết đó. Cho dù bạn đang xây dựng một dự án penghargaan, khám phá thẩm mỹ của lời nói tổng hợp cho nội dung sáng tạo, hoặc chỉ tò mò về cách hoạt động của bộ tổng hợp giọng nói nổi tiếng nhất trong lịch sử, sự kết hợp của TTS cộng với hiệu ứng DSP nhẹ đưa bạn rất gần.
Để thiết lập thực tế, VoxBooster xử lý đầu ra TTS và hiệu ứng giọng nói thời gian thực qua một micrô ảo duy nhất - không cần cấu hình định tuyến audio phức tạp. Dùng thử miễn phí 3 ngày cho phép bạn kiểm tra quy trình công việc đầy đủ trước khi cam kết.
Tải VoxBooster - dùng thử miễn phí 3 ngày, không cần thanh toán để bắt đầu.