Trình thay đổi giọng cho Mac: Các tùy chọn và tuyến đường Windows

Bạn muốn một trình thay đổi giọng thời gian thực trên Mac? Tìm hiểu cách định tuyến âm thanh ảo hoạt động trên macOS, những hạn chế thực tế và cách chạy VoxBooster (ứng dụng Windows) trên Mac.

Nếu bạn đã tìm kiếm giải pháp trình thay đổi giọng Mac, bạn muốn biến đổi giọng của mình thời gian thực trên macOS và làm cho nó xuất hiện trong Discord, một trò chơi, một luồng hoặc một cuộc họp. Hướng dẫn này giải thích thành thật cách thay đổi giọng thời gian thực hoạt động trên Mac, bao quát chung trông như thế nào và VoxBooster phù hợp ở đâu. Chúng tôi sẽ thẳng thắn từ đầu: VoxBooster là ứng dụng máy tính để bàn Windows 10 và 11, không phải ứng dụng macOS. Điều này có nghĩa là người dùng Mac có những lựa chọn thực tế để đưa ra, và chúng tôi trình bày chúng một cách thành thật thay vì giả vờ ngược lại.


TL;DR

  • Một trình thay đổi giọng thời gian thực trên bất kỳ nền tảng nào cần một cách để định tuyến âm thanh được xử lý đến các ứng dụng khác. Trên macOS, điều này hầu như luôn có nghĩa là một thiết bị âm thanh ảo.
  • macOS có các tùy chọn thay đổi giọng, nhưng hệ sinh thái nhỏ hơn Windows, và nhân bản giọng thời gian thực độ trễ thấp khó tìm và cấu hình hơn.
  • VoxBooster là ứng dụng Windows. Người dùng Mac có hai tuyến đường thực sự: sử dụng công cụ Mac gốc với trình điều khiển âm thanh ảo, hoặc chạy Windows trên Mac của họ.
  • Chạy Windows có nghĩa là Boot Camp trên Mac Intel (gốc, không có độ trễ bổ sung) hoặc máy ảo Windows trên Apple Silicon (hoạt động, nhưng thêm độ trễ âm thanh và chi phí CPU).
  • Để có độ trễ thấp nhất và bộ tính năng đầy đủ, PC Windows gốc phù hợp nhất. Hãy thử VoxBooster với bản dùng thử đầy đủ 3 ngày.

Trình thay đổi giọng thời gian thực hoạt động như thế nào trên Mac?

Một trình thay đổi giọng thời gian thực nắm bắt micrô của bạn, chuyển đổi tín hiệu (pitch, hiệu ứng hoặc mô hình giọng nơron), sau đó trao âm thanh thay đổi cho bất kỳ ứng dụng nào cần nó. Vấn đề trên macOS là giao hàng: các ứng dụng như Discord, Zoom hoặc một trò chơi đọc từ một thiết bị đầu vào, và hệ điều hành không cho phép một ứng dụng thay thế micrô của một ứng dụng khác im lặng. Vì vậy bạn cần một cây cầu, và cây cầu đó là một thiết bị âm thanh ảo.

Vai trò của thiết bị âm thanh ảo

Một thiết bị âm thanh ảo là một trình điều khiển phần mềm hoạt động như một thẻ âm thanh thực sự chỉ tồn tại trong phần mềm. Nó tiếp xúc một đầu vào và đầu ra mà các chương trình khác có thể chọn, giống hệt như thể bạn đã cắm một sợi cáp vật lý giữa hai ứng dụng.

Dưới đây là chuỗi điển hình trên macOS:

  1. Micrô thực của bạn cấp cho ứng dụng thay đổi giọng.
  2. Ứng dụng thay đổi giọng áp dụng hiệu ứng hoặc mô hình giọng.
  3. Ứng dụng gửi âm thanh được xử lý đến phía đầu ra của thiết bị ảo.
  4. Trong Discord, trò chơi hoặc OBS của bạn, bạn chọn phía đầu vào của thiết bị ảo làm micrô của bạn.
  5. Ứng dụng đó bây giờ nghe giọng thay đổi của bạn thay vì micrô thô của bạn.

Nếu không có định tuyến này, một trình thay đổi giọng chỉ có thể ảnh hưởng đến những gì bạn nghe lại chính mình, không phải những gì những người khác nghe. Đây là khái niệm quan trọng nhất cho bất kỳ ai mua sắm cho một trình thay đổi giọng Mac: công cụ thay đổi giọng của bạn và cơ chế định tuyến nó là hai điều riêng biệt, và cả hai phải có sẵn.

macOS yêu cầu các nhà phát triển ứng dụng yêu cầu quyền micrô và âm thanh hệ thống, vì vậy khi bạn cài đặt trình điều khiển âm thanh ảo, bạn thường sẽ phê duyệt lời nhắc bảo mật và có thể là tiện ích mở rộng hệ thống. Đó là bình thường và dự kiến. Nếu định tuyến không hoạt động lúc đầu, thủ phạm thường là quyền bị thiếu chứ không phải ứng dụng bị hỏng. Kiểm soát quyền riêng tư micrô của Apple xác định các ứng dụng nào có thể nắm bắt đầu vào, và chúng cũng áp dụng cho thiết bị ảo.

Bao quát trình thay đổi giọng Mac chung và giới hạn của nó

Chúng tôi cố ý không đặt tên các ứng dụng Mac bên thứ ba cụ thể hoặc trích dẫn giá, bởi vì thị trường đó thay đổi liên tục và chúng tôi muốn cung cấp hướng dẫn bền vững thay vì danh sách trở nên lỗi thời. Thay vào đó, đây là hình dạng thực sự của bao quát bạn sẽ gặp trên macOS.

Hệ sinh thái nhỏ hơn. Windows đã là nền tảng mặc định cho các trò chơi, phát trực tiếp và công cụ giọng nói trong nhiều năm, vì vậy phần lớn các trình thay đổi giọng thời gian thực được xây dựng cho Windows trước tiên. Trên macOS, bạn sẽ tìm thấy ít tùy chọn hơn, và một số tùy chọn tồn tại dựa vào xử lý đám mây thay vì chuyển đổi hoàn toàn cục bộ và trên thiết bị.

Thời gian thực là phần khó. Nhiều công cụ có thể thay đổi giọng trong bản ghi lại sau. Ít hơn nhiều làm điều đó trực tiếp với độ trễ đủ thấp để cuộc trò chuyện vẫn cảm thấy tự nhiên. Nhân bản giọng nơron thời gian thực, nơi bạn áp dụng mô hình giọng cụ thể cho micrô trực tiếp của mình, là trường hợp đòi hỏi nhất và ít sẵn có nhất ở dạng Mac được đánh bóng.

Định tuyến là một bước thủ công. Bởi vì macOS dựa vào thiết bị âm thanh ảo cho điều này, hãy mong đợi công việc thiết lập. Bạn cấu hình trình điều khiển, chọn nó trong mỗi ứng dụng giao tiếp, và đôi khi xây dựng một sắp xếp tổng hợp hoặc đa đầu ra để bạn vẫn có thể tự giám sát. Nó có thể thực hiện được, nhưng nó không phải là một cái nhấp.

Quyền và tiện ích mở rộng hệ thống thêm ma sát. macOS nghiêm ngặt về quyền truy cập âm thanh. Các công cụ dựa trên trình điều khiển có thể yêu cầu phê duyệt tiện ích mở rộng hệ thống và điều chỉnh cài đặt quyền riêng tư, và cập nhật hệ điều hành đôi khi có thể đặt lại các phê duyệt đó.

Không có gì có nghĩa là Mac không thể thay đổi giọng của bạn. Nó có nghĩa là con đường có nhiều bộ phận chuyển động, và nếu những gì bạn muốn cụ thể là nhân bản giọng thời gian thực với xử lý cục bộ, các tùy chọn Mac gốc mỏng hơn trên Windows.

Nơi VoxBooster đứng: một ứng dụng Windows, rõ ràng

VoxBooster là ứng dụng máy tính để bàn Windows 10 và 11. Nó thực hiện thay đổi giọng thời gian thực, nhân bản giọng AI trên thiết bị với mô hình cục bộ, chuyển văn bản thành lời nói, bảng âm thanh với phím tắt và hỗ trợ OBS, phiên âm dựa trên Whisper và chế áp tiếng ồn. Nó xử lý cục bộ để độ trễ thấp và cài đặt mà không cần trình điều khiển kernel. Nó cung cấp bản dùng thử đầy đủ 3 ngày và giấy phép trọn đời.

Cái gì không là một ứng dụng macOS. Không có bản dựng Mac gốc, và chúng tôi sẽ không ngụ ý rằng một bản dựng tồn tại. Nếu bạn đang sử dụng Mac và VoxBooster là công cụ bạn muốn, tuyến đường của bạn là chạy Windows trên Mac của bạn. Đó là một con đường hợp pháp cho nhiều người, và phần còn lại của hướng dẫn này đi qua nó một cách thành thật, bao gồm các điều đáng lưu ý.

Tuyến đường A: công cụ Mac gốc cộng thiết bị âm thanh ảo

Nếu bạn muốn ở lại hoàn toàn trong macOS, đây là tuyến đường của bạn. Chọn trình thay đổi giọng Mac gốc, cài đặt thiết bị âm thanh ảo và kết nối cả hai lại với nhau bằng chuỗi được mô tả trước đó. Điều này giữ bạn trong một hệ điều hành và tránh chi phí chạy Windows.

Điều đáng lưu ý thực sự là những gì chúng tôi đã bao gồm ở trên: ít tùy chọn thời gian thực được đánh bóng hơn, định tuyến thủ công hơn, và, đối với trường hợp đòi hỏi nhân bản giọng thời gian thực cục bộ, một cơ hội thực sự rằng bạn sẽ không tìm thấy chính xác những gì một công cụ dựa trên Windows cung cấp. Nếu nhu cầu của bạn đơn giản hơn, chẳng hạn như hiệu ứng dựa trên sân cho các cuộc gọi hoặc phát trực tiếp thường xuyên, một công cụ Mac gốc có định tuyến âm thanh ảo tốt có thể là tất cả những gì bạn cần.

Tuyến đường B: chạy Windows trên Mac của bạn

Nếu bạn cụ thể muốn một trình thay đổi giọng Windows như VoxBooster, bạn chạy Windows trên Mac của bạn. Có hai tuyến con, và cái nào áp dụng hoàn toàn phụ thuộc vào bộ xử lý Mac của bạn.

Mac Intel: Boot Camp

Trên Mac dựa trên Intel, Boot Camp của Apple cài đặt Windows trên một phân vùng riêng biệt. Bạn khởi động lại và chọn Windows, sau đó nó chạy gốc trên phần cứng với quyền truy cập đầy đủ đến CPU và thiết bị âm thanh. Bởi vì không có lớp ảo hóa ở giữa, độ trễ âm thanh về cơ bản giống với trên PC Windows chuyên dụng. Đây là kịch bản tốt nhất cho trình thay đổi giọng Windows trên Mac.

Sự cảnh báo là khó: Boot Camp chỉ tồn tại trên Mac Intel. Nếu Mac của bạn có chip Apple Silicon (M-series bất kỳ), Boot Camp không sẵn có gì cả, và tuyến đường này bị đóng với bạn.

Mac Apple Silicon: máy ảo Windows

Trên Mac Apple Silicon, tuyến đường là một máy ảo chạy bản dựng ARM của Windows thông qua phần mềm ảo hóa. Windows chạy như một khách trên macOS thay vì trên kim loại trần.

Nó hoạt động, và đối với nhiều tác vụ nó hoạt động tốt. Nhưng đối với trình thay đổi giọng thời gian thực có những cảnh báo thành thật:

  • Độ trễ âm thanh bổ sung. Mỗi mẫu âm thanh vượt qua ranh giới giữa khách và chủ nhà, thêm độ trễ trên bất kỳ những gì ứng dụng tự giới thiệu. Nhân bản thời gian thực là nhạy cảm nhất với điều này.
  • CPU chia sẻ. VM cạnh tranh với macOS cho thời gian CPU. Dưới tải, những hiccup lập lịch có thể gây ra glitch âm thanh hoặc mất kết nối.
  • Thiết lập passthrough thiết bị. Bạn phải đảm bảo rằng VM có thể nhìn thấy micrô của bạn và định tuyến âm thanh một cách chính xác, đó là một lớp cấu hình khác ở trên định tuyến trong Windows.

Đối với các hiệu ứng nhẹ, một VM có thể cảm thấy hoàn toàn tốt. Đối với nhân bản giọng thời gian thực độ trễ thấp, hãy mong đợi một thỏa hiệp so với phần cứng gốc. Chúng tôi muốn nói với bạn điều đó trước tiên thay vì để bạn khám phá nó giữa một luồng.

So sánh: tùy chọn Mac vs Windows và VoxBooster theo trường hợp sử dụng

Bảng dưới đây ánh xạ các mục tiêu chung đến tuyến đường hợp lý nhất. VoxBooster chỉ nhập hình ảnh trên các hàng Windows, bởi vì đó là nơi duy nhất nó chạy.

Trường hợp sử dụngCông cụ Mac gốc + âm thanh ảoWindows trên Mac (Boot Camp, Intel)Windows trên Mac (VM, Apple Silicon)PC Windows gốc + VoxBooster
Hiệu ứng sân nhẹ trên cuộc gọiPhù hợp tốt, định tuyến đơn giảnQuá mứcQuá mứcHoạt động, cộng với nhiều tính năng hơn
Thay đổi giọng thời gian thực trong trò chơiCó thể thực hiện được, phụ thuộc vào độ trễ công cụĐộ trễ gốc, mạnh mẽĐộ trễ cao hơn, sử dụng cẩn thậnPhù hợp tốt nhất, độ trễ thấp
Nhân bản giọng cục bộ thời gian thựcThường khó tìm trên MacHiệu suất gốcTruy cập độ trễ và CPUĐược thiết kế cho cái này
Bảng âm thanh với phím tắt và OBSThay đổi theo công cụTính năng VoxBooster đầy đủHoạt động, một số chi phíTính năng đầy đủ, độ trễ thấp
Phiên âm và TTS trong một ứng dụngThường các công cụ riêng biệtTính năng VoxBooster đầy đủHoạt động, một số chi phíTính năng đầy đủ, tích hợp
Độ trễ thấp nhất có thểPhụ thuộc rất nhiều vào thiết lậpTuyệt vờiBị xâm phạm bởi VMTuyệt vời
Ở lại hoàn toàn trong macOSKhông, khởi động lại WindowsKhông, chạy khách WindowsKhông, hệ điều hành riêng biệt

Mô hình này nhất quán. Nếu ở lại macOS là những gì quan trọng nhất và nhu cầu của bạn vừa phải, tuyến đường A là hợp lý. Nếu bạn cụ thể muốn VoxBooster và bạn có Mac Intel, Boot Camp cung cấp cho bạn một trải nghiệm gần như gốc. Nếu bạn có Mac Apple Silicon, một VM là tuyến đường VoxBooster duy nhất và đi kèm với các nhân nhượng độ trễ và CPU. Và nếu độ trễ và bộ tính năng đầy đủ là những gì bạn quan tâm nhất, một máy Windows gốc là câu trả lời gọn gàng nhất.

Tại sao khái niệm định tuyến quan trọng hơn so với công cụ bạn chọn

Nó đáng để lặp lại vì nó khiến mọi người bị lừa: trên bất kỳ nền tảng nào, thay đổi giọng của bạn và giao hàng giọng thay đổi đó cho các ứng dụng khác là hai công việc. Trên Windows, VoxBooster xử lý cục bộ và trao âm thanh cho các ứng dụng của bạn mà không cần cài đặt trình điều khiển ảo riêng biệt, đó là một phần của lý do tại sao trải nghiệm Windows mượt mà hơn. Trên macOS, bất kỳ công cụ nào bạn chọn, bạn sẽ hầu như luôn ghép nó với một thiết bị âm thanh ảo và thực hiện lựa chọn đầu vào trên mỗi ứng dụng.

Vì vậy, khi bạn đánh giá bất kỳ trình thay đổi giọng Mac nào, hãy đặt hai câu hỏi, không phải một. Thứ nhất, nó có thay đổi giọng theo cách bạn muốn, thời gian thực, với độ trễ có thể chấp nhận được không? Thứ hai, nó định tuyến như thế nào đến Discord, trò chơi hoặc OBS của bạn, và cần bao nhiêu thiết lập thủ công cho định tuyến đó? Một công cụ hoàn hảo câu hỏi đầu tiên và bỏ qua câu hỏi thứ hai sẽ khiến bạn bực bội khi không ai trong cuộc gọi của bạn nghe thấy sự khác biệt.

Thiết lập kỳ vọng một cách thành thật

Đây là bản tóm tắt chúng tôi sẽ cung cấp cho một người bạn. Không có VoxBooster gốc cho Mac, và chúng tôi sẽ không giả vờ rằng một giải pháp thay thế gây ra một cái xuất hiện. Nếu bạn cam kết macOS và nhu cầu của bạn vừa phải, sử dụng công cụ Mac gốc với thiết bị âm thanh ảo và chấp nhận định tuyến thủ công. Nếu bạn muốn hỗn hợp cụ thể của VoxBooster về nhân bản thời gian thực cục bộ, bảng âm thanh, phiên âm và chế áp tiếng ồn, hãy chạy Windows: Boot Camp nếu bạn có Mac Intel, VM nếu bạn có Apple Silicon, với các nhân nhượng độ trễ nêu trên.

Và nếu bạn có quyền truy cập vào PC Windows cả, đó là nơi trình thay đổi giọng thời gian thực, và VoxBooster cụ thể, hoạt động tốt nhất. Thực thi gốc tránh chi phí ảo hóa thêm độ trễ và đánh cắp thời gian CPU, điều này quan trọng nhất đối với các khối lượng công việc nhân bản giọng thời gian thực đầy thách thức.

Câu hỏi thường gặp

VoxBooster có sẵn cho macOS không? Không. VoxBooster là ứng dụng máy tính để bàn Windows 10 và 11. Không có bản dựng macOS gốc. Những người dùng Mac muốn VoxBooster cụ thể phải chạy Windows trên Mac của họ, qua Boot Camp trên máy Intel hoặc máy ảo Windows trên Apple Silicon.

Trình thay đổi giọng thời gian thực hoạt động như thế nào trên Mac? Trình thay đổi giọng xử lý tín hiệu micrô của bạn, sau đó một thiết bị âm thanh ảo chuyển âm thanh được xử lý đó đến các ứng dụng của bạn. Trong Discord, một trò chơi hoặc OBS, bạn chọn thiết bị ảo làm đầu vào thay vì micrô thực của bạn, vì vậy các ứng dụng đó nghe được giọng thay đổi.

Tôi có cần thiết bị âm thanh ảo trên macOS không? Đối với hầu hết việc sử dụng thời gian thực, có. macOS không cho phép một ứng dụng thay thế im lặng đầu vào micrô của một ứng dụng khác. Một trình điều khiển âm thanh ảo tạo đầu vào phần mềm mà các công cụ thay đổi giọng ghi vào và các ứng dụng giao tiếp đọc từ, kết nối hai bên một cách sạch sẽ.

Tôi có thể chạy VoxBooster trên Mac Apple Silicon không? Chỉ bên trong một máy ảo Windows, vì Boot Camp không tồn tại trên Apple Silicon. Mong đợi độ trễ âm thanh bổ sung và chi phí CPU từ lớp ảo hóa. Nó có thể hoạt động để kiểm tra, nhưng một PC Windows gốc cung cấp trải nghiệm độ trễ thấp mà ứng dụng được thiết kế cho.

Boot Camp vẫn hoạt động để chạy Windows trên Mac không? Boot Camp chỉ tồn tại trên máy Mac dựa trên Intel, nơi nó cài đặt Windows trên một phân vùng riêng biệt khởi động gốc. Mac Apple Silicon (M-series) không có Boot Camp, vì vậy tuyến đường duy nhất là máy ảo Windows chạy bản dựng ARM của Windows.

Trình thay đổi giọng bên trong máy ảo Mac sẽ có độ trễ tốt không? Độ trễ thường cao hơn trên phần cứng gốc. Âm thanh phải vượt qua ranh giới ảo hóa, và lập lịch CPU được chia sẻ với macOS. Các hiệu ứng nhẹ có thể cảm thấy tốt, nhưng nhân bản giọng thời gian thực nhạy cảm với độ trễ được thêm vào, vì vậy máy Windows gốc phù hợp hơn.

Tuyến đường độ trễ thấp nhất đáng tin cậy nhất nói chung là gì? Một PC Windows gốc chạy trình thay đổi giọng trực tiếp. Cho dù đó là một máy riêng biệt hay Windows qua Boot Camp trên Mac Intel, thực thi gốc tránh chi phí ảo hóa thêm độ trễ và đánh cắp thời gian CPU, điều này quan trọng nhất để thực hiện khối lượng công việc nhân bản giọng thời gian thực đầy thách thức.

Dòng dưới cùng thành thật

Mac có thể hoàn toàn thay đổi giọng của bạn thời gian thực, miễn là bạn ghép công cụ phù hợp với một thiết bị âm thanh ảo và chấp nhận một chút định tuyến thủ công. VoxBooster không phải là một phần của câu chuyện gốc-Mac đó, bởi vì nó là một ứng dụng Windows và chúng tôi sẽ không làm mờ dòng đó. Những gì VoxBooster cung cấp là một trải nghiệm Windows mượt mà và độ trễ thấp với nhân bản giọng cục bộ, bảng âm thanh, phiên âm và chế áp tiếng ồn ở một nơi.

Nếu bạn đang sử dụng Mac Intel, Boot Camp mang trải nghiệm đó đến phần cứng của bạn gốc. Nếu bạn đang sử dụng Apple Silicon, một VM Windows mang bạn đến đó với một số nhân nhượng độ trễ. Và nếu bạn có thể chạy nó trên PC Windows gốc, đó là nơi nó tỏa sáng. Tuyến đường nào phù hợp, bạn có thể bắt đầu với bản dùng thử đầy đủ 3 ngày và xem kết quả trước khi cam kết, hoặc xem xét tùy chọn giấy phép trọn đời nếu bạn quyết định đó là công cụ của bạn. Muốn thêm thông tin về công nghệ giọng thời gian thực? Khám phá blog VoxBooster.

Dùng thử VoxBooster — 3 ngày dùng thử miễn phí.

Nhân bản giọng thời gian thực, soundboard và hiệu ứng — ở mọi nơi bạn đã nói chuyện.

  • Không cần thẻ tín dụng
  • ~30ms độ trễ
  • Discord · Teams · OBS
Dùng thử miễn phí 3 ngày