Sam Voice Generator: Microsoft Sam AI Voice Tools
2010年より前にインターネットを利用していた、またはこれまでYouTubeを視聴したことのある人なら、ほぼ確実にsam音声ジェネレータを聞いたことがあるでしょう。それは初期のコンピュータユーモアの世代を定義したものです。感情を無視して機械的に平坦に、不自然な場所で一時停止し、すべてを少し間違った発音で読み上げる。それはMicrosoft Samで、Windows 2000に搭載されてからほぼ25年経った今でも、人々はそれを取り戻す方法を求めています。
このガイドは完全な説明をカバーしています。実際にMicrosoft Samがどのように機能していたのか、なぜそのような音に聞こえるのか、2026年のSam音声を生成するすべての方法(元の音声エンジンのインストールからAIクローン、オンラインジェネレータまで)、およびストリームやビデオにそれをパイプする方法です。
TL;DR
- Microsoft Samは、Windows 2000およびXPのデフォルトTTS音声で、Lernout & Hauspie SAPI 4技術に基づいています
- 機械的に聞こえるのは、ニューラルスムーズングのないダイフォン連結を使用しているためです
- インターネットアーカイブを介してWindows 10/11にオリジナルSAPI 4エンジンをインストールできます
- 複数のオンラインジェネレータはインストールなしでSam音声を近似しています
- AI音声クローンはSam録音で訓練され、より高い忠実度で再現します
- これらのいずれかをDiscord、OBS、またはゲームを通じて仮想マイクにルーティングできます
Microsoft Samの簡単な歴史
SAPI 4、Lernout & Hauspie、Windows XPデフォルト音声
Microsoft Samはマイクロソフトの創作物として始まりませんでした。その背後にある音声エンジンは、Lernout & Hauspie(ベルギーの音声技術企業)からライセンスされました。1990年代後半のピーク時には、世界最大の音声認識・合成企業の一つでした。L&HはマイクロソフトにそのTTSエンジンをライセンスし、Windows 2000に含めました。Samはデフォルトシステム音声になり、アクセシビリティ機能が有効化されたときにアラートテキストを読み出し、サードパーティのアプリケーションがテキストを音声で読み上げたい場合にはSpeech API(SAPI 4)を通じて呼び出しました。
SAPI 4は16ビットCOMベースのインターフェイスでした。シンプルなAPIを公開していました。テキスト文字列を渡し、オーディオを取得する。アプリケーションは音素のタイミング、プロソディ、またはピッチについて考える必要がありませんでした。Samがそれをすべて処理しました。ただし、ある程度のレベルでです。テクノロジーは自然に聞こえるように設計されたものではありませんでした。理解可能であること、CD上にオペレーティングシステム全体と一緒に出荷するのに十分な小ささ、500 MHz以下で実行されているハードウェアでリアルタイムで音声を合成するのに十分な速さを備えるように設計されました。
Lernout & Hauspieは2001年に会計詐欺スキャンダルの真っ只中に崩壊しました。その時代の大規模な企業倒産の一つでした。しかし、その時点で音声エンジンはすでに数億台のWindows インストールに組み込まれていました。マイクロソフトはWindows XPを通じてSamの出荷を続けました。Windows Vistaではデフォルト音声がMicrosoft Annaに移行すると、より現代的なユニット選択合成アプローチに基づくSAPI 5音声で、より自然な音に聞こえました。
Samは正式には復帰することはありませんでした。彼はレガシーインストールに、そして最終的にはコンピュータユーザーの全世代のメモリとミームアーカイブにのみ生き残りました。
Samがそのような音に聞こえる理由
Microsoft Samの特定の音は偶然ではありません。これはダイフォン連結の直接の結果であり、L&Hが使用した合成方法です。
ダイフォン合成では、人間のボイスアクターが隣接する音素間のすべての可能な遷移を記録します。これらのペアはダイフォンと呼ばれます。単語「hello」には、/h-e/、/e-l/、/l-o/、/o-sil/(無音)のダイフォンが含まれています。単語を合成するために、エンジンはこれらの記録されたダイフォンクリップを連結します。異なるピッチおよび持続時間を処理するために(「hello」を素早く言うことは「hello」をゆっくり言うことと異なるため)、エンジンはデジタル信号処理を使用してクリップを時間ストレッチおよびピッチシフトします。
問題は構造的なものです:
- スプライスアーティファクト。 いかに注意深く遷移が平滑化されても、2つのダイフォンクリップ間の結合は軽微な不連続性を生み出します。文ごとに数百個これがあると、特徴的にぎくしゃくしたリズムが生み出されます。
- 単調なプロソディ。 SAPI 4はプロソディモデリングが最小限でした。Samは質問の最後でピッチが上がったり、重要な単語を強調したりしません。すべての文はほぼ同じピッチ、同じ平坦なリズムで出ます。
- 時間ストレッチアーティファクト。 音素を記録された長さを超えて拡張する必要がある場合、時間ストレッチアルゴリズムは軽微な金属的またはフランジングのようなアーティファクトを導入します。特に母音に対して。これは「ブリキ缶」の品質です。
ここにバグはなく、修正する設定もありません。ロボット音はアーキテクチャに焼き込まれています。モダンなニューラルTTSシステム(Windows 11の音声を含む)は学習した音響モデルから直接波形を生成することでこれらの問題を回避しますが、Samを直ちに認識可能にする独特のキャラクターも失いません。
なぜMicrosoft Samは2026年でも重要なのか
ミームカルチャーとインターネット歴史
「Samが~を読む」というミーム形式は、おそらくインターネット上で最初の主要な繰り返しTTSミームです。ディープフェイク以前、AIが生成したコンテンツという概念以前であり、Windows Movie Makerのエクスポートから初期YouTubeにアップロードされたものから、モダンTikTokコンピレーションまで、プラットフォーム全体で2000年代初期からずっと継続しています。
標準的な形式:SamがBee Movieスクリプトを読む。Samが利用規約を読む。Samが10分間悪態をつく。Samが次々に超現実的なシナリオをナレーションする。ユーモアは構造的なものです。感情的な抑揚の完全な欠如によって、Samが言うことは何でも、同時に重要で不条理に聞こえます。Samが核戦争を発表しても、Samがピザ注文を発表しても、音は同じです。その平坦なアフェクトがジョークであり、それは決して機能することをやめません。
このミームはまた、Windows XPを使って育った世代にとって本当にノスタルジックです。Narratorを開き、図書館でSamに何か恥ずかしいことを言わせることは、特定の、広く共有されているメモリです。
アクセシビリティ歴史
Samはまた、PCアクセシビリティの重要な章を表しています。SAPI 4より前は、スクリーンリーダーソフトウェアは高価で、専門的で、Windowsに含まれていませんでした。マイクロソフトがオペレーティングシステムに機能的なTTS音声を搭載すること(ロボット的であっても)は、専用のアクセシビリティソフトウェアを買う余裕がないユーザーのための基本的なスクリーン読み取りを民主化しました。その特定の歴史的役割については、Samはミームステータスを超えた認識に値します。
今日のSam Voice Generator を使用する5つの方法
方法1:Windows 10/11にオリジナルSAPI 4エンジンをインストール
これは最も正確なオプションです。オリジナルのLernout & Hauspie TTSエンジンとSAPI 4ランタイムはインターネットアーカイブに保存されており、モダンWindowsへのインストールが可能です。
完全なステップバイステップは以下でカバーされています。短いバージョン:SAPI 4 SDKをダウンロードし、L&H TTSランタイムをインストールし、SAPI 4対応のアプリケーション(付属のTxtToSpeech.exeサンプルなど)を使用してSamの実際の音声エンジンを通じてテキストを合成します。出力はWindows XPが生成したものとビット完全です。
品質: 正確。労力: 中程度。Windows 11で動作: はい、互換性レイヤー付き。
方法2:オンラインSam Voice Generator サイト
ブラウザベースのsam音声ジェネレータでは、何かをインストールする必要なく、テキストを入力してSam音声で聞くことができます。これらのツールはWebAssemblyにコンパイルされたSAPI 4ポートから、手動で調整されたDSP近似まで多様です。エンジンリストにMicrosoft SamまたはSamスタイル音声を含むサイトとしては、ttsmp3があり、彼らのエンジンバリエーションを音声セレクタで「Sam」とラベル付けしています。FakeYouとUberduckもMicrosoft Sam AIボイスクローンモデルをホストしており、オリジナルWindowsXPオーディオで訓練されています。
トレードオフ:これらのどれも、オーサティックなL&Hダイフォンデータベースを完全に再現できません。出力はSam調のものに聞こえます。正しい一般的なキャラクターですが、訓練を受けた耳は特に特定の音素遷移で違いに気付きます。ミームの短いクリップが必要なだけなら、sam TTSジェネレータサイトが最速のパスです。
品質: 近似。労力: なし。どこでも動作: はい。
方法3:Sam録音で訓練されたAI音声クローン
最も有能なモダンなsam AI音声アプローチはAIボイスクローンを使用しています。これはオープンソースのニューラル音声変換フレームワークです。Windows XPインストールとYouTubeミームアーカイブからの大きなMicrosoft Samオーディオコレクションで訓練されたコミュニティモデルは、モデル共有リポジトリで利用可能です。十分にクリーンなSAPI 4出力を取得するのに十分なトレーニングがなされたAIボイスクローンモデルは、Samの音素の癖、ピッチプロファイル、特定の金属的な共鳴を、オンライン近似より大幅に高い忠実度でキャプチャします。
他の方法との違い:AI クローンアプローチはリアルタイム音声変換も実行できます。マイクに話しかけると、声がSamのように聞こえます。これはMicrosoft Samとしてライブをナレーションしたい配信者が使用するアプローチです。テキストを入力して合成を待つことなく。
品質: 高(音声変換)。労力: 中~高(AIボイスクローンセットアップが必要)。リアルタイム: はい。
方法4:DSP エフェクトチェーン近似
Sam固有のソフトウェアなしでも、DSPチェーンは「古いコンピュータTTS」と読む音声を生み出すことができます。Samではなく、ロボット音の正しいジャンル。パラメータ:
- ピッチシフト:自然な話す声のピッチで平坦(上下にシフトしない)
- 微妙なリングモジュレータまたは8~12 kHzロールオフの微少なビットクラッシャーを追加
- 重い母音の正規化/圧縮を適用して、ダイナミクスを平坦化
- わずかな電話スタイルのバンドパス(300 Hzから3.4 kHz)を適用して、元のオーディオレンダリングの限定された周波数応答をシミュレート
- リバーブなし。Samは完全にドライです
これはロボットTTSスタイルの音声を生み出し、緊急時には機能します。Samをよく知っている人を騙すことはできませんが、概念を伝えます。
品質: ロボット音声。労力: 低。リアルタイム: はい(DSP対応の音声チェンジャー)。
方法5:Audacity + SAPI 4出力のポスト処理
コンテンツクリエーション(リアルタイムではなく)の場合、多くのミーム作成者が使用するワークフロー:SAPI 4インストールまたはオンラインジェネレータを通じてテキストを生成し、Audacityにインポートし、コメディ効果のためにSamの特性を誇張するために追加の処理を適用します。一般的な調整:Samの金属的な品質を強調するためにわずかなコーラスを追加、声を薄くするために200 Hz以下をカット、古い録音からの背景ノイズを削除するために軽いノイズ低減を適用。
これはYouTubeの専門レベルのSamコンテンツがどのように製作されているかです。音声は本物のSAPI 4出力で、その後わずかにポスト処理で強化されます。
品質: 高(記録コンテンツ用)。労力: 低~中。リアルタイム: いいえ。
Sam Voice Generator方法の比較
適切なsam音声ジェネレータの選択は、リアルタイム出力が必要か記録クリップが必要かに依存します。また、セットアップにどれだけの時間をかけるかにも依存します。以下の表は各アプローチを要約しています。
| 方法 | Sam正確性 | リアルタイム | インストール必須 | コスト | 最適用途 |
|---|---|---|---|---|---|
| SAPI 4 オリジナルインストール | 正確 | いいえ(TTS のみ) | はい(レガシーランタイム) | 無料 | 最大正確性 |
| オンラインsam TTSジェネレータ(ttsmp3など) | 近似 | いいえ(TTSのみ) | いいえ | 無料 | クイックミームクリップ |
| AI AIボイスクローン | 高 | はい | はい(AIボイスクローン+音声チェンジャー) | 無料 | ライブストリーミング、ゲーミング |
| DSPエフェクトチェーン | ロボット音 | はい | 最小限 | 無料 | 近似のみ |
| Audacityポスト処理 | 高(実際のソースで) | いいえ | はい(Audacity) | 無料 | YouTubeコンテンツ |
| VoxBooster + AIボイスクローン モデル | 高 | はい | はい(VoxBooster) | トライアル/有料 | ストリーム、Discord、ゲーム |
ステップバイステップ:Windows 11にオリジナルのMicrosoft Sam音声をインストール
モダンWindowsにオリジナルのsam音声ジェネレータランタイムをインストールするには、互換性の回避策が必要ですが、プロセスは安定しており、結果は完全に機能します。
-
インターネットアーカイブからSAPI 4 SDK ランタイムをダウンロード。 「Microsoft SAPI 4 SDK」を検索してください。公式アーカイブには1998~2000年頃からの
speech4.exeインストーラーが保存されています。 -
互換性モードでインストーラーを実行。
speech4.exeを右クリック、プロパティ → 互換性を選択し、「Windows XP(Service Pack 3)」に設定。「管理者として実行」にチェック。適用して実行します。 -
Lernout & Hauspie TTSエンジンをダウンロード。 L&H TTS音声(Sam、Mary、Mike)は別々のインストーラーとして配布されています。インターネットアーカイブは
lhttsmsi.exeパッケージを保存しています。同じ互換性設定で実行します。 -
COMの登録を確認。 レジストリエディタ(
regedit)を開き、HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokensに移動します。インストールが成功した場合、ここにL&H音声のエントリが表示されます。64ビットWindowsでは、HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft\Speech\Voices\Tokensも確認します。 -
SAPI 4 アプリケーションでテスト。 SAPI 4 SDKには
TxtToSpeech.exeというサンプルアプリケーションが含まれています。互換性モードで実行し、任意のテキストを入力し、ドロップダウンから「L&H TTS Sam」音声を選択し、Speakをクリック。Samが聞こえたら、インストールは完了です。 -
他のアプリケーションでSamを使用。
IEnumSpVoicesを介してSAPI 4音声を列挙するアプリケーションは、Samをリストするようになります。クラシック「Speakonia」ツール(初期2000年代のフリーウェアTTSアプリケーション、インターネットアーカイブで保存されています)は、元々Samミームコンテンツを作成するために使用されたツールで、SAPI 4ランタイムで完璧に機能します。
トラブルシューティング: 音声インストーラーが無言で失敗した場合、昇格されたコマンドプロンプト(管理者としてcmd.exe)から実行します。Samがレジストリに表示されるがオーディオが生成されない場合は、L&H オーディオレンダリングDLL(ltts15app.dll)が64ビットシステムのC:\Windows\SysWOW64に存在することを確認します。欠落している場合は、インストーラーパッケージから手動でコピーします。
一般的なSAPI 4エラーと修正
「利用可能な音声がありません。」 L&H音声エンジンCOMコンポーネントが正しく登録されていません。昇格されたアクセス権でL&Hインストーラーを再実行します。それでも失敗する場合は、SysWOW64フォルダからregsvr32 /s ltts15app.dllを手動で使用します。
Samの話す速度が速すぎるまたは遅すぎます。 SAPI 4は話速プロパティを公開しています(大ざっぱに-10~+10の範囲で、0がデフォルト)。Spekonia と同様のツールではこれはスライダーです。-5~-8に設定すると、最も遅い、ほとんどのミームコンテンツから見慣れた意思的なペーシングが生成されます。
オーディオが歪んだりクリックしたりします。 これは通常、サンプルレートの不一致です。L&Hエンジンは8 kHzモノ出力します。古いハードウェアとソフトウェア。モダンなオーディオスタックは44.1または48 kHzを期待します。Windowsは自動的にリサンプリングする必要がありますが、一部のUSBオーディオインターフェイスは変換を正確に処理しません。このような問題が発生した場合は、USBインターフェイスではなく、組み込みのオーディオデバイス(Realtek、Intel HDA)を通じてルーティングします。
SamがSAPI 5アプリケーション(Windows 11 Narrator、モダンTTSアプリ)で見えません。 SAPI 4とSAPI 5は異なるCOMアーキテクチャです。SAPI 4音声は互換性ブリッジなしではSAPI 5アプリケーションにアクセスできません。「SAPI4to5」ツール(インターネットアーカイブと古いTTSホビイストフォーラムで利用可能)はこのブリッジを追加します。SAPI 4ランタイムとL&H音声の後にインストールし、Samはグローバルに音声セレクタに表示されます。
ビデオとライブストリームでのSam Voice Generator の使用
OBSまたはDiscordへのMicrosoft Sam音声のルーティング
オリジナルのSAPI 4出力、オンラインのsam音声ジェネレータ、またはAIクローンを使用しているかどうかにかかわらず、ライブブロードキャストにSamを取得するには、オーディオ出力を仮想マイク入力にルーティングする必要があります。
VoxBoosterを使用: VoxBoosterはWindowsオーディオレベルでオーディオを処理します。TTS アプリケーションの出力をWindowsミキサーまたはループバックキャプチャを通じてVoxBoosterにルーティングすると、マイクを使用するすべてのアプリ(OBS、Discord、ゲーム)が既存のマイクデバイスから自動的にSam音声を受け取ります。サウンドボード機能では、事前生成されたSamクリップをホットキーにバインドすることもできます。ストリーム中に合成テキストをリアルタイムで合成することなく、Samのワンライナーをトリガーできます。
手動ルーティングの代替案: VB-Audio VoiceMeterまたはVirtual Audio Cableをインストール、TTS アプリケーションを仮想ケーブルに出力するように設定し、仮想ケーブルをOBSまたはDiscordのマイクソースとして設定します。これはVoxBoosterの統合パスと比べてコンポーネントが追加されます。
リアルタイムSam音声変換
2026年のコンテンツで最も説得力のあるユースケース:マイクにライブで話しかけ、音声がリアルタイムでMicrosoft Samのようにして出ます。これにはSamオーディオで訓練されたAIボイスクローンモデルが必要です。
VoxBoosterでのワークフロー:
- モデルリポジトリからMicrosoft Sam AIボイスクローンモデルをダウンロード(「Microsoft Sam AIボイスクローン」を検索するとそれぞれ500以上のダウンロードを持つアクティブなモデルがいくつか見つかります)
- VoxBoosterを開き、Voice Models → Import Custom Modelに移動し、
.pthおよび.indexファイルをインポート - ピッチオフセットを0に設定(Samは自然な男性ピッチで話します。男性の場合はシフトが必要ないです。自然な音域に合わせるために±1~2セミトーン調整します)
- インデックス影響を0.75~0.85に設定して、過度なフィッティングなしでSamの特定の音素の癖をキャプチャ
- Discord、OBS、またはゲームで通常のマイクを選択したままにしておきます。VoxBoosterはバックグラウンドで透過的に実行されるため、すべてのアプリは既存のマイクデバイスからSam音声を受け取り、入力デバイスの変更は必要ありません
結果:言葉は何でもSamの音声でリアルタイムで出て、レイテンシーはGPU搭載のWindowsマシンで35ms以下に保たれます。これは、チャットにMicrosoft Samとして反応し、ゲームプレイをキャラクターでナレーション、またはフルミーム音声で生Q&Aを実施する方法です。
よく機能するコンテンツ形式
Samが[X]に反応。 ストリームで動画またはオーディオを再生し、Samがリアルタイムコメンタリーを提供。平坦なアフェクトはスクリプト化された反応より面白いです。
Sam が[ゲーム]をプレイ。 クエストの目的、敵の名前、アイテムの説明など、ゲーム内のイベントをすべてSamとしてナレーション。テキストの豊富なRPGで特に効果的です。
Samがチャット質問に答える。 チャット質問を受け取り、Samとして回答します。ロボット的な配信でも単調な回答がジョークとして着地します。
Samが[段階的なコンテンツ]を読む。 クラシック形式。スクリプトを事前に準備し、SAPI 4またはAIクローンを使用、オーディオを生成、キャプションを追加、アップロード。
Discord利用について、音声通話でのSamは即座に認識でき、確実な笑いが得られます。セッションを短く保ちます。あなたのグループが特にSamセッションのために集まらない限り、音声は面白いが、複数時間は疲れます。
Microsoft Samと他のレトロTTS音声の比較:どのSam Voice Generator が優勝?
Samは最も有名なレガシーTTS音声ですが、その時代からの唯一のものではありません。いくつかの価値のある比較:
Microsoft MikeおよびMary はWindows XPでSamと一緒に出荷されました。MikeはわずかにピッチがSamより高い男性の音声です。Maryは女性の音声です。両方ともSamと同じL&Hダイフォン合成を使用し、同じSAPI 4パッケージの一部としてインストールされます。Samの特定の文化的影響力を欠きますが、技術的には合成品質が同一です。
DECtalk「Perfect Paul」 は1980年代後期からのより古く、いくつかの方法ではさらにロボット的に聞こえるTTS音声で、Stephen Hawkingの通信デバイスの音声として有名です。シンガーシンセサイザーのデモ(「Daisy Bell」および「Bicycle Built for Two」)はインターネット歴史の標準です。DECtalk音声はまだ利用可能で、独自の小さなミームコミュニティがあります。
Festival TTS は1990年代からのオープンソースTTSシステムで、同様の連結アプローチを使用しています。その音声はSamほどの文化的埋め込みを持ちませんが、いくつかのレガシーLinuxアクセシビリティコンテキストに表示されます。
コンテンツについて、Samは認識で勝ちます。MikeまたはMaryを使用すると、視聴者はSam音声がわずかに違う理由を尋ねます。ミームが着地したい場合は、特にSamを使用します。
FAQ
Microsoft Samとは何ですか? Microsoft Samは、Windows 2000およびWindows XPに搭載されたデフォルトの男性TTS音声で、Lernout & Hauspie SAPI 4連結合成に基づいています。Windows Vistaから、より自然な音声で置き換えられました。
Windows 10またはWindows 11でMicrosoft Samを取得できますか? はい。インターネットアーカイブに保存されたインストーラーを介して、レガシーSAPI 4ランタイムとL&H TTSエンジンを手動でインストールできます。このプロセスは、上記で説明した互換性モード設定とCOMの登録ステップが必要です。
無料のオンラインsam音声ジェネレータはありますか? 複数のウェブツールがローカルインストール不要でMicrosoft Sam音声を合成します。ttsmp3.comなどのサイトにはSam音声オプションが含まれています。品質は様々です。ローカルSAPI 4は最も正確な結果を提供します。
Microsoft Samが機械的な音に聞こえるのはなぜですか? Samはダイフォン連結を使用します。単一スピーカーから記録された音素ペアの遷移を連結して音声を構築し、入力テキストに合わせてピッチシフトおよび時間ストレッチされます。ニューラルスムーズングまたはプロソディモデリングがないため、音素境界は聞き取れ、リズムは機械的に平坦です。
SAPI 4とSAPI 5の違いは何ですか? SAPI 4はWindows 95~XPで使用された16ビットCOMインターフェイスで、Samを含むL&H音声をサポートしていました。SAPI 5はWindows XPで導入され、VistaでSamを含むL&H音声をサポートしていました。拡張版では、異なるCOMアーキテクチャに移行し、新しい音声を搭載しました。SAPI 4音声は互換性ブリッジなしではSAPI 5アプリケーションで認識されません。
リアルタイムストリームやDiscordコールでSam音声を使用できますか? はい。SAPI 4 TTSまたはAI Sam AIボイスクローンの出力を仮想オーディオパスにルーティングできます。VoxBoosterは内部で処理を行います。Windowsレベルでオーディオを処理するため、既存のマイクデバイスが別の仮想ケーブルインストール不要でDiscord、OBS、またはゲームにSam音声を配信します。
Microsoft Samのミームはまだ人気ですか? 非常に人気です。「Samが読む」形式は2026年のYouTubeとTikTokで活動しており、定期的なアップロードがあります。ノスタルジア角度はXPで育った視聴者にとって新鮮なままですが、抑制的な平坦なアフェクトユーモアは初めてそれに遭遇する若い視聴者にも機能します。
結論
sam音声ジェネレータ検索は純粋なノスタルジアからアクティブなコンテンツクリエーション、アクセシビリティ歴史まで、あらゆるものをカバーしています。2026年では、これらのユースケースはすべて本当にサポートされています。オリジナルSAPI 4ランタイムをインストールすると、Windows XPに搭載されたオーサティックなL&Hダイフォン合成が得られます。オンラインジェネレータは秒単位でそこに到達でき、セットアップは必要ありません。AI AIボイスクローンはリアルタイム変換を有効にします。ストリームやDiscordコール中にMicrosoft Samのようにライブで話すことができます。
sam AI音声はその限定性にもかかわらず、限定性のためにも耐えます。その平坦で、ロボット的で、完全に無関心な配信は、1990年代の計算的制約が人言語に適用されたもので、限定的なツールで最善を尽くすマシン、結果が良いかどうかに完全に無関心です。microsoft sam音声はインターネットカルチャーの最初で最も耐久性のあるTTS文字で、モダンコンテンツクリエーション時代に前に進める道具はすべて容易に利用できます。
SAPI 4出力、AIクローン、またはジェネレータオーディオであるいかなるSam音声をストリーム、Discordコール、ゲームにルーティングして、仮想ケーブルソフトウェアと格闘することなく、VoxBoosterをダウンロードします。Windowsオーディオレベル(WASAPI)でオーディオを処理するため、Sam音声が既存のマイクを通じて流れます。自動的に。仮想デバイスはなく、Discordの再構成はありません。サウンドボード機能は事前レンダリングされたSamクリップもホットキーで処理するため、ライブ合成なしに最高のSamラインを発火する準備ができます。フルボイスエフェクトとAIクローンパイプラインについては、VoxBooster.comを訪問します。