Discordにはデフォルトでどんなボイスフィルターが搭載されていますか？

Discordは「音声・ビデオ」設定にKrispノイズ抑制、エコーキャンセル、自動ゲイン調整を搭載しています。ピッチシフト、フォルマント調整、キャラクターボイスプリセットは内蔵されていません。ノイズ低減以外の機能を求める場合は、Discordクライアントに到達する前に音声を処理する仮想マイクツール（VoxBoosterなど）が必要です。

DiscordのボイスフィルターでロボットのようなAI音声になるのはなぜですか？

ロボット音のアーティファクトは、ノイズサプレッサーを2つ同時に重ねた場合によく発生します。ハードウェアマイクのオンボードNR、Discord Krisp、ソフトウェアのデノイズを同時に使用すると、カスケード処理によって倍音成分が破壊されます。抑制ステージを1つ選んで他を無効にし、マイクレベルが正しくキャリブレートされている場合は自動ゲイン調整もバイパスしてください。

ボイスフィルターはDiscordのステージチャンネルでも機能しますか？

はい。ステージチャンネルは通常のボイスチャンネルと同じWebRTCパイプラインを使用するため、入力として選択した仮想マイクはそのまま通過します。ピッチシフト、フォルマント、EQ、AIボイスクローニングはすべてステージで機能します。スピーカーが自然に割り込めないため、レイテンシの余裕がやや厳しくなります。処理チェーン全体を50ms以内に収めてください。

サードパーティのボイスフィルターはDiscordの利用規約に違反しますか？

Discordの利用規約は、コミュニティガイドラインに違反してユーザーを嫌がらせしたり、なりすましたり、欺いたりするために使用しない限り、仮想オーディオデバイスと外部音声処理を許可しています。サウンドボード、ボイスチェンジャー、ノイズ抑制はすべて一般的で受け入れられています。特定の実在人物を本人の同意なしに模倣するためにAIボイスクローニングを使用しないでください。

CPUスパイクなしでDiscordにボイスフィルターを追加するには？

low-latency audio captureエクスクルーシブモードと固定バッファサイズで音声を処理するツールを使用してください。VoxBoosterは最新のラップトップでCPU約6〜8パーセントという単一の音声スレッドでエフェクトチェーン全体を実行します。複数のVSTホストを同時に読み込むことを避け、チェーン内の未使用エフェクトモジュールを無効にしてください。

Discordサーバーごとに異なるボイスフィルターを設定できますか？

Discord自体はサーバーごとの入力デバイス選択をサポートしていませんが、外部でワークフローを構築できます。各VoxBoosterプリセットにホットキーを割り当て、別のサーバーに参加する際に切り替えます。一部のユーザーは、小さなAutoHotkeyスクリプトを使用してウィンドウフォーカスイベントにプリセットを紐付けることでこれを自動化しています。

Discordのボイスフィルター：最高のセットアップガイド（2026年）

Name: VoxBooster
Price: 6.99 USD

Discordの適切なボイスフィルターを選ぶことは、本来の自分の声で聞こえるか、圧縮されたトーク番組のような声に聞こえるかの違いを生みます。Discordは標準で3つのフィルターのみを提供しています。Krispノイズ抑制、エコーキャンセル、自動ゲイン調整です。これらはいずれもピッチ、フォルマント、キャラクターボイス、AIクローニングには関与しません。それ以外の機能はすべて、Discordクライアントの上流で動作する仮想マイクに依存します。

このガイドは、真剣なDiscordユーザー向けの完全なセットアップ解説です。ストリーマー、レイドコーラー、ポッドキャストの共同ホスト、D&Dグループ、声が曇って聞こえると言われた方、またはホットキーで切り替えられるキャラクタープリセットを望む方向けです。Discordがネイティブに何を行うか、何ができないか、そしてレイテンシやロボット音のアーティファクトを導入せずにギャップを埋める方法を説明します。

主なポイント

Discordの内蔵フィルターはノイズ、エコー、AGCをカバーします。ピッチ、フォルマント、EQ、キャラクターボイスには外部仮想マイクが必要です。
複数のノイズサプレッサーをカスケードすると音質が低下します。1つのステージを選んで残りを無効にしてください。
low-latency audio captureベースの処理でエンドツーエンドのレイテンシを50ms以下に抑え、カーネルドライバーの競合を避けます。
VoxBoosterはリアルタイムボイスチェンジング、サウンドボード、AIクローニング、Whisper音声認識を単一のWindowsアプリで実行します。
サーバーごとのプリセットワークフローは、ホットキーまたはウィンドウフォーカスに紐付けたAutoHotkeyスクリプトで実現できます。

DiscordのボイスフィルターとはDiscordの内蔵ボイスフィルターが実際に何をするか

Discordを開き、歯車アイコンをクリックして「音声・ビデオ」に移動します。「音声処理」セクションには3つのトグルと「詳細設定」サブセクションがあります。各機能の内容と限界を説明します。

Krispノイズ抑制はKrispからライセンスされた機械学習ベースのデノイザーで、Discordのサーバー上で通話ごとに適用されます。キーボードの音、ファン、交通騒音、犬の鳴き声など背景ノイズを、音声と非音声の違いを認識することで除去します。適度なノイズフロアでは良く機能し、単独で使用する場合はアーティファクトが最小限です。声そのものには何もしません。EQ、コンプレッション、ピッチはありません。

エコーキャンセルは、スピーカーとマイクが同じ部屋で同時にアクティブになったときに発生するフィードバックループを除去します。適切なアイソレーションを備えたプロフェッショナルモニタリングを使用している場合を除き、常にオンにしておいてください。一般的なデスクトップ設定でこれをオフにすると、他の全員にとって通話がフィードバックの悪夢になります。

自動ゲイン調整は、小声のささやきと大きな叫び声が両方とも使用可能な範囲に収まるよう入力レベルを平準化します。キャリブレートされていないマイクを使用するカジュアルユーザーには便利ですが、上流で実行するコンプレッサーやリミッターと競合し、動的な発話をフラットに聞こえさせる傾向があります。ストリーマーや上級者は通常AGCを無効にして、マイクレベルを手動で設定します。

Discordが搭載していないもの：ピッチシフト、フォルマント補正、パラメトリックEQ、キャラクターボイスプリセット、サウンドボードホットキー、AIボイスクローニング、リアルタイム文字起こし、チャンネル別処理チェーン。これらはすべて仮想マイクアプリケーションから来る必要があります。

外部ボイスフィルターがブラウザプラグインより優れている理由

Discordにフィルターを追加する方法は3つあります。

Discord Webクライアント向けブラウザ拡張機能。 これらはDiscordがすでにKrispを適用した後のWebRTCオーディオストリームにアクセスします。エフェクトは限られており、デスクトップアプリでは使用できず、Discordのアップデートで定期的に壊れます。
オーディオインターフェイスルーティングユーティリティ内のVSTホスト。 強力ですが複雑です。DAWのようなVSTホストを読み込み、ASIOループバック経由でオーディオをルーティングし、出力を仮想マイクとして公開します。各ルーティングホップでレイテンシが蓄積されます。
専用仮想マイクアプリケーション。 専用ツールがlow-latency audio captureでマイクをキャプチャし、内部エフェクトチェーンを実行し、Discordが通常の入力として認識する単一の仮想デバイスを公開します。1つの音声スレッド、予測可能なレイテンシ、維持すべきルーティンググラフなし。

Discord専用の作業には、専用仮想マイクアプリが3つの測定可能な軸で勝ります。セットアップ時間、エンドツーエンドレイテンシ、CPUフットプリントです。VoxBoosterはこのアーキテクチャをデフォルトで提供します。一度インストールして、Discordの入力設定で「VoxBooster仮想マイク」を選択すれば完了です。

フィルタースタック：実際に設定すべき内容

Discord対応のクリーンなフィルターチェーンはこの正確な順序で6つのステージがあります。順序を変えると聴覚上のアーティファクトが発生します。

ステージ	目的	一般的な設定
1. ノイズ抑制	背景ノイズを除去	シングルパスMLデノイズ、軽い設定
2. ハイパスフィルター	80Hz以下の低音を除去	80〜100Hz、12dB/oct
3. EQ	音色を整形	200〜400Hz濁りをカット、3〜5kHzプレゼンスを持ち上げる
4. コンプレッサー	ダイナミクスを制御	3:1レシオ、-18dBスレッショルド、5msアタック
5. ピッチ/フォルマント/キャラクター	ボイスチェンジ	プリセットごとにオプション
6. リミッター	ピークを捕捉	-1dBシーリング、高速ルックアヘッド

不要なステージはスキップしてください。静かな部屋と良いマイクを持つストリーマーは、ステージ3、4、6のみを使用するかもしれません。D&D用のキャラクターボイスには6つすべてが必要です。重要な原則：各ステージは小さな貢献をすべきです。単一のフィルターが重作業をしている場合、結果は処理された音に聞こえます。

自分のフィルターを使う際にDiscordのフィルターを無効にする方法

外部で音声を処理する場合、Discordの内蔵スタックはあなたのものと競合する第2のパスになります。結果は二重に圧縮され二重にデノイズされた音声で、こもって聞こえアーティファクトだらけになります。

VoxBoosterを入力として使用する際の推奨Discord設定：

Krisp：オフ（外部チェーンがデノイズを処理）
エコーキャンセル：オン（これは音響処理であり信号処理ではない）
自動ゲイン調整：オフ（リミッターがピークを処理）
音声アクティビティ検出 vs プッシュ・トゥ・トーク：好みに応じて、どちらも機能します
入力感度：手動、部屋のノイズフロアのすぐ上に設定

この設定により、Discordが出力を再処理することなく外部チェーンが機能します。唯一の例外：騒がしい環境で外部デノイザーが軽いモードに設定されている場合、バックアップのセーフティネットとしてKrispをオンにしておくことができます。友人とボイスチャンネルで両方の設定をテストし、相手側でよりクリーンに聞こえる方を選んでください。

ピッチ、フォルマント、キャラクターボイス

ここがDiscordが最も欠けており、サードパーティツールが輝く部分です。標準的なユースケース：

ピッチシフトのみ。 ボイスチャットでの身元の隠蔽や微妙なオルターエゴの構築に有効です。明らかな処理アーティファクトを避けるために+/-4半音以内に抑えてください。この範囲を超えると自然に聞こえるためにフォルマント補正が必要になります。

ピッチとフォルマント。 性別を超えたボイスワークや説得力のある年齢変化に必要です。フォルマントはピッチと同じ方向に、約半分の比率でシフトします。-3半音のピッチシフトは約-15%のフォルマントと組み合わせます。

キャラクタープリセット。 特定のアーキタイプ向けに事前調整された組み合わせ：深い悪役、高音の妖精、老魔法使い、ロボット的なアナウンサー。これらは通常、ピッチ、フォルマント、EQカーブ、時に軽いディストーションやリバーブを1クリックプリセットに積み重ねます。VoxBoosterはスターターセットを提供し、カスタムプリセットの保存も可能です。

AIボイスクローニング。 数分の参照音声でモデルをトレーニングし、リアルタイムであなたの声を変換します。モデルが固定パラメーターでは再現できない発音パターン、呼吸のタイミング、自然なマイクロバリエーションを捉えるため、結果はDSP単独よりも劇的に説得力があります。

自然な声と1〜2つのキャラクタープリセット間のホットキー切り替えで、ボイスチャットを離れることなくオンザフライで切り替えられます。最もクリーンなワークフローは、「バイパス」（軽いEQを施した生マイク）に1つのホットキーを割り当て、キャラクタープリセットに1〜2つを割り当てます。

Windowsでボイスフィルターをつ結ぶ方法

レジストリ編集やドライバーインストールなしでWindows 10と11で機能するエンドツーエンドのセットアップです。

公式サイトからVoxBoosterをインストール
VoxBoosterを開き、物理マイクを入力デバイスとして選択
エフェクトチェーンを設定（ノイズ抑制、EQ、コンプレッサー、オプションのピッチ/フォルマント/キャラクター）
VoxBoosterがシステムにVoxBooster仮想マイクを公開することを確認
Discordを開き、ユーザー設定 > 音声・ビデオに移動
入力デバイスを「VoxBooster仮想マイク」に設定
Discord内のKrispノイズ抑制とAGCを無効化（チェーンがこれらを処理する）
プライベートボイスチャンネルでテスト：話し、入力バーを確認し、クリッピングなしで快適にレベルがピークに達することを確認

一連の作業は約3分で完了します。この初期セットアップ後はVoxBoosterとのみ対話します。DiscordはただのマイクとしてVoxBoosterを認識し、違いを知ることはありません。

レイテンシ、CPU、よくある落とし穴

DiscordはWebRTCスタックで1区間あたり20msのレイテンシバジェットを目標としています。入力処理がそれに追加されます。追加レイテンシが50ms以下であれば会話では知覚できません。100msを超えると、割り込みや会話のやりとりが重く感じられます。

レイテンシのヒント：

最低パスのためにlow-latency audio captureエクスクルーシブモードを使用
バッファサイズを128または256サンプルに設定（44.1kHzで約3〜6ms）
仮想マイクと並行してASIOを使用するDAWの実行を避ける
積極的に使用していない場合でも、2番目の音声処理アプリを閉じる

CPUのヒント：

典型的なエフェクトチェーンは最新のラップトップでCPUの5〜10パーセントを使用
AIボイスクローニングはモデルサイズに応じて5〜15パーセントを追加
チェーン内の未使用エフェクトモジュールはバイパスするだけでなく無効にする
ハイブリッドIntelチップでは音声スレッドをパフォーマンスコアに固定

よくある落とし穴：

物理マイクと仮想出力のサンプルレート不一致（両方を48kHzに設定）
同じコントローラーにWebカメラがある場合のUSBハブ帯域幅競合
OSレベルで有効になっているWindowsオーディオ拡張がアプリ内処理と競合
仮想マイクに切り替えた後にKrispが誤ってオンのままになっている

AIボイスクローニングとDSPフィルターの使い分け

DSPフィルター（ピッチ、フォルマント、EQ、コンプレッション）は固定の数学的変換を適用し、一般的な音声整形に機能します。AIボイスクローニングは実際の音声でトレーニングし、パラメーターセットでは再現できない特性を捉えた変換を生成します。

素早い音声マスキング、軽いキャラクター調整、またはストリーマーの個性的な音を求める場合はDSPを使用してください。セットアップは即時でCPU使用量は最小限です。

高忠実度で特定のターゲットボイス（キャラクターアーキタイプ、異なるペルソナ、年齢を重ねた声）を求める場合はAIクローニングを使用してください。トレーニングには数分かかります。実行時のCPU使用量は高くなりますが、最新ハードウェアでは許容範囲内です。

VoxBoosterは同じチェーン内で両方をサポートします。EQとノイズ低減で前処理し、AIクローニングを実行し、リミッターで後処理、すべて合計300ms未満のレイテンシで行えます。

まとめ

Discordに適したボイスフィルターは、適切なスタックを選んでクリーンに設定することです。Discordの内蔵フィルターはカジュアルユーザーには十分ですが、真剣な使用には適切なエフェクトチェーンを備えた仮想マイクと、Discordの冗長な処理を無効にする規律が必要です。

VoxBoosterは、ノイズ抑制、EQ、コンプレッション、ピッチとフォルマント、キャラクタープリセット、AIクローニング、Whisper文字起こしというパイプライン全体を、300ms未満のレイテンシを持つ単一のWindowsアプリケーションで実行します。カーネルドライバーなし、アンチチートとの競合なし、維持すべきルーティンググラフなし。3日間無料でお試しください。その後は$6.99 USD / R$29,90 BRL / €5.99 EURの月額で全機能が使えます。

詳細なガイドとして、Discordボイスチェンジャーセットアップ、ボイスクローニングとボイスチェンジャーの違い、リアルタイムボイスクローニングをご覧ください。Windowsオーディオアーキテクチャの背景については、[Microsoft low-latency audio captureドキュメント](https://learn.microsoft.com/en-us/windows/win32/coreaudio/low-latency audio capture)が権威ある参考資料です。

Discordのボイスフィルター：最高のセットアップガイド（2026年）

Discordのボイスフィルター：最高のセットアップガイド（2026年）

DiscordのボイスフィルターとはDiscordの内蔵ボイスフィルターが実際に何をするか

外部ボイスフィルターがブラウザプラグインより優れている理由

フィルタースタック：実際に設定すべき内容

自分のフィルターを使う際にDiscordのフィルターを無効にする方法

ピッチ、フォルマント、キャラクターボイス

Windowsでボイスフィルターをつ結ぶ方法

レイテンシ、CPU、よくある落とし穴

AIボイスクローニングとDSPフィルターの使い分け

まとめ

よくある質問

VoxBoosterを試す — 3日間無料。