無料のAI音声クローン: 自分の声をステップバイステップで複製する

無料のAI音声クローンを正しく行う: PC上であなた自身の声の複製を記録、トレーニング、テスト、および使用するためのステップバイステップの説明書。クレジットカードなし、データアップロードなし。

無料のAI音声クローンは、詐欺のように聞こえ、その後、完全に実行可能であることが判明する検索の1つです。ただし、常に許可されている唯一の声をクローンしている場合に限ります:あなた自身の声。これはツールの概要やテクノロジーの仕組みに関する講義ではありません。これは今日完了できる実践的なウォークスルーです:良いサンプルを記録し、クローンをトレーニングするための無料ルートを選択し、特徴的なアーティファクトをリッスンしてから、実際に入力されたテキスト音声として、またはコール中にライブで使用してください。自分の声を無料で複製して検索し、多くの約束が見つかります。このポストは、押すべき実際のボタンを示す部分です。

無料のバリアント詳細について、またはモデルが何をしているかについてのプレーン英語の説明については、それはシスターポストにあり、以下にリンクされています。ここのすべて今日やるバージョンです。


要約

  • 無料のAI音声クローンで自分の声を4つのステップでクローンできます:記録、トレーニング、テスト、改善、使用。
  • 静かな部屋で3〜5分間の明確で多様な音声を記録してください。入力品質は常に入力長より優れています。
  • 3つの無料ルートがあります:オンライン無料層、オープンソースのローカルモデル、フルデスクトップトライアル。ハードウェアとプライバシーのニーズで選択してください。
  • ロボット音は少なすぎるデータを意味します。くぐもった出力はノイズの多いデータを意味します。ツールを責める前に記録を修正してください。
  • 使用方法を決定してください:TTSスタイルの入力テキスト、またはDiscord、OBS、およびゲームでライブで実行されるリアルタイム変換。
  • 自分の声だけをクローンするか、クローンできる許可を得た声をクローンし、合成音声を開示してください。

無料のAI音声クローンが実際に何を含むか

ステップの前に、仕事の形を知ることが役に立ちます。音声クローン作成は、ターゲット音声のモデルを記録にトレーニングして、その声で新しい単語を話せるようにします。これは、既に持っている声を曲げるだけのピッチシフト音声チェンジャーとは異なります。モデルがどのように音色と拍動を学ぶかについての完全な説明がほしい場合、音声クローンAI説明はそれを終わりから終わりまでカバーしており、音声合成の概要は堅牢な技術的入門書です。ここでは、実践的なままです。

ワークフローは、使用する無料ルートに関係なく同じです:

  1. 音声の明確なトレーニング音声を記録します。
  2. 無料のルートの1つで複製をトレーニングしてください。
  3. 結果をテストし、必要に応じて音声を改善してください。
  4. 複製を入力テキスト音声または実時間音声として使用してください。

クローンがあなたのように聞こえるか壊れたロボットのように聞こえるかの単一の最大予測子はステップ1です。それが私たちが最も多くの時間を費やす場所です。

ステップ1: 音声クローンのためにクリーンなトレーニング音声を記録する

モデルは、それに与える音声と同じくらい良いしかありません。ブラウザ層からオープンソースモデルからデスクトップトライアルまで、すべての無料音声クローンAIルートは、クリーンなサンプルを報酬し、ノイズの多いサンプルを罰します。これを正しくやれば、控えめな無料ツールさえ説得力があります。これを間違えて、地球上で最も高価なモデルはまだくぐもって聞こえます。

静かな部屋を選んでノイズを排除する

持っている最も静かな部屋で記録し、エコーを吸収する柔らかい家具があります。カーペット敷きの寝室にはベッドとカーテンがあり、タイル張りのキッチンや空のオフィスを打ちます。ファン、エアコン、およびハムを持っているものはすべてオフにしてください。ウィンドウを閉じます。電話通知をサイレント状態にしてください。目標は、唯一のものがあなたの声であるトラックを記録することです。

後で記録をクリーンアップする必要がある場合、無料のAudacityノイズ削減ツールは、沈黙の2番目をサンプリングすることで、一定の背景ハムを取り出すことができます。穏やかに使用してください。重いノイズ削減はそれ自体の水っぽいアーティファクトを追加し、クローンを混乱させます。

まともなマイクを使用して、レベルを正しく設定してください

スタジオマイクは必要ありませんが、最悪の入力を避ける必要があります。大まかな好みの順序:USBコンデンサーマイク、ヘッドセットブームマイク、またはインラインマイク付きの有線イヤホン。ラップトップの内蔵マイクは最悪のオプションです。部屋全体とファンを拾うからです。

通常の音声がメーターの上部をはるかに下回るようにして、記録レベルを設定してください。最も大きな単語が天井に当たってひずむクリッピングは、モデルに提供する最悪のものの1つです。クリップされたピークはクローンが必要とする正確な詳細を消去するためです。

多様で自然な文を話す

3〜5分間読んでいますが、平らな単調なトーンで読んでいません。モデルはバラエティからピッチ範囲と明瞭さを学習するため、それにバラエティを与えます:

  • ステートメント、質問、そして少しの興奮を混ぜてください。
  • 音の범위を含めてください:ハード子音、ソフト母音、数字、および長い単語。
  • あなたの自然なペースと音量で話してください。実際のコールで話す方法。硬いアナウンサーの声ではありません。
  • それらを一緒に急いで、むしろそれらを一緒に急いで、む文の間に短い一時停止を残してください。

良いトリックは、通常の散文の数段落を大声で読んでから、1分間あなたの日について脚本なしで話すことです。脚本なしの部分はあなたの真のペースをキャプチャします。結果を非圧縮のWAVとして保存し、クローンが安定したバージョンの声を聞くように、セッション間でマイクの距離、レベル、フォーマットを一貫性を保ってください。

声をクローンするのにどのくらいの音声が必要ですか?

固いクローンのためにはおよそ3〜5分間のクリーンで多様な音声が必要ですが、ラフの類似性は30〜60秒と同じくらい低くなる可能性があります。約10分を超えると、追加の長さは記録品質よりもはるかに助けになります。静かな部屋とクリップフリーのレベルは、生の時間よりも重要です。

その答えは、より多くのデータが常に良いと仮定する人々を驚かせます。ある点までは本当ですが、ノイズはスケーリングされます。ハミングされた冷蔵庫の横に記録された10分は、衣服でいっぱいのクローゼットに記録された3分よりも悪いです。追加の秒ごとのハミングはモデルに間違ったことを教えるからです。スイートスポットを狙ってください:ピッチ範囲をカバーするのに十分な多様な音声。すべてきれい。

ステップ2: クローンをトレーニングして使用するための無料ルートを選択してください

クローンをトレーニングするために、本当に無料のAI音声クローン作成ルートが3つあります。便利さ、プライバシー、努力は非常に異なっています。この投稿は完全な比較を再実行しません。なぜなら、無料層制限ブレークダウンは既にルートごとに実行しているからです。ここはあなたが選んで先に進むことができるように短いバージョンです。

ルート開始方法努力プライバシーライブで動きますか?
オンライン無料層ブラウザでサンプルをアップロードする非常に低い低い(クラウドアップロード)いいえ(TTSのみ)
オープンソースローカルモデルモデルを自分でインストールして実行してください高い(GPU +セットアップ)高い(何もアップロードされません)箱の外でめったに
フルデスクトップトライアル(オンデバイス)アプリをインストール、ローカルにトレーニングしてください低い高い(ローカル処理)はい

オンライン無料層

AI音声クローン作成オンライン無料ツールは、最初の結果への最速のパスです。ブラウザを開き、サンプルをアップロードし、インストールなしで入力されたテキストから音声を生成します。短い出力キャップ、透かし、個人使用のみの用語、およびプロバイダーのサーバーに保存されるサンプルを期待してください。迅速なデモには最適で、プライベート、長い、またはライブのものには弱いです。

オープンソースローカルモデル

サブスクリプションを支払わずにクローン作成を実行し、完全なプライバシーを維持することが優先事項の場合、独自のマシンで実行されるオープンソースモデルは純粋な無料ルートです。ソフトウェアは何も費用がかからず、何もアップロードされません。捕捉は有能なGPU、数時間のセットアップ、およびコマンドラインでの快適さです。あなたは全体の結果を所有しています。また、家具を自分で構築してください。

フル機能のデスクトップトライアル

3番目のルートは、本当の無料試用版を備えたデスクトップアプリです。低い努力はローカルプライバシーに会い、1つの正直なキャッチ:試用版には時計があります。VoxBoosterはここに適しています。Windows 10および11で実行され、独自の声の複製を完全にオンデバイスで訓練して何もアップロードされず、その3日間の試用版はクレジットカードを必要としません。決定する前に、完全な記録トレーニング使用ループをテストできます。料金ページで後で計画を比較できます。無料のクローン作成が一般的に何ができないかについて、より広い画像については、無料音声クローン概要は関連の読み取りです。

どのルートを選択しても、トレーニングステップはほぼ同じです:ツールをレコーディングに向け、トレーニングを開始し、待機してください。オンラインティアはすぐに終了します。彼らのハードウェアで重い持ち上げが起こるからです。ローカルルートはより長く、GPUに依存します。その後、テストするクローンがあります。

ステップ3: テストして改善し、アーティファクトが何を意味するか

クローンをトレーニングした文でクローンを判断しないでください。新しい文に新しい文を入力してください。それは見ることはありませんでした。理想的には、音のミックスを備えたもの、批判的にリッスンしてください。聞こえるアーティファクトは、修正するものを正確に教えてくれる診断読み取りです。

ロボット的、金属的、または薄い出力は少なすぎるデータを意味します

クローンが持続された母音でロボット、ハムノイズ、または金属的に聞こえる場合、モデルはあなたの声のピッチと明瞭さの完全な範囲を学習するのに十分ではありません。それはあなたが聞いたことがない部分をしています。修正は多様な音声をもっと多くの同じ文ではなく。質問を追加してください。興奮を追加してください。見落とした音を追加してください。1分から3〜4分の本当に多様な資料を進めます。

くぐもった、ぼやけた、または水っぽい出力はノイズの多いデータを意味します

クローンがくぐもった、ぼやけた、または水没に聞こえる場合、あなたの入力はノイズが多かったです。部屋のエコー、背景のハム、または重い手持ちのノイズ削減、すべてモデルにブリーディングし、結果を曖昧にします。修正は長時間のクリーニングレコーディングです。より静かで柔らかい部屋に移動し、マイクに近づき、再記録してください。クリーンな90秒のテイクは、ノイズの多い5分を毎回毎回倒すでしょう。

クリッピングとリスティングアーティファクト

最も大きな言葉の厳しい割れた音は、ソースのクリッピングを指します。記録レベルを下げて再度試してください。ぼやけた、またはヒスする音とT音は、マイクが近すぎたか、口に直接向いていることを示していることが多いです。少しオフアクシスに角度を付けます。記録段階での小さな変更は、リトレーニングが救うことができないアーティファクトを削除します。

改善はループです。ワンショットではなく。1つのことを変更し、再トレーニングしてもう一度聞いてください。ほとんどの無料ルートは迅速に再トレーニングを許可しているため、2〜3パスは通常、粗いから説得力あるに変わります。

ステップ4: クローンを使用してください。TTSスタイルまたはリアルタイム変換

クローンがあなたのように聞こえたら、それを使用する方法は2つのモードに分かれます。必要なモードは、選択したルートに影響を与えるべきでした。

TTSスタイル:入力されたテキストがクローンされた音声になります

テキスト音声モード では、スクリプトを入力し、クローンはあなたの声でそれを読みます。ドキュメントのような単語を編集し、間違って着地する行を再度レンダリングし、クリーンな記録で終わります。これはスクリプト化されたコンテンツに適しています:ナレーション、ナレーション、オーディオブック草案、アクセスビリティ読み取り、または磨かれた音に聞こえたい。ほぼすべてのオンライン無料層がこのように機能します。これが彼らがライブになることができない理由です。

リアルタイム変換:あなたの声の声が再マップされました

リアルタイムモードでは、マイクに話しかけ、クローンは話す際にライブオーディオをターゲット音声に再マップし、低遅延でタイミングと強調を保持します。これはDiscord呼び出し、ストリーム、またはゲームに必要なものです。低遅延ローカル処理に加えて、変換されたオーディオを他のアプリにルーティングする仮想マイクが必要です。

これは、オンデバイスのデスクトップツールが稼ぐ場所です。VoxBoosterはカーネルドライバーなしで仮想マイクを実行するため、クローンをトレーニングしたら、Discord、OBS、ゲーム、または会議で入力として選択でき、すべてのPCから何も残されずにリアルタイムでクローンされた声を聞きます。

リアルタイムはまた、処理がローカルでない場合は遅延がイリュージョンを破壊するモードでもあります。クラウドラウンドトリップは聞こえる遅延を追加するためです。独自のマシンで変換を維持することは、ライブ使用を遅延ラグの代わりに自然に感じられるようにします。

無料のAI音声クローン作成と同意:あなた自身の声だけをクローンしてください

無料のAI音声クローン作成は技術的障壁をほぼ何もしませんが、これは倫理的な線をより重要にし、より少ないものではありません。ルールはシンプルで、ツールは無料だったので曲がりません:あなた自身の声だけをクローンするか、あなたが使用する明示的な書面による同意を持っている声。

コンテンツ、アクセシビリティ、または楽しみのために独自の声をクローンすることは完全に合法で低リスクです。許可なしに実在の人物の声をクローンすることは、パブリシティ権、詐称ルール、および新しいAI固有の法律に違反する可能性があります。法律を超えて、それを公開するときに合成音声を開示してください。リスナーは一般的に、言われなくても、良いクローンを実際のものから伝えることはできません。これらの規範が存在する理由は、オーディオディープフェイクケースおよびクローンされた音声を家族緊急スキームで使用しているスキャマーに関するFTCの警告に見えます。あなた自身の声、他人のための同意、開示で、あなたはそのすべての右側にとどまります。

よくある質問

無料で自分の声をクローンするにはどうしたらいいですか? 静かな部屋で3〜5分間の明確で多様な音声を記録し、無料の音声クローン作成ルート(オンライン無料版、オープンソースのローカルモデル、またはフルデスクトップトライアル)にフィードして、クローンをトレーニングし、新しい文でテストして、音がおかしければ音声を改善してください。

自分の声をクローンするのにどのくらいの音声が必要ですか? 30〜60秒からラフクローンが得られますが、3〜5分間の明確で自然で多様な音声ははるかに目立つ結果をもたらします。約10分を過ぎると、追加の長さは記録品質ほどは役に立ちません。静かな部屋と適切なマイクは、生の時間よりも重要です。

何もダウンロードせずに無料でオンラインで自分の声をクローンできますか? はい。ブラウザベースの無料層を使用すると、サンプルをアップロードしてインストールなしで音声を生成できます。これはデモを取得するための最速の方法です。トレードオフは短い出力キャップ、透かし、個人使用規約、およびPC上に留まるのではなく、プロバイダーのサーバーに保存される音声サンプルです。

無料の音声クローンがロボット的またはくぐもった音に聞こえるのはなぜですか? ロボット的または金属的な出力は、通常、トレーニングデータが少なすぎることを意味するため、モデルはピッチの全範囲を学習していません。くぐもった出力またはぼやけた出力は、通常、ノイズの多い入力を意味します:部屋のエコー、背景のハム、またはクリッピング。記録を最初に修正してください。クリーンな短いサンプルは常に長いノイズの多いサンプルに勝ります。

TTS音声クローンと実時間変換の違いは何ですか? TTSクローンは入力されたテキストをクローンされた声で音声に変換するため、ドキュメントのように単語を編集できます。実時間変換は、話すときにライブマイクをクローンされた声に再マップし、低遅延でタイミングと強調を保持します。TTSはスクリプト化されたコンテンツに適しています。実時間はコール、ゲーム、ストリームに適しています。

Discordや生配信で無料の音声クローンを使用できますか? ツールがリアルタイム変換を実行し、仮想マイクを公開する場合のみです。ほとんどの無料オンラインティアはテキスト音声のみであり、ライブで実行することはできません。処理済みオーディオを仮想マイクに送るローカルアプリは、十分に低い遅延でDiscord、OBS、またはゲームに自然な音が聞こえるように供給できます。

無料で自分の声をクローンすることは合法ですか? 自分の声をクローンすることは合法で低リスクです。ツールが無料であることは、法律に関しても何も変わりません。明示的な書面による同意なしに実在の人物の声をクローンすることは、パブリシティ権、詐称ルール、および新しいAI固有の法律に違反する可能性があります。自分の声だけをクローンするか、使用する許可を得た声をクローンし、合成音声を開示してください。

まとめ

無料のAI音声クローンはあなたがクローンしている声があなたのものであり、全体的な仕事が4つの正直なステップに落ちると神話ではありません:静かな部屋で明確で多様な音声を記録し、あなたのハードウェアとプライバシーのニーズに適した無料ルートをトレーニングしてください。新しい文でテストして読んでアーティファクトを改善し、クローンを入力テキスト音声または生きた、リアルタイム音声として使用してください。記録を正しくしてください。控えめな無料ツールでさえあなたのように聞こえます。間違えて、モデルはそれを保存することはできません。

独自のマシンで音声を保持し、コールまたはストリームでライブで使用することが最も重要な場合、オンデバイスパスはそのために構築されています。VoxBoosterは1つのオプションです。その3日間の試用版は、クレジットカードなしで、独自の声の複製をローカルにトレーニングし、仮想マイクを通じて結果をアプリに送ります。どのツールを選択するにせよ、自分の声をクローンするか、同意の上でそれをクローンし、合成音声を開示し、どの無料ルートがあなたの目標と一致するかを知って、その知識で入ってください。VoxBoosterをダウンロードしてくださいローカルルートを自分でお試しください。

VoxBoosterを試す — 3日間無料。

リアルタイム音声クローン、サウンドボード、エフェクト — 会話するすべての場所で。

  • カード不要
  • ~30msのレイテンシ
  • Discord · Teams · OBS
3日間無料で試す