YouTubeナレーションには目に見えない難しさがある:ニッチで最高のコンテンツ、完璧な編集、コンバートするサムネイルを持っていても――声がかすれていたり、一貫性がなかったり、単に「アマチュアっぽい」と感じさせると、最初の15秒で視聴者を失う。人間の耳はオーディオクオリティに容赦ない。たとえ視聴者がなぜ動画をやめたか言葉にできなくても。
このガイドは今から始める人のためのワークフローだ。スタジオも高価な機材も不要で、異なる日に録音したセッション間でティンバーを標準化するためのボイスチェンジャーの使い方も含む。
まず:スクリプトがすべてを変える
プロのボイスオーバーはマイクの前から始まる。即興でナレーションすれば即興に聞こえる――そして聴き手は問題を指摘できなくても感じ取る。完全なスクリプトを書いて、録音前に一度声に出して読み、ポーズ、強調、呼吸を入れたい場所をマークしよう。
実践的なヒント:
- 短い文章の方が長い文章よりナレーションに向く。自然に息継ぎするところで切ろう。
- 書くように書かずに、話すように書く。「こうなるよ」の方が「こうなります」より自然に響く。
- スクリプトブロックに番号をつける。間違えたセクションを録り直す時に「ブロック7、テイク2」と声に出しておくと、編集で助かる。
YouTubeナレーション用マイクセットアップ
スタジオコンデンサーは必要ない。ダイナミックマイク(Samson Q2U、Audio-Technica ATR2100x、Shure MV7)の方が環境ノイズをよく排除し、音響処理がない人でも扱いやすい。
マイク以上に重要なこと:
- 一貫した距離 ― 常にカプセルから15〜25cmを保つ。セッション間で距離を変えることが、動画ごとに「声が違う」感覚を生む。
- 家の中で最も閉じた部屋 ― クローゼットの洋服が急いで買ったフォームより反響を吸収する。
- 静かな時間帯 ― エアコン、冷蔵庫、交通音。早朝か夜に録音しよう。
録音:パフォーマンスで何をするか
ゆっくり話そう。本当に、自然に感じるより遅く。早いナレーションは焦りに聞こえる。無音は編集でカットできるが、後から落ち着きを加えることはできない。
常に必要以上に録音しよう――各ブロックで少なくとも2テイク。1回目は声をウォームアップし、2回目は大抵よりナチュラルになる。「悪い」テイクをその場で消さないこと:編集で選択肢があることに感謝することになる。
プロのボイスオーバー:ボイスチェンジャーの出番
数週間かけて動画を録音する人が抱える本当の問題がここにある:声は変わる。月曜日は休んだ後でたっぷりしたティンバーで録音した。木曜日は風邪で30%鼻声だ。翌週はまた違う。
結果はチャンネルの各動画が微妙に異なるサウンドになる――そしてアルゴリズムは視聴者登録者数のメトリクスより先にウォッチタイムで気づく。
VoxBoosterはボイスクローンを標準化レイヤーとして適用することでこれを解決する。通常通り生の声を録音し、その後オフラインモードでファイルを処理する:モデルがパフォーマンス(リズム、感情、ポーズ)を保ちながら、選んだプロフィールにティンバーを正規化する。「明瞭で話し方のはっきりしたナレーター」の声を一貫して適用することで、バラバラのエピソードではなくシリーズとして動画が聞こえるようになる。
リアルタイムで録音したい場合もリアルタイムで使える。ナレーター声のレイテンシは約480msで、録音の邪魔にはならない(通話ではなくスクリプトを読んでいるので)。
編集とノーマライゼーション:プロとアマチュアを分ける2つのステップ
編集: 重い呼吸、長すぎる無音、ミスをカット。自然なポーズポイントには短い無音(300〜500ms)を残す――リズムを与える。すべての無音を除去しようとしないこと。息継ぎのない声はロボットっぽく聞こえる。
ノーマライゼーション: YouTubeの場合は常に-14 LUFSでエクスポートする(プラットフォームがそのレベルに正規化する)。それより高くエクスポートするとYouTubeが下げる。低くエクスポートするとレコメンドキューの他の動画と比べて弱く聞こえる。Audacity、Reaper、DaVinci Resolveにはラウドネスノーマライゼーションが内蔵されている――エクスポート設定で「LUFS」を探そう。
6ステップワークフロー
- 完全なスクリプトを書いて、声に出して読んで、難しい箇所をマーク
- 一貫したマイクセットアップ――できる限り同じ距離、同じ部屋、同じ時間帯
- 各ブロックで2テイク、声で番号付け
- オーディオエディタにインポートして各ブロックのベストテイクを組み立て
- 選んだナレーター声でVoxBooster(オフラインモード)で処理
- -14 LUFSにノーマライズ、WAVまたはMP3 320kbpsでエクスポート
最初の10本の動画でこのフローを踏めば、第1話から一貫したサウンドのチャンネルができる――それが成長する人と最初の1,000登録者で停滞する人を分けるものだ。