海苔状の音声波形は耳が疲れる

YouTubeで動画を見ていて、音量は大きいのに、「聴いていて疲れる」と感じる動画はありませんか?

私は今朝、次の動画を見たときにそれを感じました。

AIを使うのが怖くなくなる!絶対にやってはいけない3つの注意点

本動画の配信者の動画は、私がGoogleのAI Geminiに興味を持ったことで、ほかの動画も見たことがありますが、音声に関しては、どれにも同じ傾向があるのを感じました。

その傾向が、下に紹介する動画にも感じられます。

【そうきチャンネル】『ロシア・米領グリーンランド「容認」』慌るデンマーク・NATO 日米近現代史研究家 渡辺惣樹 26.003

本動画は、本日、本サイトで紹介しています。

例に挙げた動画に共通するのは、音量は保たれているものの、耳を圧迫する音声のため、聴いていて疲れることです。

音声というのは、音量が小さいために聴き取りにくい場合もあれば、今回の例のように、音量はあるのに、聴いていて疲れる場合もあります。

原因は、「音圧」が高すぎることです。

例に挙げた配信者が、動画収録時に音声をどのように録音しているのか、あるいは、収録した動画の音声をどのように処理しているのかはわかりません。

私は、例に挙げた動画の音声が、聴いていて疲れるように感じる原因が「音圧が高すぎることにあるのでは?」と考え、「音圧」について、GoogleのAI Geminiに訊きました。その「対話」により、次のような回答が得られました。

ダイナミックレンジの消失

「音圧を上げる」という作業は、多くの場合、大きな音を抑え込み、小さな音を底上げして全体の音量を均一化すること(コンプレッション)を指します。

  • 影響: 抑揚(声の強弱)がなくなります。
  • 結果: 人間の耳は「音の強弱」をヒントに言葉の区切りを認識しているため、すべてが同じ強さで聞こえてくると、脳が言葉を処理しきれず疲れを感じたり、平坦で不明瞭に聞こえたりします。

今回例に挙げた配信者が、収録した音声を編集して、音圧を高くしているかどうかはわかりません。録音時の録音レベルの設定もわかりません。

もしも、収録した音声が小さいため、編集時に再生する音声を大きくした結果、動画の音声のようになっているのであれば、音量と共に音圧が必要以上に高くなっている可能性があります。

録音した音声は波形で確認できます。

聴いていて疲れる音声の波形は、大きな音量と共に小さな音量も大きな波となり、波形が「平らな板」状になっていると予想できます。

そのことを、Geminiが次のように文章化してくれました。

板のように平らになると、どこを触っても同じ厚み(音量)になります。隙間がないので「迫力」は出ますが、音の「表情(強弱)」が消えてしまうため、結果として言葉のメリハリがなくなり、聴き取りにくくなってしまうのです。

適度な音圧の音声であれば、音声波形は、のこぎりの刃のようになります。音量が大きなところは上下に高い波となり、音量が小さな部分は、上下に低い波形となります。

音圧が高い波形と正常な波形を比較する画像を、Geminiにしてもらいました。

音圧が高い波形と正常な波形

そのことで、それを聴く耳が、小さな波形のところで休むことができます。

ところが、小さな波形がなく、どこを切っても同じように、大きな波形ばかりが続いたのが音圧が高い状態で、耳は休むことができず、聴いていると疲れてしまうというわけです。

そのような音声を聴くと耳が疲れることを、Geminiは次のように書いています。

疲れの原因: 脳が「どの言葉が重要か」を判別するためにフル回転で処理しなければならず、集中力が削られて疲れてしまうのです。

私は使ったことがありませんが、YouTubeに上げる動画の音声処理に、「ラウドネス・ノーマライゼーション」を適用することができるそうです。

それを適用してもらうことで、動画を視聴する人の耳への負担が軽くなると考えられますので、音圧が高い動画の音声を配信されてる人は、そのあたりの配慮をしてくれると助かります。

音圧過多による弊害の解説

小さい音声よりも大きな音声のほうが聴き取りやすいだろうと考えているのかもしれませんが、音量と音圧は別です。音量を上げても、音圧が低ければ、聴き採りやすい音声になります。

そのあたりは、自分が録音した音声を波形で見て、大きな音量と小さな音量が、波形の端に張り付いて、「平らな板」のようになっていないか、確認できます。

そのような波形を、業界では、「海苔(のり)状の波形」や「ソーセージ」ともいうそうです。

波形がのこぎりの刃のようになると、音圧にメリハリがつき、聴いていても疲れない音声になります。

上段の波形が音圧が高いもので、下段が正常な波形です。波形に隙間が多いほど、耳にはやさしい波形になり、聴き取りやすい音声になります。

YouTubeで動画を配信されるのであれば、誰が見ても、耳を疲れさせない音声にしたほうが喜ばれます。

Geminiとの「対話」を基に、NotebookLMで動画にしました。文章を読むのが面倒な人は、動画をご覧ください。

なぜ一部の音声は、音量が大きいのに聞き取りにくいのか?