今回は、ほとんどの人には関心がなく、実際に使うこともない(?)であろうことを取り上げます。
それは、本コーナーでこのところ取り上げることが多い、デュアルADコンバータ回路を使って実現する32bit float録音についてです。
今、私がこれに興味を持つのは、今月13日にZOOMの“M3 MicTrak”を導入したことによってです。
これがどんなものであるかは、それについて書いた本コーナーを参照してください。
これを使った録音の何が凄いかといえば、録音時に、通常であれば神経を使う録音レベルの調整が一切必要ないことです。この技術を持つレコーダーには、それを調節するダイヤルがそもそもついていません。
実際に収録できる音のダイナミックレンジは非常に広く、耳で聴きとれるか聴き取れないかレベルの微細な音から、耳を劈(つんざ)くような轟音まで、音声ファイルに記録でき、それを再現できるとされています。
ただ、理論はわかっても、それを正しく再現できる人は、現時点では、案外多くない(?)かもしれません。
実例として出すのは申し訳ないと考えつつ、ひとつの例として、ネットの動画共有サイトのYouTubeで見つけた動画を下に埋め込みます。
本動画の配信者は、32bit floatを使い、2カ所で収録した映像とそれに同期する音を見聞きしてもらい、大きく録れ過ぎた音の調節の仕方を動画にしています。
そのひとつは、駅を通過する電車の音です。手前のホームの電車は、駅から出発し、スピードを上げていく最中の音です。そして、もしかしたら予想外に、反対側のホームを高速で通過する電車が写り込みました。
駅を通過する電車はスピードを落とさないため、出発していく電車に比べて音が大きく、音の大きさを示すレベルメーターは0dBを遥かに超え、波形が枠を飛び越えて真っ平らになっています。
32bit floatは大きな音でも音割れしないとされていますが、この例ではそのあり得ないことが起きている、ように思われるかもしれません。
私はZOOMのM3 MicTrakを使う以前から、同社のフィールドレコーダーの“F2”を昨年4月はじめから使っています。
これにはラベリアマイク(ピンマイク)が付属し、それを胸元につけて、話す自分の声を収録するのには最適です。
私はこのF2で、環境音を収録しようと考え、audio-technicaの“AT9912”という非常に小型のマイクを購入しました。
この組み合わせで、文章を朗読する自分の声を録音した時、マイクに息がかかり、吹かれによって、音割れを起こしたと考え、そのことを本コーナーで取り上げました。
今回取り上げたYouTube動画と同じようなことが起き、32bit floatであっても、使い方には注意が必要だと考えました。
しかしこれは、収録した音の取り扱いに通じていなかっただけだ、と考え直しました。
32bit floatの技術について書くZOOMの文章を読むと、音割れしているように思われる場合も、その部分のゲインを下げれば、通常の波形が復元される、というようなことが書かれています。
つまりは、ZOOMが公式に述べているように、どんな大きな音でも音割れは起きていないのです。
本ページで紹介している動画の配信者は、動画編集ソフトにBlackmagic DesignのDaVinci Resolveを使っています。
編集段階で、通過する電車の音が音割れを起こしていると考えたため、その部分をDaVinci Resolveでゲインを下げています。
私は、32bit floatを使って動画を撮ることがないため、DaVinci Resolveで音の調節をしたことがありません。私が音の調節に使うのは、iZotope のaudio editorであるRXです。今はその最新版であるRX 10 Standardを使っています。
私は自分の声や環境音を収録することがほとんどのため、小さな音を大きくするような使い方が主になります。小さく録れた音を大きくするにはゲインを上げればよいことになり、少し前までは、そのようにして音の調節をしていました。
しかし今は、Loudness Controlのプリセットを使い、「客観的」に音の調節をするようになりました。
このやり方が優れているのは、大きな音と小さな音が混在するような場合も、一定の音の大きさに揃えてくれ、なおかつ、最大の音を指定したレベル内に確実に押さえてくれることです。これであれば、ふいに大きな音が入るような場合も、音割れは起きないことになります。
そのような機能があることを知っていたため、本ページで埋め込んだ動画も、自動で音の大きさを揃えてくれるだろうと考え、実際に実験してみました。
やり方は原始的(?)で、その動画を再生させ、PCスピーカーから再生される音をM3 MicTrakで録音し、録音した音をRX 10 StandardのLoudness Controlで調整しただけです。
プリセットには、最も大きな音にできる”Video Streaming Delivery”を使っています。
このプリセットを使うと次のような設定になります。
- True peak[dB]: -1.0
- Integrated[LKFS]: -13.2
- Tolerance[LU]: 2.0
修正された波形をキャプチャして下に貼っておきます。
ご覧になっておわかりのように、音割れした思われた右の波形も、まったく音割れしていません。末端まで、波形が綺麗に再現されています。
しかも、左の電車の波形と、右の電車の波形の音のピークが揃っており、通常の電車の音と、通過する電車の大きな音を続けて聴いても、ボリュームで調節する必要がありません。
32bit floatを使って録音するのであれば、編集段階でもそれを最大限に活かしてこそだと考えます。
本当であれば、私がM3 MicTrakを持って駅へ行き、ホームから電車の音を収録してくればいいのでしょうが、たまたまそれに該当するような動画を見つけ、すぐに検証してみたかったため、このような検証になりました。
子供たちの夏休みも始まり、花火大会が各地で行われるでしょう。それをM3 MicTrakで収録し、的確に編集したらどんな仕上がりになるのか、機会があれば試してみたいです。
近くで打ち上げ花火が上がれば、それが夜空に開くときには大きな音がします。その音のピークも、音割れさせずに再現することができるでしょう。
しかも、続けて収録していれば、花火が打ち上げられるのを待つ周囲の人々のざわめきも同時に収録できるでしょう。
M3 MicTrakで収録し、RX 10 Standardで編集すれば、手間をかけずに、それが実現できるはずです。
大きな音と小さな音をどの程度まで混在させることができるかなど、今後、いろいろな条件で試してみることにしましょう。