私は今、毎日夕方頃になると、あることをします。それは、文章を朗読することです。といって、その朗読は、自分だけが聴こえるような小声です。
どうしてそんなことをするのかといいますと、ZOOMのフィールドレコーダー、F2に、32bit floartで録音し、翌日に、録音した自分の声を、iZotopeのRX 9 Standard(RX 9)で、どのくらい聴きやすい声にできるか実験するためです。
今、朗読のための文章として使っているのは、『江戸川乱歩 電子全集19 随筆・評論第4集 Kindle版』です。江戸川乱歩(1894~1965)のこの全集は第5集まで持っていますが、それぞれの分量が非常に多く、今第4集を読んでいる途中です。
何を朗読に使ってもよかったのですが、乱歩の全集を読みながら、朗読のためのテキストに使っているというわけです。
それにしても、F2というレコーダーは今月はじめから使い出したばかりですが、32bit floatの録音というのは、画期的な技術だと感じています。
レコーダーは小さなマッチ箱ぐらいの大きさで、重さは、電池を除けば32gです。これに、ついてきたラべリアマイク(ピンマイク)を胸元につけ、普通にしゃべるよりも小さな声で朗読をします。

通常のレコーダーであれば、録音レベルが小さすぎるでしょう。音声編集ソフトで、ゲインを上げて声を大きくすることはできます。しかし、16bitや24bitで録音したファイルの場合は、音が劣化するそうです。
それが、32bit floatで録音したファイルであれば、ゲインを上げても、劣化が起こらないとされています。
F2で録音したファイルの編集に私が使うソフトは、iZotopeのRX 9です。このソフトで、自分の声を録音できることに気がつき、喜んだことは本コーナーですでに書きました。
初めて、RX 9で自分の声を録音してみたとき、録音しながら、私は半信半疑でした。というのも、通常の録音ソフトであれば、必ずあるものが、これにはないからです。
RX 9にないのは、録音時の録音レベルメーターです。
通常は、そのメーターで確認して、適量な入力レベルになるよう調節します。
音の適正な入力レベルについては、専門家でも意見が分かれるのかもしれません。
iZotopeの公式YouTubeチャンネルで、同社の音声ソフトの解説動画を見ることが増えました。
そのチャンネルにある次の動画では、YouTubeに上げる動画でナレーションを録音するときは、-14dBぐらいにするとよい、と話されています。テレビの場合は、-24dBにするのが一般的とも話しています。
人によっては、もっと大きな音で録音した方が良いといいます。私が参考にさせてもらっている音の専門家の桜風凉(はるかぜ・すずし)氏(1965~)も、テレビの仕事のときは-12dB、YouTubeは、-6dBにした方が良いと動画で話されています。
私は最近になって、それまでマイク録音のときだけ使っていたオーディオインターフェースを、PCを駆動するときは常に使うようになったことは本コーナーで書きました。
オーディオインターフェースを常に使うようになって、PCから発せられる音のレベルの考え方が変わりました。
オーディオインターフェースを使えば、インターフェースについているアウトプットボリュームで、音の大きさは自由に変えられます。調節の幅は、それまでのPCにだけ頼っていたときよりも飛躍的に広くなりました。
仮に、PCの音が小さい場合も、いくらでも大きな音にできます。
このように環境が変ったことで、私には、小さすぎる音がなくなりました。逆のいい方をすれば、小さすぎる音になってしまうことを避け、YouTubeの動画の音を大きめに録っておく必要を感じなくなりました。
動画の音声を適量な音量で録音しておき、あとは、聴き手の側で適量のボリュームにして音を聴いてもらえばよい、という考え方です。
もっともこの考え方が、すべてのユーザーに有効である保証はありません。
大多数の人は、音がつくネットコンテンツを楽しむのに、オーディオインターフェースを使ってはいないでしょう。スマートフォン(スマホ)やタブレットPCであれば、わざわざオーディオインターフェースを間に入れることは考えられません。
そういうユーザーには、音を大きめに収録しておいた方が親切なのかもしれません。
このあたりは悩みどころですが、iZotopeの専門家が、YouTube動画のナレーションは-14dBぐらいにするのが良いと話されていることを知り、それに従うのが良いと考えるようになりました。
32bit floatで録音するときは、適正な音量はあるものの、シビアに決める必要がない、というように、それまでの常識が通用しなくなります。それだから、この技術で録音するフィールドレコーダーのF2は、録音ボタンだけがついており、入力レベルは調整できないようになっています。
これと同じ技術の録音技術が、iZotopeのRX 9に搭載されているので、録音レベルのメーターがなくても別に困らないことになります。使ってみるまでそのことに気がつかなかった私は、「メーターもないけれど、本当に自分の声が録れているのだろうか」と不安に感じたのでした。
狐につままれたような感覚で、録音できたかもしれない、自分の声が入っているかもしれないファイルを開きました。
入力レベルの波形は小さく、はじめは無音のように見えました。しかし、ゲインを上げるNormalizeをかけると、通常の音量で自分の声が聴こえ、はじめは驚きました。
RX 9でその処理をするときは、音のピークをどの程度にするか、ターゲットのレベルを決めてNormalizeがかけられます。RX 9では、-20dBが最も小さなターゲットレベルです。32bit floatの場合、処理しても音が劣化することはないそうですので、レベルを変えて、自分が望むレベルへ持っていけます。
昨日の夕方に朗読して音声ファイルにしたものを下に埋め込んでおきます。これは、32bit float録音と、録音後にiZotope RX 9で処理した結果を確かめるために行っています。乱歩の著作が、まだ著作権の権利が有効かどうかはわりません。
朗読のテキストに使ったのは、乱歩が少年たち向けに書いた文章でしょう。子供たちにも読みやすいよに、平仮名を多く使って書いています。
「この物語について(『黄金虫』)」(昭和28年9月25日 『世界名作全集(59)』)の一部で、乱歩が筆名の基にしたエドガー・アラン・ポー(1809~1849)の短編小説『黄金虫』(1843)を取り上げ、ポーの偉大さについて、子供たちにもそれがわかるように書いています。
張った声を出さず、普通に会話するときや、独り言をいうときの声が、そのまま朗読にも使えてしまう32bit floatは、そういう声質を持つ私には、願ったり適ったりで、最高の技術に思えます。
声を張らずにしゃべるときに、その人の本質が声に現れるように、私は考えます。