自分の声を録音し、それがどのように聴こえるか、どのようにしたらより良い声に聴こえるか、といったことを「研究」することがまだ続いています。
これを最近はやりのいい方でいえば、「声録音・声修正の沼にはまっている」ということになりましょうか。
私は自分を流行から遠ざけたい習性があります。ですから、私がこんな表現を使うのは今回限りとなります。
私が今自分の声を録音するのに使っているのは、32bit float機能が搭載されたZOOMのF2とM3 MicTrakです。
前回の更新で使ったのはF2とそれに付属するラベリアマイク(ピンマイク)です。それで録音した自分の声を確認したため、今回はM3で自分の声を録音しています。
録音するためのテキストに使ったのは、前回更新した自分の文章です。それを冒頭部分だけ読み、M3で録音しました。
M3は、M/Sマイクを持つレコーダーです。このマイクは、収音する範囲が変更できるようになっています。自分の声を収録するのですから、モノラルにして使います。
マイクのショックマウントに自分でグリップをつけ、それを握り、口から20センチ程度離して自分の声を収録しました。
前回の更新で書いたように、PCスピーカーで録音した自分の声を聴くと、低音が強く出過ぎていたのは、スピーカーの音質調整が、低音が強く出るようにしてあったためでした。
わかってみれば、拍子抜けするほどの原因です。
前回は、自分の声をより忠実に残すため、収録した声のデータを修正することをできるだけ避けました。
私が音声の編集に使うのは、iZotopeのRX10 Standardです。
今回は逆に、RX 10の機能をいくつも使ってみました。
まずはじめに、32bit floatで収録した声はGainが小さすぎるため、Loudness Controlを使って、適正な音量に修正しました。使ったプリセットは、Podcast Deliveryです。
次は、Repair Assistantで、主に、唇や舌などから発せられるノイズを除去しました。続けて、同じようなノイズ処理をするMouth De-noiseも適用しました。
イコライザー(EQ)は使っていません。理由は、すぐあとに述べます。
RX 10に入れてあるプラグインのShadow Hills Mastaring Compressorを使い、音を圧縮することをしています。
このプラグインについて詳しく知るきっかけとなったのは、ネットの動画共有サイトのYouTubeで、さまざまな知識を披露してくれている作曲家の和田貴史氏の動画を見たことです。
和田氏はこのプラグインの実機を持っておられ、作品の制作に使われているそうです。
和田氏は、ご自身が同プラグインにセットしているデフォルト・セッティングを動画で披露されています。専門的なことがわからない私は、和田氏のセッティングをそのまま使わせてもらっています。
和田氏はShadow Hills Mastaring Compressorのセッティングを二度YouTubeに上げられていますが、二度目の動画の途中からは、興味深いことを話されています。
和田氏は、Shadow Hillsを使うと、音の波形がどのように変化するか、実際の波形を示して説明してくれています。
それを見て、このコンプによって、音のどの部分がどのように変化するかがわかります。
変化するのは、低音部分と高音のごく一部分です。
Shadow Hillsにはオプティカルコンプとディスクリートコンプの二種類が搭載されており、個別にも、ふたつ同時にも適用できます。
和田氏の説明で、オプティカルコンプを使うと、低音部と高音部の両サイドが削られ、他が平らな「かまぼこ型」になる傾向がより強まるということです。ですので、自分の声には、今のところ、オプティカルコンプは使わず、ディスクリートコンプのみを使っています。
波形を見てすぐ気がつくのは、オプティカルコンプをかけたときは、低音をカットする効果が、ディスクリートコンプよりも、大きいことです。
それに加え、Shadow Hillsでは、出力トランスとして次の三種類が用意されています。
NICKEL(ニッケル) | IRON(アイアン) | STEEL(スティール) |
それぞれを適用すれば、音の違いがわかります。NICKELにすると高音が、STEELは低音が感じられます。IRONは中間です。
そうなる理由は、和田氏が動画で示した音の波形を見ることで理解できます。STEEL ⇒ IRON ⇒ NICKELと切り替えるごとに、低音カットの範囲を大きくしているのです。
最近、本コーナーで、低音部をカットしすぎるのは良くない、というようなことを話す動画を紹介しました。
和田氏は、出力トランスはSTEELを基本的に使っていると話されています。私も、Shadow Hillsを使う場合は、このプラグインが理解できるまで、STEELを基本としましょう。
和田氏の説明で、Shadow Hillsでコンプをかけるのは、EQで低音をカットするのと同じ効果がありそうなことが想像できます。
このことがわかったことで、EQで同じように低音をカットしなくても良さそうに考えました。厳密にいえば、EQとコンプでは、効果の表れ方に違いがある、のかもしれませんが。
EQであれば、低音意外な部分の帯域を変えることができます。しかし、その部分を、素人の私が、理解しないまま操作して、音質を落とす恐れがあるうちは、触らないでおこう、と今のところはEQは使わずにいます。
このような工程を経て作った自分の声の音声ファイルを下に埋め込みます。
ここまで書いたこととは別に、自分の声を録音した音声ファイルの波形を見て気がついたことがあります。それは、各音節のはじめの部分あたりの波形が高いことが多い傾向が見られることです。
普段話しているときの声を録音すれば、このような波形にはならないかもしれません。今回は、自分が書いた文章を読み上げた音声ファイルです。
今回はそれに気をつけて文章を読み上げていますが、それでも、音節のはじめの部分辺りの波形が高い傾向が見られます。
これが私だけの特徴なのかもしれませんが、文章を読み上げようとすると、それぞれの出だしの部分をほかの部分より力を込めて発音してしまっているのでしょうか?
テレビでニュース原稿を読み上げるアナウンサーは、そのような発声にならないよう訓練を受けるのかもしれません。
今後は、自分で自分を訓練し、もっとスムーズな発声に持って行けたらと考えます。
各音節の波形をほかの部分と同じ程度に抑えることができれば、Loudnessをコントロールする処理をかけた場合も、一部分が突出することが減るため、全体の波形が今よりも大きくなり、全体の声の大きさが大きくなる可能性があります。
発声方法も含め、声を巡ることについては興味が尽きません。