皆さん、お久しぶりでございます♪
ここ最近クロロは、昼も夜も分からないほどのカオスな生活習慣の中で、
百数十時間以上をかけて新たなマスタリングの手法を研究していまして、
いかなるミックスからでも完璧に近い仕上がりの音源を生み出すため、
そしてそれが大切な人の未来へとつながるよう、ただそれだけのために、
いつもどおり身を粉にして、いい音を生み出すために頑張っています。
たった数十秒の結果を出すために何時間も費やし、トンネルを抜けるたびに、
努力って本当に報われるんだということを思い出させてもらっています。
さて現在の課題は、可能な限りのハイレゾでマスタリングを完了した音源を
ダウンサンプリングする場合、ナイキスト周波数の境界における折り返し
ノイズの発生を防ぐためのローパス・フィルターをどのように設定すべきか、
という内容だったのですが、非圧縮のPCM音源だけを比較していても答えを
出すことができず、むしろ境界よりも若干下で、余裕をもって削ったほうが
高域成分が減少し、S/N比が向上したかのように聴こえていました。
さらに圧縮音源にまとめる場合は、限られたビットレートの範囲内で人間の
耳に対して有意義な情報を可能な限り保持したほうが音質が高くなると考え
るのが一般人の思考回路なので、僕も同じくほとんど聴こえない高周波成分
はあらかじめ積極的にカットして同じデータ量に圧縮したほうが、結果として
高音質な圧縮音源に仕上がるのではないかと推測していたわけであります。
が、しかし iTunes で配信標準の 256kbps のAACに圧縮してみる
と、誰が聴いても一目瞭然に判別できる真逆の結果が出たのでした。
上は 44.1kHz のサンプリング周波数に収録可能なギリギリの上限で高域を
カットした2つの波形ですが、皆さんは A と B のどちらが、AAC や MP3
などの圧縮音源に変換された場合に、より音質が高くなると思いますか
答えは A です。 それも、圧倒的大差での勝利。
スペクトルだけを比較すると、A は高域成分の上端が人工的にバッサリと切り
落とされているため、直感で B のほうが人間の耳には自然に聴こえるような
気がしますよね。 しかしです。 これはあくまでデジタル・データ上の波形。
つまり、1秒間の波を44100個に分割して、それぞれの値を全て 0 と 1 の
2進数に置き換えて記録しているに過ぎないわけです。 よって、実際に
スピーカーから再生されるアナログの状態の音とは波形が異なります。
コンピューターの画面上では2万ヘルツちょっと上までしか音が存在しない
かのように見えますが、人間の耳に聴こえるアナログの音波というのは、
再生された音の成分が基音となって、その倍数のピークが理論上は無限に
伸びていって自然音の倍音成分が形成されるため、データ上で一見すると
不自然なフィルタリングが行われているからといって、最終的な再生音が
不自然になるとは決して断定できないということです。 そしてさらに!
これは僕自身もビックリした点ですが、圧縮音源の限られた帯域における
可聴成分の含有率を上げるために、わざとフィルターを低く設定した場合
(B) よりも、非圧縮音源の折り返しノイズ発生限界ギリギリの境界で、
断崖絶壁の人工的フィルタリングを行った場合 (A) のほうが、非可逆圧縮
された際の原音に対する忠実度が飛躍的に向上するという、衝撃的な研究
結果を手に入れることができました。 この理由として考えられる要因は、
圧縮音源だからと言ってナイキスト周波数の上限が低下するわけではなく、
圧縮のためのアルゴリズムが等ラウドネス曲線に基づいてプログラムされて
いるが故に、ビットレートを下げるほど高域の再現性が犠牲になるからです。
しかも優先的に削られる周波数成分というのは音圧が低い部分であるという
ことが圧縮の原理から明らかになっており、 「どうせ圧縮されたら高域が
削られるんだから前もって削っておいてあげよう♪」 という安易な考え方で
見かけ上は自然なフィルタリングを行ってしまうと、見かけ上は不自然な
フィルターを施した音源よりも帯域全体の再現性に乏しい圧縮音源として
仕上がってしまうという、極めて悲惨な結末を呼ぶことが分かりました。笑
というわけでございまして、何事も積み重ねが大事だということですね。
どんな新芽も、最初は大樹の陰で芽吹くわけですよね。
どんなミュージシャンもエンジニアも、たった数分間の楽曲に百何十時間も
かけて、産みの苦しみを乗り越えながら、命を削りながら、やっとの思いで
世に送り出しているということが、自分でレコーディングやマスタリングを
やってみるとよく分かりますので、皆さんも機会があればぜひ♪