オーディオの量子化と基準レベルの話 | 音響・映像・電気設備が好き

音響・映像・電気設備が好き

「ヒゲドライバー」「suguruka」というピコピコ・ミュージシャンが好きです。

先日、JAPRSが0VU = -16dBFSから0VU = -18dBFSへ変更を行うと発表がありました。

 

引用


(一社)日本音楽スタジオ協会(以下JAPRS)では、デジタルマルチトラックレコーダーが登場した当時の状況から「0VU=-16dBFS」を長く推奨値として来ましたが、現在のハイレゾリューション化やデジタルベースでの信号処理等の状況も踏まえて検討を進めた結果、「0VU=-18dBFS」を基本な推奨値として改定することといたしました。(2024 年4 月1 日からの運用)
ただし、業務対応(アーカイブやポストプロダクション等)により推奨されたリファレンスレベルの採用が難しい場合は「0VU=-16 or -20dBFS」も可としますが、JAPRS加盟スタジオにおいて採用しているリファレンスレベルを利用者に分かるように必ず明記することとします。(「0VU=-16dBFS」を継続採用するスタジオも同様)

以上、JAPRSにおけるリファレンスレベル改定についてご理解の程よろしくお願い申し上げます。

(一社)日本音楽スタジオ協会 事務局

 

引用おわり

※なぜか0(ゼロ)がO(オー)です

 

 

JAPRSの公式リンク:

 

 

今更VU基準なの!?はさておき、-20dBFSではなく-18dBFSをなぜ選択したのか・・・そもそもなんでー18dBFSなんだと疑問に感じたのでオーディオの量子化と基準レベルについて調べてみました。

※0VUは基準値、くらいの意味合いでしか現在は無い

 

特にオチが無い話ですので本記事のまとめを先に書いておきます。

  1. -18dBFSは符号化の際に2進数できりが良いところを選んでおり実際はー18.063・・・dBFS(とはいえ実務上-18dBFSで良い)
  2. EBU Technical Recommendation R68-2000規格の-18dBFS、SMPTE RP 155-2014 Reference Level for Digital Audio Systemsの-20dBFSと2派閥に分かれる歴史がある
  3. 2の補数を理解しよう。分からない人向けに説明パッチ作りました

 

筆者は映像制作出身です。ですが、ラウドネス運用が本格化する前に転職をしている為、デジタルオーディオにおける基準レベルはー20dBFSが根付いています。当時、-18dBFSを採用しているのは日本の放送局ではNHKのみで映像機器は音声基準レベルを-20dBFSまたは-18dBFSの切り替えが可能でした。(今、どうしているんだろう?)

後述しますが、注意しなければならないのは「放送においての音声基準レベル」と「デジタルオーディオの基準レベル」はかつては同じであったが、2011年を期に分岐していることです。ここでは「デジタルオーディオの基準レベル」を取り上げますのでラウドネス運用とは切り離して考えてください。また、デジタルオーディオの基準レベルとラウドネスレベルの区別が付かない場合は、技術的に未熟であると認識しましょう。

 

 

Blog内リンク:かなり前の記事です

 

 

BTSの調査の話

 

 

 

まず最初にJAPRSがー18dBFSを採用したとの事で、NHKがー18dBFSを採用した理由が書かれている一次資料、NHK放送技術規格 BTS 6021(1990) ディジタル音声信号基準量子化値を参照します。

こちらは提供があった分のBTSで、感謝御礼申し上げます。これは参照しようにもどこにも情報がありませんのでここで掲載します。

 

 

 

 

 

引用

 

 解説

1.本規格の制定について

放送衛星によるテレビ放送の音声は、PCM伝送方式が採用され、また、スタジオ用機器もテープ録音機をはじめ、音声機器のディジタル化が進められている。

番組の伝送や交換を実施するうえでも、これらディジタル機器の入力信号と量子化値との関係(アナログ機器の変調度にあたる)を明確にする必要がある。

そして、放送衛星の受信機器や一般民生用のディジタル音響機器の設計に対しても、アナログ音声レベルと量子化値との関係を明示する必要があり、本規格を制定することとした。

 

2.基準量子化値について

ディジタル音声機器はピークレベルにより最大量子化値を超えた場合、アナログ・機器のオーバーレベルと比べ著しくひずみが生じ、音質が劣化する性質がある。したがって、入力レベルの設定は非常に重要となる。

レベル設定の方法として、ダイナミックレンジを重点に全ビットを有効に使う考え方もあるが、放送のように多くの番組を切り替えて扱う場合、番組によって音声レベルが変化しないことが重要であり、現行放送との互換性を保つ必要がある。

以上の点を考慮し、現行のアナログ信号の基準レベルに対応した基準量子化値を定めた。

 

3.量子化値の表現について

ディジタル信号の表現方法として、16進数による表し方も一般化しているが、衛星放送のように16ビットと14ビットの2方式がある場合、値が16ビットと14ビットでは異なる値となり、混乱をまねく恐れがあるため、2進数での表現形態とした。

 

 

 

原案作成協力者(昭和58年10月)
総合技術研究所音響研究部(部次長) 竹ケ原俊幸 

 

 

BTSを参照すると下記の事が分かります。

 

正の最大 = 01111・・・11
負の最大 = 10000・・・01
正の最大からおよそー9dB = 00001・・・11
負の最大からおよそー9dB = 11110・・・01

MSB = Most Significant Bit(一番左の最上位ビット)
LSB = Least Significant Bit(一番右の最下位ビット)
正の値はMSBが0、負の値はMSBが1。

 

-18dBFSは「-18.00dBFS」ではなく、ビット表記の都合の良いところを基準レベルとしている、との事です。

※正確にはー18.063・・・dBFSですが厳守せよって話ではない

 

ふーん・・・これ、2の補数を理解しないと先に進めなくない?と気が付き、2の補数をネットで調べてみました。要約すると2進数でマイナスまで表現を行う為、2進数のビット反転を行った物が1の補数、そこから1を足したものが2の補数との事です。

自分が理解しても人に伝えられないと意味が無いのでCycling'74 Max8で解説パッチを作ってみました。

 

 

dBFS解説パッチ※exe化してありWindows専用です

 

 

 

実際の動作。このような説明資料が実際に触れる状態で広く配布できるのはMaxの強み

 

 

正の最大値は2進数で011111111111、16進数で7FFF

 

 

負の最大値は2進数で1000000000000001、16進数で8001

 

 

正の基準レベルは2進数で0000111111111111、16進数で0FFF

 

 

負の基準レベルは2進数で1111000000000001、16進数でF001

 

 

2の補数もMaxがあればぱっと理解できる。最高のツール!(こんなに高度な計算機を使ってこんなに原始的な計算をさせている背徳感!!)

※パッチを開き「esc」を押すと上記の部分が表示されます

 

 

おまけ

4bitでの2の補数のケース

0000 基準

0001 ・・・1

0010 ・・・2

0011 ・・・3

 

0001のビット反転を行うと1000(10進数で8)、これが1の補数。これに1を足すと1001でこれが2の補数となる。これは10進数で-7。筆者は付け焼刃なので折り返し点が理解できていないのですが2進数にした時、正の値はMSBが0、負の値はMSBが1はルールの為判別が可能。

 

こちらが大変参考になりました。

 

天野、近藤研のページ

https://www.am.ics.keio.ac.jp/chuo/number.pdf

 

 

BTSで2進数表現は16bit、14bitの両方に通じる・・・とあるのは2進数では間の循環部分の桁が増えるだけなので分かりやすい、との事らしい。

 

 

wavデータ(非圧縮・リニアPCM)であればビットストリームはバイナリエディタで確認が出来る

 

 

RME DigiCheckでもビットストリームは監視できる※但しプレイバック(送出側)は監視できない

 

 

そうか、そうか・・・MSBを除く上位3ビットが000、以下111・・・が正の基準レベルで、MSBを除く上位3ビットが111、以下000・・・でLSBは1が負の基準レベルか・・・・。あれ?負の値ひとつ少なくない???16bitは0-65535の分解能があり、2の補数の場合は+32767(7FFF)、ー32768(8000)が表示領域のはず・・・ー32767(8001)は1手前・・・。でもこれBTSだし間違いって事はないだろうな・・・と別の規格も参照する事にしました。

 

 

SMPTE RP 155-2014 Reference Level for Digital Audio Systems

今回の為に購入した

 

 

デジタルオーディオの量子化と基準レベルの比較

 

 

他規格とBTSを比較してみると、負の最大値こそ8000で正から見て1の補数(※恐らくはこれが正解)であるのに対し、基準レベルは1の補数のケースと2の補数のケースに分かれました。所詮最下位ビットの1の差であり、ADする時点で無視できるどうでもよい些細な話ではあるのですが、起点0から見て正負が等距離になる為には負は正の2の補数である必要があります。※そのままだと負の方が正に比べ LSB = Least Significant Bit(一番右の最下位ビット)が1大きい

 

本末転倒なのですがここまで調べると、デジタルオーディオの量子化における基準レベルはEBU Technical Recommendation R68-2000規格の-18dBFSSMPTE RP 155-2014 Reference Level for Digital Audio Systemsの-20dBFSと分かれ、ITU-R BS.1726(2005) Signal level of digital audio accompanying television in international programme exchangeではこのSMPTEかEBUのどちらを選択しているのか示せ、とされている事が分かりました。

 

 

ITU-R BS.1726(2005) Signal level of digital audio accompanying television in international programme exchange

SMPTE -20dBFSなのかEBU ー18dBFSなのか?

 

 

但し、気を付けなければならないのが「放送においての音声基準レベル」の話なのか「デジタルオーディオの基準レベル」の話なのか見極めが必要と言う事です。

※オーディオ機器の性能を確認する際にはラウドネスではなく旧来の基準レベルが使用されます。

 

いつも通り調べると色々な事が気になり、ついつい寄り道をしてしまいます・・・冒頭にまとめた3項目が本記事の要約ですのでこれが伝われば幸いです。

 

 

参考文献:

・NHK放送技術規格 BTS 6021(1990) ディジタル音声信号基準量子化値
・EBU Technical Recommendation R68-2000
Alignment level in digital audio production equipment and in digital audio recorders
・SMPTE RP 155-2014 Reference Level for Digital Audio Systems
・ITU-R BS.1726(2005) Signal level of digital audio accompanying television in international programme exchange
・ARIB TR-B32(2011) デジタルテレビ放送番組におけるラウドネス運用規定

※デジタルオーディオの基準レベルは、放送においては2011年以降ラウドネス運用に変わっている為、「テレビ放送における音声基準レベル」の話なのか、「録音系の音声基準レベル」の話なのか見極める必要がある。上記の規格でも一部混在している。