動画音声

前から書こうと思ってた題材だったのでリブログさせていただきます。

YouTube(だけに限りませんが)に動画、特に音楽方面に特化した動画を上げるとき音量＆音質問題ってのが出てきますよね。

まぁ色んなとこで解説してるので掻い摘んで、ここでは音声に焦点を当てて説明しますがまず、

YouTubeでは音声のピークレベルを-1dbに設定してるので、それより上の情報は一律カットされてしまいます。

ピークレベルが-0.2dbのとある曲ですが、コレだと

赤線より外側、薄緑の部分ですね、ここがバッサリ削られてしまいます。

(レベルを下げるとかじゃないです、カットされます)

(レベルについては、後の方で書きます)

ほりほりさんの動画の元の音声情報は判らないので何とも言えませんが、もし普通にピークを0dbで作成してたとしたら、削られているので「音が丸くなる」現象の最大の要因かもしれません。

なので、音質の変化を最小限に留めるならまず音声のピークレベルを-1dbにしておく。

こういう感じですね。

これだと、少なくともピークレベルで情報が削られることは無いです。

更に、YouTubeに動画を上げると

元の動画がどういうモノであれYouTubeの仕様に(再)エンコードされてしまいます。

これは音声がwavだろうがPCMだろうがmp3だろうがaac(m4a)だろうがoggだろうが関係ありません。

(今は一律)opusという圧縮形式にエンコードされます。

（追記：推測ですが、-1dbピークカットは多分このエンコード時に行われてるのだと思います。それが設定してそうしてるのかopus形式の仕様なのかは判りませんが）

元が無圧縮(wavやPCM)の音声ならopusにエンコされるのはそこまで気にするものでもありませんが、圧縮音源(を使った)動画だとこれは圧縮されたものをまた圧縮し直すようなものです。

opusという圧縮形式は比較的新し目の形式でmp3やaacに比べると圧縮率や音質も上がってるらしいですが、それでも圧縮してることに変わりはないわけで。

で、大概の人は映像も音声も圧縮された形式(mp4等)で動画をあげますよね。

無圧縮もしくは可逆圧縮(無圧縮に戻せる)音声の動画も作れないわけではありませんが、余り一般的ではないし容量もデカくなる。

この辺を、多少年齢層高めの方(俺も含め、だ。怒らんといてよｗ)に判りやすいように説明しますと、

・圧縮音源

　 →CDをカセットに録音したようなもの

・圧縮のビットレート(128kbpsとか256とか512とか)

　 →ビデオの5倍とか3倍とか標準みたいなもの

・圧縮形式の違い

　 →VHSとベータもしくはカセットの種類(ノーマル、クロム、メタル)みたいなもの

(音声と映像の両方で例えてしまってすまない)

と言った感じです。

この例えで言うとアップロードした圧縮動画をYouTubeで再エンコされるというのは、

(CDとかから)ダビングしたノーマルテープのカセットをクロムのテープにダビングしてるようなものです。

もしくは、3倍で録画したVHSを2倍のS-VHSにダビングしてるようなものです。

元よりはいいテープだけど、元の音が良くなるわけではない。

しかもダビングしてる時点で劣化はしてる。

これも、当たり前ですが音質劣化の一因ですよね。

(ピーク云々は「変化」、エンコは「劣化」とも言えますかね)

なので、上げる動画の音声は圧縮ながらにもビットレートは高ければ高いほど良いです（512kbpsとか）。

ま、自分は動画編集はAVIutiなのでaacのビットレートは320までしか上げられないんですけどねｗ

更に言うなら、編集前の音声(つまりは動画編集する際の「素材」としての録音物)は出来る限り無圧縮（wav）であるほうが望ましいです。

録音ソフトとかよっては録音後に自動でmp3やm4a(aac)等の圧縮音源に変換される場合がありますが(これがデフォの場合も多い)、ソフト(今どきはアプリ、か)の設定で「無(非)圧縮で保存」みたいのがある場合はそちらにしときましょう。

いきなり録音物のファイル容量が10倍くらいになってビックリするかもしれませんけどｗ

それと、これは音質云々には直接の関係はあまりないんですが根本的な音量問題として、

YouTubeでは最大(再生)音量の値が決められています。

まぁこれはつべに限らずストリーミング系のあちこちでやってることなんですが。

その基準値を超えてると、つべの方で音量を下げられてしまいます。

（追記：これはおそらく動画のエンコード後―つまりはピークカット後―に測定されてると思います）

コレを知るには、

動画上で右クリックするとこういう画面が出るので、一番下の「詳細統計情報」を更にクリックします。

（あくまでPCというかブラウザからのやり方でスマホというかつべアプリでの見方は判らないです、すいません）

すると、動画左上に

こういう画面が出てきます（上と違う動画ですいませんｗ）。

で、ここからホリホリさんの動画をキャプらせてもらいますけど、

コレの、

赤く囲んだ部分、コレが音量の情報なんですが、

「100% / 56% (何チャラ5.0db)」とありますね。

（因みにその下の「Codecs」というのが圧縮方式で、左：映像/右：音声です）

この「100%」というのは、

つべのプレイヤーの音量調整の値です。

なので音量を下げればそこの値は下がります。

その横の「56%」というのが、プレイヤーの音量100%のときに実際に聞こえてる音量です。

つまり、プレイヤーで最大にしてもつべの方で勝手に元の動画の音量の56%に調整されてしまう、ということですね。

（なので、当然プレイヤーの音量を下げれば比例して元の音量も下がります。100/56%だと50/28%、みたいにね）

具体的に言うとその横の「何チャラ5.0db」というのが、

「この動画の音声はうちとこの基準(最大)値より5dbデカいっす」

という意味です。

（因みに、この数値がマイナスの動画もあってそれは「基準値以下」という意味なんですが、低いからと言って音量が上げられることはありません。その場合の実音量は100%までです）

なので、むやみに音圧を上げてもつべの方で勝手に音量下げられてしまってこっちの意図した音像にならないということもあるので、動画を作る場合はその辺も考慮する必要はありますね。

ただまぁ、これって基本的に動画内の音声の平均的音量で決めてるようなので極端な話、ラウドな音でも無音や音量小さめな部分が多いとそんなに下げられることもない、こともあります。

で、

Loudness PenaltyFind out if your music will be turned down by YouTube, Spotify, TIDAL, Apple Sound Check and more. Discover your music's Loudness Penalty score, for free.

www.loudnesspenalty.com

こういうサイトがあります。

サイトに音声ファイル（mp3もしくはwav）をドラッグ&ドロップすると、ファイルを解析して色んなストリーミングサイトでの基準値に対してどんなもんなのか、教えてくれます。

試しに、

この曲（のwavファイル）でやってみますと、

ピークは-1.0db、平均音量は-16.53db。

これを上のサイトに放り込むと、

左上、つべに対して「-0.4」と出てますね。

つまり、つべの基準値より0.4db大きいということです。

じゃあ実際動画ではどうなんだと言うと、

0.3db大きいとなってます。

実際と計測で多少の誤差はあるようですが（音声のみと動画の違いもあるのかも。動画だと編集の関係で前後にちょっと無音部分があるとか）、他の音声で試してみてもほぼほぼ同じなので信用は出来ます。

因みに、基準値以下の音量だと

このように数値は出ません。

大体-16.7～8dbくらいが基準値ですかねぇ。

「Youlean Loudness Meter 2」みたいなフリーのDAW用VSTプラグイン測定ソフトなんかもありますしSoundEngineなんかは自動解析もしてくれますけど、とりあえずミックスした曲の音量をこのサイトで確認するのは手っ取り早くていいと思います。

ただまぁ、音量下げられてしまうのは不本意だからと言って自分の意図しない音圧や音量に調整するのもそれはそれで不本意なところでもあるので、その辺はどう妥協するかですよね。

自分は最近は-1～1.5dbくらいならまぁ良いかな、て感じで音圧や音量は調整してますね(あくまで最大音量を調整されてるだけで音そのものをイジられてるわけではないので)

。

・できるだけ高ビットレート

・ピークレベルは-1db

・平均音量は-16.７～8db

とりあえずこの辺を抑えておくと、元の音声からはあまりイジられないで済むようです。

Do or Do not, There is no try.

ギターや音楽(含むDTM)絡みが多いかな

動画音声