現在はスマホでも動画が撮れますが、ステレオ録音非対応の製品が多いので、動画を撮影すると、音声はモノラルになる製品が多く孫座強います。古い製品は大抵モノラルなので、デジカメの動画よりも音の状態が厳しくなる場合があります。その為、DSLR撮影も含めて、音声の取り扱いを考える必要があります。

 

 

■ 動画の音声                     

 

  iPhoneだと内臓マイクに限りすrテレオ録音ができる様になりましたが、こういう端末は殆どありません。その為、音声については外部で録音する必要が出てきます。この内容ですが、EOSムービーもモノラルなので、ステレオ録音にする場合には外部でお政記録をする必要があります。

 

 個人で撮影する場合、PA製品とカメラと言うのは少し難しいかもしれないので、軽装で考えると、ポータブル製品+マイク+カメラと言う形になります。この時に音をどう録音するのか?で状況が変わるのですが、アンビエントが必要なのか、主題となる音が必要なのかで使用する指向性が異なります。例えば、アンビエントだと無指向性になりますし、主題がはっきりしている場合だと、単一指向性ですが、周囲の音が必要ない場合だと、ショットガンマイクのような指向性の角度が居ky単に狭く前方の周囲の音をほとんど拾わないマイクを使用することになります。

 

 PCMレコーダーのマイクだとX/Yのものがありますが、コレはテレオなので指向性を単一指向性の設定が可能で、この時の角度を変化させることで、ショットガンマイクのような直線的な前方の音とある程度幅を持った空間の音を収録するような状態にできます。

 

 あと、バイノーラルマイクは双指向性の特性があるので、左右で音をとらえています。つまり、これも形状を見てもらうとお気づきかと思いますが、ステレオペアのマイクの組み合わせで、ステレオベースが頭の幅(耳の穴の位置)になっています。

 

 つまり、ステレオ録音の場合だとそう言った選択がありますが、主題の声をモノラルで捉える場合だと、マイクは単一指向性で角度が狭く、その音をピンポイントで拾うモノラルの製品を用いることになります。と言うのも、【 余計な音を拾いたくないのだからその音をピンポイントで拾えばいい 】からです。

 

 とは言っても、無指向性のピンマイクもステレオ製品がありますし、ショットガンマイクについてもMS方式のステレオの物が存在していますから、何を使うかは黙出来で変わってくるのですが、現在は、

 

 ■ カメラ

 ■ PCMレコーダー

 

と言う組み合わせが、映像と音声を持ち帰る場合の選択肢になります。これに用途によってライトが必要になるわけですが、音に関してはこれにマイクが加わるような状態になります。

 

 

■ 動画の音の問題                  

 

 カメラの場合、FDR X3000のようにアクションカムなのに音の調整が良くてそのままでも音がそこそこ影響がないような音になっていますが、音質というのはカメラによって結構違いがあります。

 

 ただし、記録方式がRAWデータお送りシー形式なのでAAC-LEやAC-3などですから、それ度補高音質な物ではありません。そうした事を踏まえると、PCMの高音質ソースで記録して、それに差し替えたほうが音が良くなるのは確かです。

 

 業務用カメラではカメラに接続されたマイクで音声を拾っていますが、そう言った製品の音質は、24bit/96KHzなので、基本的にコンシューマのカメラの映像ソースに包含される音質とは全く異なります。これは、GH5やGH5Sに外部オプションでXLR接続のできる製品を接続して、マイクを追加した場合の音質ですし、こうした撮影が内部記録でそのまま可能な製品だと、BlackMagicDesign Pocket CinemaCamera 4Kなどのようなシネマカメラになります。

 

 その為、カメラにマイクを刺して録音すればよくなるというのは内臓マイクよりはゲインが高くなるので利点があるのは確かですが、音質については記録コーディックの品質で固定されるので、マイクの変化で過度な変化が発生する訳ではありませんから、同じ機材構成でも記録コーディックが違う場合には音質が違いますし、マイクを変えた程度では、低品質記録の物まで高音質記録時のソースと同じ品質になるような物ではありません。その為、【 何で記録するのか? 】で状態が変わってきます。

 

 音声については、デジカメでも内臓マイクdステレオ録音になっていますが、PCMレコーダーを用いた場合ステレオ録音が可能になります。その為、そうした記録を行わなければ、ステレオ録音ができない場合があります。

 

 先日、

 

■ つぶやき

 

でも触れましたが、現在のPCMレコーダーは、24bit/96KHzなので、CDDAよりも上の音質になります。その為、高音質での記録が行えるため、ステレオで録音してもより高音質な選択が可能になります。

 

 さらに、上位製品では、24bit/192KHz記録の物もありますから、そうした製品だとステレオベースが狭く固定されているという問題はありますが、音質面はでは、ガジェットやカメラの内臓マイクとロッシーなコーディックでの記録よりも高音質になります。

 

 

■ カメラの内臓機能                 

 

 現在のカメラですが、音については、色々な機能が実装されています。例えば、エントリー製品でも、

 

 ■ 風切り音軽減

 ■ ズームマイク機能

 

が実装されている製品が増えています。と言っても、内臓マイクは穴が開いているので、ここから音を得ているのですが、ウインドジャマーのような物を実装できるわけではないので、モフモフとしたのを貼り付けないとダメですから、外部マイクが使えない製品だと見た目が結構怪しくなります。そう考えると、PCMレコーダーで別録りをして、それを同期するとPCMレコーダー側にウインドジャマーを装着できるので、カメラ側に何かを装着する必要がありません。その為、外部マイク非対応の製品だとそうした機材を使うことになります。

 

 内臓機能では、レベル調整と風切り音の軽減とズームマイク機能辺りが実装されていますが、ボディー実装マイクしか使えない製品だと、本来の風切り効果を外部で行うことができないので、やはり音は拾ってしまいます。そうした点を踏まえると、製品によって音の拾い方が違ってきます。そう言った機能があるカメラを使用する場合、広範囲の音を持ち帰る場合だと、ズームマイクはオフで風切り音軽減はオンにして使用し、ズームで主題となる物の音だけを拾いたい場合には、ズームマイク機能と風切り音軽減の双方を用いることになります。

 

 その上で、音量レベルを見て適正な状態にして撮影をするとレベルが低すぎて編集時に持ち上げたらヒスノイズまみれになったり、逆に大きすぎて復旧不能になってしまう事もなくなります。

 

■ 音の種類                      

 

 音と言うのは複数存在しますが、映像の中で使用する音は何かで用意する音が違ってきます。例えば、その映像の主題が人物でその人のセリフだとすれば、これはその音をメインで録音する必要があります。そうなると、これは無指向性マイクで近距離の音のみを披露ピンパイクで録音するか、高い位置からマイクブームで高さを稼いだ状態で配置したショットガンマイクを向けてその人の声を録音すると言う事になります。

 

 では、これに寛容音を入れる場合はどうでしょうか?この時に音の主題がどこにあるかで変わってくるはずです。例えば、前面の風景が綺麗でそれをバックに人は立っていて、その音も含めて声が入るという条件だと、この場合、アンビエントは後ろ側の音は印象から除去してもよさそうな気がしますから、ステレオペアのマイクを前に向けてある程度ステレオベースを用意して広く録音するという方法になりそうな気がします。この条件は、野鳥と自然の風景とかでも共通していそうな内容ですね。

 

 では風景が主体だとどうでしょうか?風景の場合、主題が前面にあるはずですから、そう考えると、前側の音は必要で、後ろの音は雑音になるかもしれません。と言うよりも、マイクを前に向けると必然的に単一指向性のマイクだと後ろ側の音は小さくなる傾向がありますから、双指向性のマイクのような音の入り方にはなりません。そうなると、後ろ側の音は目立たない状態でいいので、カメラと同じように前に向いていればいいと言う事になります。

 

 では、これが繁華街で雑踏だとどうでしょうか?この場合、前面の音のみでいいのか?それとも空間的に聞こえたほうがいいのか?で選択肢が変わってきます。空間的に記録する場合ですが、人の耳で聞こえた状態に近いので、ステレオペアの録音だと、これはバイノーラルのほうが広い指向性を持っているので音の質感がステレオよりも自然になります。ただし、雑踏でも主題が居てそれにアンビエントとしてそうした音が加わるとかだと、これは単一のステレオペアのマイクでは収録できません。つまり、3ch以上のマイク入力で録音を行い、それを最終的にミキシングを行ってステレオにする必要が出てきます。

 

 そう考えると、録音をする場合だと

 

 ■ 主題のみ

 ■ アンビエントのみ

 ■ 主題+アンビエント

 

のような組み合わせが存在します。これを見てもらうと、

 

ステレオ音源でもステレオペアだけでは作れない物がある

 

と言う事が確認できると思います。また、録音については、主題となるのが、複数人の会話だとすると、ピンマイクの数はその人数分必要になりますから、そうした条件で考えると、主題の音が複数になりますから、単純に人数が2人でアンビエントが存在するだけで、音声の入力チャンネル数は4ch必要になります。

 

 これがステレオ音声で音を用意する場合に発生する条件になります。では、 【 チェンネル数が多い場合の構成ってどうなるの? 】 と言う話ですが、これは、選択肢が複数ありますが、

 

 

 ■ PA製品のような入力チャンネル数の多い物を使用する 

 

 ■ 複数のブレード型のオーディオインターフェースを用いて

    チャンネル数を増やしてミキサーでミキシングを行って、

    最終的にそれをステレオで出力する

 

 

と言う方法も存在します。出力がステレオの場合はそうなりますが、そうではなく、サラウンドの場合だと、個別にPCMで出してミキシングを行ったほうがいいように思います。そうなると、マイクの配置も空間の音をレーダーのような円の上に割り当てることになるので、どの辺りでどの音を拾ってそれをどうミキシングするとそれぽくなるのか?を考えて配置させることになります。ちなみに、放送とかで使われている枚kの数で5.1chの場合だと、野球中継などだと20本以上のマイクが使用されていますから、出力チャンネル数が収録のチャンネル数という訳ではなく、それ以上のチャンネルで収録している場合が大半です。

 

 ただし、これが個人レベルになると大変ですから、どういった形で収録を行ってどういった形でミキシングを行うのか?を考えることになります。マイクと言うのは結構高いので、チャンネル数を増やすと結構なな値段になるので、気軽にチャンネル数を増やすというのは難しいのですが、音については全く違う条件で録音した物をミキシングスル条件と、混ざったものの中から音を抽出するのでは結構条件が違います。後者の処理というのは、先日紹介したRXを使うと抽出できるのですごい時代になっていますが、当たり前のマイクで単一指向性のショットガンマイクでその音だけを狙って録音したソースをアンビエントを合わせた条件と混ざったものから音を抽出してそこだけ強調したソースでは音の質感が違ってきます。その為、音についても素材をどう作るのかで状況が変わってきます。

 

 個人の場合、アンビエント+音声だと思うのですが、この場合の選択肢も

 

 ■ ステレオのコンデンサマイク

 ■ バイノーラルマイク

 ■ ショットガンマイク

 

辺りになりそうですから、PCMレコーダーのチャンネル数が少し多めな物を持ち歩くとして、それにXLRやTRSでバランス入力をしたマイクを追加して録音をするというイメージになるような気がします。

 

■ 音の同期                      

 

 これについては、25Fで製作して24Fに戻すと現実世界の秒数が10進数なので、5の倍数同士で整合性が撮れるので合わせやすいため、

 

 25Fや50Fで撮るとフレーム調整で音の調整をしてもズレが出にくくなります。

 

 これ以外の方法だと、録音機材側にタイムコードを送っておいて、それを参照して整合性を撮って同期するという方法があります。基本的に音声が別録音の場合だと、ソフトウェアで合わせることになりますが、これには複数の手法があります。現在はソフトウェアで同期の項目で一括に合わせることができるようになっているので、それほど煩雑でもないのですが、DavinciResolveでは、

 

 ■ タイムコード

 ■ 時間

 ■ 波形

 

で合わせることができるのですが、撮影時にカチンコを鳴らして同時記録を始めた場合、この条件だとラグが存在しない場合、子映像と音声は時間で合わせれば同期できるはずです。この条件いプロジェクトのフレームレートの推移を合わせて調整するのが時間です。タイムコードと言うのは、【 OO秒XXフレーム 】で記録された時間表記です。つまり、映像側と音声側にこれがあれば参照をしてずれの補正ができます。最後に波形ですが、カメラ側でも音声トラックが存在している場合、マイクで同じものを収録すると同じ波形になります。そうなると、波形の特性の整合性を取れば音のずれはなくなります。現在はこうした機能を自動処理で行える時代になっているので、それで問題がない場合には、自動処理で音声を同期させることになります。

 

 FinalCut Pro Xの場合音声と映像を選んだ場合、同期を行う項目が使用できますから、現在はそうした機能を実装したソフトが多く存在しています。

 

■ とりあえず。。。                   

 

 PCでのノンリニア編集を前提に考えると、同機の機能は多くのソフトで実装されているので、映像と音声は別録りで行うという選択が存在する訳ですが、コンシューマのカメラの場合も、別録りしたほうが高音質になります。

 

 また、ポータブルタイプのPCMレコーダーを用いた場合、指向性のコントロールが可能になりますからそうした点でも内臓のマイクとは異なる指向性の音を選択できるようになります。

 

 外部マイクについてはマイク特性があるのですが、バイノーラルやMSマイクやステレオマイクというのは、複数のマイクが一つにまとまった製品なので、基本的にこれは複数のチャンネル数を一気に記録するマイクになります。その中でMSマイクだと沿指向性の選択が可能なので、指向性においては指向性が存在しない無指向性と特定方向の音を拾う単一指向性がありますが、単一指向性が二つ逆方向につながった双指向性のものがあるので、用途に応じて使い分けることになります。

 

 動画を作る場合、音についてはステレオでは記録できないガジェットもあるので、そうした物を用いた場合、外部マイクだけでは厳しい場合もあります。(と言うよりも、現在流通しているスマホだと外部マイクはモノラルになりますから、アンビエントを別途用意する場合にPCMレコーダーが必要になります。)

 

 その為、別録音+同期によって音作りをする必要がある製品も存在しますが、ステレオソースというのはDTMのオーディオの扱いと同じように、どういう音にするのか?で機材の選択が変わってきますから、ステレオで書き出すとしても素材数が3つ以上になることもあります。

 

 同期についてですが、最終的には波形参照での手動を用いることになりますから、カメラで撮影する動画もサイレンスではなくトーキーで撮影しておき、後で波形参照が可能な状態にしておく必要がありますが、そのシーンで必要となる音はいくつ存在して、その有用性はどういう物であり、どの音が必要でどの音が不要かを考えてカメラの向きや数を決めると、意図した音が作れるような気がします。

 

 現在のソフトはトラック数が99本使えるものもありますが、このトラックにはオーディオトラックも含まれます。つまり、20トラック位の音を用意してミキシングを行うことができます。トラック数が足りない場合ですが、個人がミキシングを行う場合だと、ステレオの場合だと、Audacityを用いる方法があります。7.1chまでだと、Blenderでスピーカーオブジェクトを配置して定位すると7.1chマスタリングもできるので、録音自体が凄まじい作業になりますが、サラウンドの音源の製作と、映像にそれを追加する事も可能です。