反射、吸音、拡散とおおまかに言われているが、
不完全であったり、複数の目的があったり、微妙に定義が違ったりと、
もっと正確に表現できないと表現できていないなと思う事が多い。
恐らく研究者の中で定義している人もいるのだろうが、ちょっと探す分には見つからないので、小規模のリスニングルームでの利用に特化したものを自分なりに考えて分類定義してみる。

①反射
まあ普通の大きく平らな壁で起こり得る音の反射である。理想的には厚み重量のあるコンクリートの様な壁で表面に研磨処理してあるような壁だとおそらくはシミュレーションに似た結果の挙動を示すと思われる。
ただ理想的な反射は音響的に好ましくないことが多く、理想に近づけようという努力はあまり行われない。それなりの厚さがある平らな木の壁であれば反射壁として扱って良いのだろう。

②吸音で反射率を抑えた反射
反射率が1.0に近付くほど音響障害になるが、それは好ましくないと考える場合。
反射率を0.5に下げた上で、なるべく周波数特性や遅延などの数値は変えずに反射はさせる、そういった処理がこれにあたる。
吸音部と反射部を細かく交互配置する、格子の隙間に吸音材を入れたような状態にすると上記の様な特性を獲得できると思われる。

③拡散で反射率を抑えた反射
上記の処理で吸音する所をその代わりに拡散させるというのがこの手法。
吸音材を入れない格子がこれにあたる(格子の表面が反射部で溝の中が拡散部)。
ただしこれは基本的には鏡面反射するとリスニングポイントに入射する壁とそうでない壁では概念が変わってくる。
他の壁にとっては、普通に鏡面反射する分にはリスニングポイントに到来しない筈の壁が拡散処理によって少量ではあるもののリスニングポイントに新しく入射することになる処理である。
なので反射率という考え方をする場合、リスニングポイントに入るか入らないかで同じ構造の壁でも数値が違ってくる。

④吸音
入射した音が消滅する壁の状態である。理想的な状態とするには相当の厚みの吸音材が必要となる。理想的な吸音が望まれることは多くあるが、なかなかそれも困難であることも多い。低域から高域までそれなりの吸音率がある場合、これに該当すると考えられる。

⑤不完全な吸音
薄い吸音パネルなどを張った状態が該当する。低域が十分吸音されないので中高域が吸音率が高いが、低域が吸音率が低いままである。
不完全だから完全に害悪とは言えず、定位などが分かりやすく処理もし易い中高域を操作するだけでもそれなりのメリットは享受できる。

⑥周波数特異的な吸音
有孔ボード、ヘルムホルツ管、板振動型のバストラップなどがこれにあたる。
特性として特定の周波数のみ吸音する性質がある。
どの周波数をどう吸うか、シミュレーションが難しく、実際に理想通りになっているかの検証も難しい。
既製品が圧倒的に有利にはなるが、そもそも理想通り動くとしても使い道が難しい。

⑦3次元の拡散
入射した音波が偏りのない半円球状に分散されて反射される。理想的な拡散音場の壁がこれにあたる。どうすれば理想的な拡散をするかは研究段階であるが、かなり複雑な形態が必要なことは間違い無い。
そのため理想の拡散ができる構造が判明したとしても製造上の困難が想定されるため、理想の形態が判明したとしても一般的には実用されるとは思えない。
リスニングルームで実用される三次元的な拡散としては二次元のQRDがこれにあたる。壁に半円球を並べてもそれに近くなるかもしれない。周波数特異性もあるためなかなか理想通りにいかないだろうが、そもそも理想を目指すべきなのかは考える必要はあると思われる。

⑧二次元の拡散
入射した音波が半円形に分散されて反射される。1次元のQRDやリブ、柱状拡散体、スリットなどがこれにあたる、特定の軸には拡散され特定の軸は反射に近い挙動を示す。
多くの既製品がそうであるように、作りやすい拡散体を作るとこうなりがちであり、拡散性は理想的ではない。その分拡散であるにもかかわらず、音波の挙動はある程度読めるので、その偏りを想定した設計が可能とは思われる。

⑨時間軸の拡散
反射によってリスニングポジションに入射する壁において壁から反射して音が入ってくるという状態に変わりはないものの、一気にドバっとくるのではなく、少しずつ来るようにした反射の処理を示す。
四次元の拡散と言えばものすごい事のように聞こえるし間違いでもないのだが、やっていることは大したことでもない。
基本的には時間軸を拡散させるとき、反射方向もある程度は拡散される。意図して設計すれば方向は拡散されないまま時間軸だけを拡散することも理論上可能だが、そもそもある程度の拡散は好ましいことの方が多いので、時間軸だけが拡散されることは基本的にはない。
単純に時間をずらすだけではあるが、案外それだけで室内音響のあるべき要素の半分をパスできるのではないかと思われる。
単位時間あたりの反射波が小さくなるので、反射音が大きすぎるという音響障害がなくなる上に、位相干渉も分散されるので影響が小さくなる。
とはいえそもそも時間をしっかりずらすのは難しい作業ではあるが。

⑩方向転換
反射した音がリスニングポイントに入るはずの壁面に対して適用されうる処理。
拡散とは異なり、反射波に偏りがあるという意味では紛れもなく反射であるが、
リスニングポイントに反射波が入るはずの壁の反射角が変更されることによりリスニングポイントに反射波が入らなくなる。そういう処理になる。
リスニングポイントに入ってこなければその音波が生きていようがいまいが聴取者には影響されない。
方向をずらして観測されずに生き残った音波は何度か反射を繰り返し後期反射音や残響となってようやくリスニングポイントに入射される。
デメリットとしてはこの処理で響きを整える場合、響きの整ったエリアは狭くなる。
また鏡にレーザービームを当てたような綺麗な鏡面反射をする訳でもないので、方向をずらしても多少はリスニングポイントに入ってくる。
そういったデメリットもあるが、小空間では案外相性がいい気もする。
・小空間だと初期反射音が過剰になりがち、かつ残響が少なくなりがちなので、それを補正する効果としては有用。
・小空間の拡散は近すぎて細かくなりきらない可能性がある。また乱反射を伴うため高域が弱りやすい。
・部分的な吸音は僅かだが吸音材の反射音があり、吸音部とリスニングポイントが近いのでそれも聞こえる(らしい)。それが音の鈍さにつながる。
また音響インピーダンスが極端に変化するのは耳を少し動かすだけでも音の性質が極端に変わりやすいと言われている。
不完全ながら方向を逸らすというのは反射音を減量させる意味では吸音させず周波数特性の変化を最小限に抑えて減るのでデメリットが少ない。
・響きの整ったエリアは限られるが、そもそもホームリスニングの場合、真面目に聴く場合と、流して聴く場合があり、毎回どの場所でも整った響きが提供される必要がない。

とこんな感じで分類しつつ、今のトレンドではないが、方向を逸らす手法がそれなりにホームリスニングでのメリットを感じた次第。
部屋の長辺と短辺のどちらを縦横に使うかはリスニングルームの利用の際に選択肢があるが、
もう一つ左右の条件をそろえつつセッティングする方法がある。
正方形の部屋を設計して斜め45度に使う方法である。

正方形なので定在波が分散できないという欠点があるが、
真正面と真後ろと真横が逆ホーン型になるので、そこからの反射音があまり来ないことが期待はできる。
採用するものではないとは思われるがメリットデメリットを考えてみる。

一次反射のシミュレーション


二次反射のシミュレーション


メリット
・極端に近い壁からの一次反射音がなくなる
・後ろからの反射音が、後ろやや側方の反射音となる。つまり後方成分を減らし側方成分が増える。
・同様に前方成分が減り側方成分が増える。
・側方成分が増えることは明瞭性の向上につながることは期待できる。
・部屋の四隅の一角にスピーカーを配置することになり、部屋の占有エリアを節約できる。

デメリット
・正方形の部屋でしか適応できず、定在波が偏在する。
・正方形の弊害かディレイが似たようなところで偏る。
・ダイヤ型でなく、斜め45度に傾けて見ると、スピーカーからリスニングポジションまでフラッターエコーが生じやすそうな配置であることがわかる。

総合的に考えると少しデメリットの方が多いような気はする。使えなさそうなものが本当のところどうかを考える機会も大事だとは思うのでこれはこれで。
今の使っている800SDはまだ当面使うつもりはあるのだが、
今業界でどのようなスタンスでどのようなものが市場に出ているのかは興味があって最近よく調べている。

スピーカーのオーディオを始めたばかりの時は自分はまだ学生で、
B&Wはダイヤモンドツィーターを丁度出したばかりくらいの頃だった。
得も言われぬ曲線的なミッドレンジのエンクロージャーと
振動板の形状のダイヤを作ってプラチナでコーティングしたものを高域に使うというのは衝撃的だったし、オーディオのメーカーがやっていることの凄まじさに憧れを感じた。

その後働き始めてから間もない時期の出張の際に寄った某オーディオショップで試聴した800Dの音の凄まじさは、いつか手に入れたいと思わせるには十分だった。
働き始めてからの貯金がある程度貯まったところで802Dを中古で購入し、それは今もシアターのフロントスピーカーとして活躍している。
新居に引っ越すに際してある程度大きなスピーカーを設置できそうだったので、800SDを購入した。
若いときに夢だったものを無事手に入れることができたので、それ以降しばらくスピーカー業界に興味が無かったのだが、
家電製品だけにどこかで買い換えの時期が来るであろうことを考えると、800SDの次を意識し始めるようになった。

妥当なラインだと800D3やその後継になるのだろうけれども、
800Dや800SDが昔からの目標であったのに対して、新世代の800にはそれほどの執着はない。
そして新型で性能は全体的に底上げされているというが、根本の構造の変化を見ても試聴してみても、どうしても新型に替えたいと思うほどの強い気持ちは芽生えない。

800D3やその後継は有力候補として見てはいるものの、他のメーカーのアプローチに興味が湧くようになった。
今は高域は一時期流行った20kHz以上の再現性については重視されなくなってきているような雰囲気を感じる。テクノロジーよりも聴感上の良さを重視すればいいのだろうという認識。
中域も各社いろいろな素材や形状を使っているが、これも一長一短と思われ、聴感上好みであればそれでいいのかなと感じている。
重点的に見ているのは低域との向き合い方である。今のトレンドとしてみると、低域は重厚なエンクロージャーで囲ってしまい、反対側から出る逆位相の音を封じ込めてしまうことの評価が高いようだ。
逆に言えば超低域の強力な背圧をごまかさずに向き合っているスピーカーこそ魅力的に映る。

自分は富裕層でもないし、ハイエンダーでもない。自分でセッティングの微調整すらできないスピーカーを手に入れようという気はないので100kgくらいのサイズが限界になってくる。
上記の中での考えではYGのHaileyやMagicoのA5やS3あたりが魅力的に見えてくる。

その辺りと800D3との比較試聴はアフターコロナに是非やってみたいと思っているのだが、もの凄い魅力を感じるかというとそこまででもないのが現状ではある。

少し無骨な外見が、一時期の曲線多用全盛の頃と比べると地味な印象を受けることと、背圧を金属の塊で塞ぐというのは最新テクノロジーてんこ盛りであるのしても、ちょっと力技な印象があるからである。
Original Nautilusのように背圧を打ち消す機能美みたいなもの方が個人的には憧れが強い。KEFのメタマテリアルのような技術などで是非低域の背圧に挑戦してもらいたい。逆位相のアクティブノイズキャンセリングのような技術で背圧を打ち消そうとするのがあってもいい。
ここで挙げた様なものが製品化してくれると自分はとてもワクワクする。

また、伝統的なパッシブスピーカーのスタイルから一歩先に行って欲しいなと思っているのもある。
タイムアライメントのためにウーファーを前に出してツィーターを引っ込めるFocalみたいな物も、
低域を稼ぐために比較的小口径のウーファーを2つ3つ4つと並べるのもいいのだが、
DSPを使ったデジタルアクティブスピーカーであればタイムアライメントは横一線に並べても出力側で時間を揃えられるし、内部のネットワークも不要だし、低域のアンプ出力を上げれば同じ口径のウーファーを複数並べる必要性もない。
基本的にデジタルソースしか聞かない自分としてはそういうアプローチのスピーカーが出て欲しいなと思ってもいる。まだコンシューマー向けではそういうアプローチのフロア型はあまり見ないので期待したい。
少ない手間とコストと入手しやすい資材でそれなりの効率の良い拡散をと考えた時に
2層の縦横の矩形リブを使うと良いのではないかと思ったのだが
見た目どうなるかというのがあまりサンプルがなく、端材を使って検証してみた。

使ったのは25mm×25mmの短いリブと25mm×60mmの細長いリブ

どちらも周期5cmのリブと間隔比が1:1で並べた場合。

なんかザルというかスノコっぽい感じ。内側のリブは黒く塗装した方が良い感じに思える。
斜めから見るとまあ普通のリブ。ちょっとデザイン的に陰陽がうるさい感じがしなくもない。


内側のリブを1:1、外側のリブを1:2で並べた場合。
この並べ方は自分としては有力な配置で33%が外のリブに反射し、残りの33%が内のリブに反射し、さらに残りの33%がリブには反射しないと単純計算だと考えられるからだ。

なんというか、野暮ったさはけっこうある。
正面からみるとさらなり。

内側の目立たない塗装は必要と思われる。

短いリブを外側にした場合。ザルのイメージをさらに強くするような模様。正直これはないかなという印象。


リブの周期を1:1と1:2で交互に並べてみる。

自分としてはアリかなと思える。

2層リブで複合比配列をしてみる。
  

比率にバリエーションがあった方が拡散する周波数の偏在が少なくなるという意味でも意匠の意味でも悪くはない気がする。
とはいえ内側のリブは目立たないような色にしておいた方が良さそうだが。
低音を吸音しようとするとそれなりの吸音層の厚さが必要になる。
一般的な壁の厚さは20cm以内でそこに吸音層を作るのでは厚さが足りない。
例えば30cmの吸音層を作ろうとすると、構造壁のさらに内側から30cm分吸音層を取って、全面吸音としない場合はさらに内側に一部で反射壁を作ることになる。
室内空間の広さは相当に犠牲になる。
それでは吸音部だけ壁を凹ますことはできないかなと考えると建築の強度が弱くなったり設計が難しくなったりする。
どうしたものかなと思っていたら、出窓というものの存在に気付く。
丁度一部だけ壁が凹んでいる状態になる。

例示としてリクシルの出窓の設計図

出窓に取り外し式の吸音材を付けると壁の厚さと出窓の出ている部分の合計で40cmくらいの吸音層を作れることになる。
窓の一時的な防音性の向上になるし、かなりの低域も吸えるだろうし、吸えないような難敵はおそらく窓の向こうに透過してしまうだろう。

定在波を複雑にする意味でもアリなのではないかなあと少し思った。
細かな条件がいくつも異なる言説や研究を合わせて、時期ごとにどうこうするというのを考えてみて、それはそれで根拠があるので妥当性はあると思うのだが、なぜそうなるのかというのを生理的心理的側面を中心に再考察してみる。

人間の耳は2つあり、基本的には2つの情報が同じであることは少ない。(真正面と真後ろ以外は左右で情報が異なる。)
だからこそ2つの耳から微妙に異なる入力を受けたり、短時間内に複数の音の粒を受けたときに脳で一つに統合する作業を日常的に行っている。
オーディオリスニングでは左右のスピーカーで左右の耳に微妙に異なる入力が入るように鳴らしているが、法則時間内の初期反射が入ると、それも一つに統合する作業の中に組み込まれてしまう。
余分にも見える音を統合されること自体にも意味はあって、それにより音源の距離感を予測したり音源の大きさなどを把握するための能力が備わっている。
なのでその能力がまったく発揮しないような室内音響が人間として楽しいとは思えない。
だが、密閉された真四角の小さな部屋で耳を澄まして大きな音の響きを聞くというのは人類的にも昔の不自然な要素があり、あまり快と思える環境では無い気はする。
やはり近くて大きすぎる反射音を纏めて全部取り込むのは上手くやれば良くはなるものの、ステレオイメージが変わることには変わりない。自分もやっているなかで言うのもなんだが、王道とは思えない。まったく反射を無くすのも王道ではない気がする。
元来人間の生活空間はもっと不規則な反射をしていたはずである。長いトケトゲの高性能拡散体は逆に自然界にはあまりない不自然であるものの拡散体で時間軸として散らしすぎない程度に散らして、一瞬でまとめて大きい反射が来ないようにするのは自然の響きを作る意味で当然な気がする。

また室内の静かさを担保するためと騒音防止のためにリスニングルームは密閉にする必要があるが、たまにやるドアを開けたまま音を聴くと音抜けの良さがすっきりしていて気持ちよく感じることがある。
人間は閉所恐怖症を持っている人間がいるように密閉空間が本能的に好きではない要素が強い。(広場恐怖症もあるように、おそらく隠れる場所が一つもなく、音も聞こえづらい遮蔽物が一切無い空間も大好きではないと思う。)
コンサートホールレベルの大空間なら別の話にはなるが、小空間なら密閉ながらも半開放空間のような抜けの良い響きを作った方が心地良いような気がする。
拡散が若干ノイジーと言われるのは細かすぎたり拡散音のレベルが高すぎるのがあるのではないだろうか。
根源的に快と感じるものと考えると、自然物のようなほどほどの不規則さと閉塞性のなさ、そのあたりが重要と考えられる。
そのためには多少の拡散、響きの総量の適正化を行って作っていくのが良いように感じる。

また後ろから大きい音近い音が人間にとって心地良いはずはないと言うのもなんとなく分かる。
真後ろで大きな音が鳴ったり後ろの近いところでザワザワ音がすると不快なように、
後ろの近くて大きい音は自分への危機の可能性ありと脳内が警鐘信号送るのだろう。
後ろの音が遠く小さく柔らかな感じだと、何かの気配が背後近くにがいないという感じ、遠くにいそうだと感じることが安心感となり、快につながるのではないだろうか。
今までもピックアップした人の論文なのである程度内容は前のとかぶっているかもしれないが

今村秀隆氏の博士論文
音楽の明瞭さの評価要因と音場の物理量の対応(要旨)

https://core.ac.uk/download/pdf/270226713.pdf


ところどころ抜粋

市販音源の聴取においては、音色および音像の明瞭さのどちらも直接音に対して約−23 dBほどの初期反射音レベルが最適とされた。
一方、調整された初期反射音レベルには個人によるばらつきが見られ、高い初期反射音レベルを明瞭とする被験者と、低い初期反射音レベルを明瞭とする被験者に分かれた。
それぞれによって調整された初期反射音レベルには、約10 dB〜20 dBの差が見られた。更に、高い初期反射音レベルを明瞭だと判断する被験者は、初期反射音の到来方向の偏りにも着目して評価を行った。
(中略)
市販音源の聴取における複数の明瞭さの評価要因について、調査した。
音場の室容積が60 m^3〜224 m^3という条件下で、
音楽の明瞭さは「音色の明瞭さ」、「音像の明瞭さ」、「音像の広さ」の3つに区別されることが明らかになった。
全ての明瞭さが、室容積が大きいほど、そして初期反射音の到来方向の偏りが低いほど明瞭と判断された。
音像の明瞭さはこの傾向に加え、初期反射音が直接音と同じ方向から到来する場合により明瞭とされた。音像の広さはIACC(両耳間相関度)が低いほど広いと判断された。(所々中略)
(中略)
結論で提案された最適値については明瞭さに対する価値親の多様性によって適用範囲が限られると考えられること、室内の反射音の明瞭さと実験素材である楽音の明瞭さの影響が交絡している可能性などが指摘された。

自分なりの考察
音色の明瞭さはカラレーションやレベルの高い初期反射音の量などで変化するものと解釈してもいいものか?
音像は直接音と同じ場所から反射音を入れると明瞭とのことだ。位相干渉との兼ね合いが難しいが、基本RFZにしつつ、スピーカー近くの壁に1カ所レベルを調整しつつ反射入れた方がいいのかもしれない。
音像の広さはASWと解釈すればいいのだろう。

クリアーな音はシンプルに言うと
反射音は到来方向に偏りなく-23dBで入れる(音色、音像の明瞭さ)。
スピーカー近くの壁からも初期反射を入れていく(音像の明瞭さ)。
横方向からも入れる(音像の広さ)。

ということらしい。簡潔な答えではある。
ここ数ヶ月でいくつかの有用な論文や解説をピックアップしたが、自分自身も情報としてまとめられておらず、
当面は忘れている事項を思い出しつつ情報を統合していこうと思っている。

リブによる不完全な拡散は、拡散性が上がりそうな工夫などは考えれば拡散性は上がるだろうが、複雑な形状や大きい拡散体はコストがその分かかる。
必要最小限の大きさを今までのペーパーを利用して検討してみる。

そもそも今まで拡散を必要と考えたのは、コムフィルタ効果を軽減するためと、、LEVを知覚しやすくするためという複数の目的で考えていた。
コムフィルタ効果は主に150〜800Hz程度の中低域の問題である。(聴覚に近似した1/3オクターブバンドで考えると中高域は大したディップにならない)
そしてLEVは500〜2000Hzと中高域が重要な役割を果たしてくる。
出典:https://jpn.pioneer/ja/manufacturing/crdl/rd/pdf/14-2-2.pdf

そのため、初期反射面に設置するコムフィルタ効果の軽減のために入れるリブはやや大きめである必要があるが、
LEVを得やすくするため、フラッターエコー防止のためのリブは小さめでかまわない。むしろ10cmくらいのリブは2000Hzの拡散率が逆に落ちるようなのでなおさらのこと少し小さめでいいはずである。

以前取り扱った論文中で
出典:http://www.env-acoust.t.u-tokyo.ac.jp/public/x/x004.pdf
コムフィルタ効果対策のリブとしては

150〜800Hz程度という帯域的に10cmの深さが一番適性が高い。


150〜800Hz程度の周波数帯域的には10cm幅が一番拡散性が高い

ということで一次反射面のコムフィルタ効果軽減のためには10cm×10cm程度のリブが一番適正が高いことになる。
それよりも高い周波数の一部で極端に拡散率が落ちるのだが、それはリブの深さ、幅、間隔が10cmで統一されているからであり、若干ずらしたり不規則にすることで緩和が期待できる。
10cm×10cmは材の用意が大変だと思っていたが、4×4材をコアに羽目板やウォールパネルで表面を取り繕うとちょうど良い感じのサイズになりそうなので、コスト的にそこまで大きなものにはならないかもしれない。

では一次反射面以降の残響を早く出現させ、より細かな残響とするためのリブはどんなサイズが良いか。
上で挙げたグラフの中で500〜2000Hzの帯域に一番効くサイズとなる。
500〜2000Hzでバランスが一番安定して拡散するのサイズ
:高さ6cm幅15cmのリブ、次点で高さ6cm幅10cmリブ
1000〜2000Hzに大きく偏っているが拡散率の総合的に一番大きいサイズ
:高さ4cm幅10cmのリブ
コスパ的に1600〜2000Hzとかなり偏っているがコストが低い割に拡散率が高い
:高さ4cm×幅5cmのリブ
次点で高さ2cm幅10cm、高さ2cm幅5cm、高さ6cm幅5cmもコストの割に拡散率は悪くない。

どれを使うというと、複数使うのが一番偏りなくて良いのではないだろうかと考えている。
幅も20cm周期に対しての幅であり、一番効率が良いのが周期に対するリブ幅が50%のようだが、率を守ればもう少し細くてもいいのかもしれない。細くする理由は視覚的効果と幅の広い材の入手性に難がある場合の対応という理由である。(根拠はないが)

また拡散体は背面に空気層があると効率が良いと言われている。
リブの場合は直交する柱で少し浮かせる感じになるのか?
リブを浮かせるためのスペーサー自体がリブであればいいのではないか?
やや周期性はあるが2cmと2cmの直交2層リブの場合
高さ0cm、高さ2cm、高さ4cm、高さ4cm(背面空気層2cm)、のパターンができあがり、簡易的な二次元拡散体になり得る上に、表層の拡散体が背面空気層により拡散性が向上する。
調べてみてもあまりこれに関する研究はないが良さそうな気もしている。

例(わかりづらいがebayより転載)


なので暫定案ではあるが、リブの使用のたたき台として
初期反射面を意識した部分
:周期20cm高さ10cm幅10cm
正面壁(ツィーターの指向性の問題から高域があまり入らない)
:周期10cm高さ6cm幅5cm
側壁と後壁と下半分の横リブ
:周期10cm高さ10cmと4cmのコンビ 幅5cm
側壁と後壁の上半分の直交2層リブ
:第一層 周期15cm高さ6cm 幅5cm
 第二層 周期20cm高さ4cm 幅10cm
天井のリブの直交2層リブ
:第一層 周期15cm高さ3cm 幅5cm
 第二層 周期20cm高さ2cm 幅10cm
こんな感じかなあと思案。
新たに取り入れた知見を元にまたリスニングルームを考えてみる。

反射は少なくともinitial time delay gap(ITDG):15ms以内に関しては初期反射音を受け入れるべきではないのかもしれないという風に考え始めている。
第一波面の法則がしっかりと成立する15~40msの間にある程度細かくした反射音を複数入れようと思っている。15msまで稼げば当然ついてくるとは思うが直接音より15dB減衰はする必要がある。

一般的なリスニングルームであると二次元で表せる。高さ方向の関与のない反射音では特に側方で遅延が小さくなりがちでスピーカーからの軸に近いこともあり反射音は強烈である。
自分の考えている仮想の部屋では遅延は4msくらいしかない。現実に今ある部屋ではさらに短い。ここまで強くて早く到来する初期反射音を今までは積極的に取れ入れるよりは、抑制した方は益は多いように思えてくる。

そもそも側方や前方の高さの移動を伴わない最短の反射音を活かす必要性を以前感じたのは床の反射があまりに強いためその相殺のために使うしかなかったのであって、床を設計段階から手を入れられれば、自分としてもそこまで大きな反射音が必要であるという理由がなくなってくる。

それに吸音さえしなければ現実はおそらく理屈通りの反射をすることはないので、15ms以内は理屈から外れた一次反射音がそれなりに入ってくることが考えられる。コムフィルタ効果の起こりやすい低域ならなおさらシンプルな鏡面反射はしてくれない。だからRedirectionとDiffuseくらいなら逃がしたつもりでも多少は入ってくる。
その多少感が超早期の反射音の量としてはちょうどいいのではないだろうか。

先の調べ物などを見ても初期反射音を活かして設計するにしてもその質は十分に考慮しなければならず、初期反射音合計で直接音よりも15dB小さくし、均等な感覚で到来し、音の強さは規則的に漸減するように設計する必要がありそうだ。どうするかというと、高さの移動を伴わない低所の一次反射エリアの反射音は逸らしてしまい、高いところから反射してくる音はリスニングエリアに返ってくるように調整し、高さ分の往復でITDGを15ms近くまで稼ごうという算段である。
反射音の高さ分で音像がリフトアップされるが、そもそも普通に反射されると、当たり前だが音像がスピーカーのツィーターからミッドレンジに定位されるのだが、小高いステージから聞こえるはずのリアルさを考えると定位のリフトアップという副産物は歓迎すべきものであるはずだ。

簡単なイメージではあるが実際に図にして書き起こしてみる。
2次元の間取り図。


以前に一次反射をリブで受けるアイディアで考えたものがベースにはなっている。

ただ今回は一次反射に関してはRedirectionによりRFZになっている。


コンセプトとしては側方の一次反射面と正面の一次反射面に到来する音波にクサビを入れて受け流しているイメージ。
リスニングポジション近くの後壁はほとんどの時間帯においてあまり良い効果がないのでRedirectionではなくより強力なAbsorptionで対応している。定在波となる低域の吸音をどこかでしっかりやっておきたいという目的も兼ねている。
1mを超える厚い吸音層で透過性の高い低域の吸音を行いつつ、LEVの原料になる500〜2000Hzは戻して再利用したいので吸音スペースの表に吸音材保護の意味も兼ねて格子を若干まばらに立てる。中高域の一部は吸音されずに拡散されて返ってくるように若干シルヴァン的な拡散体として利用している。

三次元的に少し工夫を凝らしており、三次元的なモデルはこうなる。


耳の高さツィーターの高さ周辺とその下方には横リブが入っている。これにより三次元方向(高さ方向)には拡散されるが、二次元的にはほとんど拡散されない。
つまり二次元的な間取り図で一次反射のREZになっている状態は維持されたまま、高さ方向に拡散している。
耳の高さ周辺だけでなくその下方も同じ処理をしたのは、二次元では同じ軌道だが壁の下方に反射し、床でさらに反射してリスニングポジションに到達する二次反射音が存在し、一次反射と大差のない遅延の少ない反射音なのでそれも除外したかったのが理由である。

またRedirection用のクサビにも横のリブを入れている。このリブは三次元方向に拡散効果はあるが二次元方向のRedirectionにはほとんど影響を与えない。
方向をそらしつつ、高さ方向には分割しているので理屈どおりに行かずに多少リスニングポジションに入ってくるとしても、リスニングポジションに入ってくる音のレベルを小さくしておこうという二重の意味でのReflection freeを狙っている。


高さ180cmより上は縦にリブを入れている。これにより部屋の上の方では間取り図のRFZのシミュレーションは機能しなくなっている。
だが三次元方向には拡散していないので、低い位置にあるスピーカーから放射された音が壁の上の方で反射した場合、その後天井にぶつかってからでないとリスニングポジションのある下方に向かうことはできない。

もしくはスピーカーから放射された音が天井にぶつかってから壁の上の方にぶつかって下方に向かわないとリスニングポジションに到達しない。


これらの二次反射は、床を介した反射と違い遅延がそれなりに大きいため、積極的に取り込んでも副作用は少ないと思われる。
それらの反射音を細かく分割して取り入れたいので縦にリブを入れている。

この前書いた自分のスタンスは概ね取り入れたが、理想通りはいっていないのではないかという点もある。
まずは15-20msの初期反射が入っているかはラフな拡散による二次反射で取り入れているのでピンポイントの時間で入ってくるか、十分な量が入ってくるかはやや疑問に残っている。
一次反射音は早すぎるが二次反射音は遅すぎる。小空間だとそんな印象は拭えない。

あとは第一波面の法則から外れる頃〜中期は密な反射は煩わしく感じやすいが、疎にできているかというと怪しいと思ってはいる。
ただリスニングポジションに相対する正面は背面はDiffusion、Redirection、Absorptionと多めに処理されているので反射波は密になると行っても大部分はスピーカーより外側になる。外側の早期中期反射音はレベルが低ければ密でも聴感上はいいはずである。

ということでとりあえずの暫定ルームをまた設計してみた。
結局既知の理屈を纏めて、間違ったことをしないようにすると、
一般的な矩形室の部屋の響きを自然と肯定しつつ、矩形室で悪いと分かっている要素を不完全なRFZと不完全な拡散音場で欠点を克服しようとしているだけで、独自に考えたからと言って設計は平凡なスタンスにはなってしまっているが。
あとは実践でシミュレーション通りにいかないところを対応しつつセオリーを外した解決法を探っていくしかない。
実践の予定はまったく無いわけではあるが。
様々なルームアコースティックのアプローチの仕方や考え方はそれなり読んだつもりだが、一つの正解というものがない事象が多くある。
自分はどういうスタイルを支持するのか、どういうアプローチで考えるのかそのあたりの整理のために、結論が決まっていない部分を抽出してみることにした。
結論が一つになっていないものをまとめて、それに対する自分のスタンスを整理していけば、最終的に自分のスタイルが見えてくるだろうというためである。

1.Non environmentを是とすべきか否か。
一般的なリスニングルームでもなければ、最新の室内音響学のトレンドでもないが、実績が多く現役のコントロールルームでの採用例も多そうである。
簡潔で成熟した設計であるだけにその手法が気に入れば問題は少ないように思える。
反射面が床と正面壁の2面しかなく、反射が何度も続かないうちに霧消してしまう。初期反射の問題もほとんどなければ残響があることによる問題もない。少しだけ響くので無響室ほど居住性の悪いわけでもない。
初期反射は不明瞭さや周波数特性の悪化を引き起こすので不要と考え、残響に関しても音源の残響のみを存在させることで音源の録音された空間の響きを再現することができれば、それがベストと考えるならそれで良いような気もしてくる。
欠点としては、ほとんどスピーカーの方向からしか音が出てこないため、他の方向からの音が不足することである。スピーカーよりも外側の初期反射は音の広がり感を生むと言われているし、ソースに残響が入っているとはいえ、残響を再生するスピーカーは正面の二カ所にしかステレオ再生では存在しない。正面からのみ表現される残響音では包まれ感は再現されない。また音源は一般的な居室で再生することを想定しているためNon environment環境で再生するとほとんどの場合で響き不足する。
逆に言えば、7.2.6chなり22.2chなり全面にスピーカーを取り囲むマルチチャネルのシステムを組んで、ピュア用途で使えるような高品質のDSPが開発され、Non environment環境下で音源が録音された室内の響きを再現することに特化したマルチチャンネル音源が多種多様に流通すれば、Non environmentに思いつくような欠点は見当たらない。
だがそんなマニアックな代物は商業ベースに絶対に乗らないので現実には起こりえない。前述の欠点は欠点として受け入れるか、Non environmentを否とするしかない。
とはいえ、条件が揃えばベストになり得るものなので、決して先入観だけで全否定するべきものではないのかなと思っている。

2. 1-40msの初期反射をどう扱うか。
早期反射の定義がまばらだったり、第一波面の法則の成立する時間帯が人によって定義が違うので困っていたが、過去に紹介していた論文にその研究がされている部分があった。ぴったりな研究なのに今までスルーしていたという(汗)。
出典:http://www.lib.kobe-u.ac.jp/repository/thesis/d1/D1001220.pdf
減衰のない反射波の場合、遅れと分離する確率を表したグラフ

20ms以降で分離確率が上昇を始め、30msで20%分離する。第一波面の法則が成立するのは1〜30msと言われることがあるのはこれが根拠だろう。

ただ減衰が一切されていない反射率1.0の法則であって、反射時の減衰がない研究結果である。そして直接音よりもエコーを意識させての実験のようで実用的ではない。減衰させつつ直接音を意識させた状態で第一波面の法則が成り立つ範囲はどうなるのかという研究結果が以下の通り。


初期反射音は15dB以上減衰させないと音場形成を阻害するという研究結果もあるので(下図)、ちゃんと15dB減少させたとすると、上のグラフから15dBの減衰の場合40msで20%の分離となる。

出典:https://www.eetimes.com/acoustics-and-psychoacoustics-applied-part-1-listening-room-design/

なので、自分の認識とすればそれなりに音響調整された室内空間の場合の第一波面の法則が成立する時間帯は1~40msと考えることにする。(40msは20%分離であり、それ以降も完全に分離はされていないことに留意。)
反射音であり、直接音と分離できない。初期反射はもっと広い範囲も論じられたりもするが、第一波面の法則が成立する範囲としっかり区切って考えてみることにする。

①反射音を受け入れない。
Anechoic、Non environment、RFZ、Redirection、初期反射面の高度な拡散、などが該当する。コムフィルタ効果による周波数特性の変化、音色の変化がほとんどなく、聴覚的な部屋の広さ感を増大させる。コントロールされていない初期反射が音の不明瞭化を引き起こすと言及されていたりしている。
30ms以内の反射音はシミュレーションがそれなりにできる分、選択的に排除することができる可能性が高い。そして30ms以内の反射音は音圧が大きいだけに影響も大きい。影響の大きいものを処理できれば大きな改善を望める。
欠点としては部屋が作る音の響きを十分に作れないこと、音像の広がり感、距離感を十分作れないこと、音源の良いか悪いかは解釈によるのかもしれないが厚みが作れず音像が遠くに位置してしまうことがあると考えられる。

②反射音を疎に受け入れる。
未処理の室内で入ってくるような初期反射の個数を受け入れる手法である。一般的な居室と類似したトランジェントのまま、そのデメリットを軽減させるアプローチになる。
本当に未処理な小空間だと明らかに反射音が早すぎ、かつ大きすぎて音色の変化や不明瞭感などの副作用が大きすぎるので、1-40msの中でも副作用の少ない15ms以降の初期反射音のみ受け入れ、それより早い反射音は排除するなどの工夫があってもいいし、反射音を受け入れるにしろ少し吸音する反射壁を用いて反射音レベルを低下させてもいい。初期反射音の中でもより遅く、より小さくなれば副作用も少なくなる。
そういった細工が良い響きになる根拠として、サイズの大きな部屋の初期反射の性質に近似させるための作業なのだから期待できると思われる。
コムフィルタ効果は比較的大きいというデメリットはあるが、15ms以内のものをなくし、反射率を減少させ、数も減らしているので、未処理よりもその効果はかなり軽減される。

③反射音を小さく密に受け入れる。
中等度の拡散を行うことがこれに該当する。時間軸として小さく分散されているので総量はさして変わらないにしても、それぞれ異なるコムフィルタ効果を持っているので、コムフィルタ効果が軽減できるメリットがある。
デメリットとしては理想的な拡散だと残響レベルになってしまい、荒すぎる拡散だと十分に分割されないので計算通りにいくのか分からない。また密な反射音というのは未処理の小さな部屋と同じ特徴であり、心理的に良好なものではないのかもしれない(自分が調べた限りではこの時間帯でそうなる根拠はない。)

3. 41~80msの早期反射をどうするか
41-80msという分類はあまりされていないが、1~40msの初期反射とそうでない反射との区別のために便宜上そう呼ぶことにする。early reflectionsと扱われるのとしても定義がかなりまばらで、結局のところ、扱う部屋の大きさがまばらなので仕方ないのかもしれないが、聴覚の性質が変わるわけではないのでなお難解である。
第一波面の法則は成立しなくなってくる時間帯ではあるが、同時に完全分離をするまでの過程の時間でもある。分離できない直接音と同一の音として利用するには信用できず、かといって直接音から完全に分離された存在としてカラレーションや広がり感などへの関与を無視していいとも思えない。そういう反射音を個別に考えてみる。

①反射音を受け入れない。
Anechoic、Non environmentが該当する。音色の変化がほとんどなく、聴覚的な部屋の広さ感を増大させる。逆に言えば距離感を感じづらくなる。

②反射音を疎に受け入れる。
未処理の大きめの室内で入ってくるような反射の数を受け入れる。受け入れることで距離感と音圧上昇を期待できる。カラレーションを無視できないが、それほど大きな影響のある時間帯でもないと思われる。
疎に受け入れると密に受け入れるよりも明瞭感が上昇するという研究結果がある(音圧も同時に小さくすることが前提)。

③反射音を小さく密に受け入れる。
中等度の拡散を行うことがこれに該当する。時間軸として分散されているのでカラレーションがなくなるが音圧は付加できる。デメリットとしては小さい部屋の不明瞭な音と近似してしまう。特に正面と背面でその効果がある。
そもそもなぜこの時間帯に密な反射音があると不明瞭と感じるのかというと、確証はないのだが上で使ったグラフをまた使うと

40msで-25dB、50msで残響レベルの-30dBも減衰をさせないとステレオイメージの邪魔になるという研究結果がある。密なのが悪いというより反射音の音圧がこの時期としては大きすぎて邪魔なのが悪いのではないだろうか?
あると邪魔なものであるなら密よりも疎であった方が邪魔が少ない分、相対的に良いのかもしれない。
その根拠に狭い部屋の側方以外の響きが心理的評価で軒並み悪かった実験のインパルス応答が下図で

-2dB減衰させた条件でも余裕で-25dB超えてしまっている。
他の時間帯の都合上密に受け入れるなら、時間軸に沿って-25~35dBまでしっかり減衰する、つまりこの時間帯に残響まで細分化すると聴感上良くなると思われる。

4.81~150msの中期反射音をどうするか。
早期と後期の間である。直接音とは完全に分離しているのでカラレーションは無視して良いだろうけれど音圧付加は期待できる。

①反射音を受け入れない。
この時期にヘタに音が入ってくると不明瞭感や煩わしさを感じる作用があるが、反射させなければそう感じることはない。デメリットとして音圧上昇や距離感を得られない。
早期で受け入れて中期は受け入れないという選択肢を現実に得られるかという、現実的な問題はあるが、荒い拡散を多用すると中期反射音が残響音まで分解されて反射音としては知覚されないことを期待はできる。

②反射音を疎に受け入れる。
カラレーションは無視して良い時間帯なのでそのデメリットは無視して良い。音圧を補強し、繋がりのある音楽では滑らかな好印象を与えるが、歯切れのいい音の歯切れが悪くなったり、音量が大きすぎると不快である。横方向で不快感を感じやすい。疎で小さければそれらの悪い印象も減るとは思われる。

③反射音を小さく密に受け入れる。
音圧補強し滑らかさを与えるが、歯切れが悪く、この時期の密な音は不快に感じやすい。

5. 残響音をどうするのか。
残響は再生音とは別に知覚される。そのため包まれ感という早期の音だけでは表現できない世界を表現できるがノイジーに感じてしまう可能性のある成分である。

①残響音を作り出さない。
ソースの残響だけを使う方法である。部屋から生まれる残響のノイズ感がなくなりS/Nは良くなる。当然ながら響きが足りない印象は出てしまう。

②残響音の量は確保するが長くしない
積極的に残響を確保して包まれ感は期待するが、長いと次の音にかぶってしまい明瞭さが減少してしまうのでほどよいところで消えてしまい長続きさせない方がいいという考え方。

③残響音を大きく長く取る。
包まれ感をしっかり得るために残響を大きく長くしっかり確保する考え方。
そもそも小空間で得られる残響の長さと大きさは限界がある。最大限得ようと努力しても大した量は得られないので積極的に作り出しても良いとも思える。
ただ豊富であればあるほど不明瞭な音になるので現実的に良いと知覚されるのか悪いと知覚されるか分からない。



論点をまとめてみたが自分の考えるアプローチは以下になる。
1.Non environmentは選択しない。ステレオ再生では現状残響に明らかな問題があるからである。
2.初期はかなり厳選しながらも受け入れる。15-40msのタイミングで15dB以上減衰させて受ける。側方や正面が一次反射を除外することになるだろうが二次反射以降を積極的に利用する。第一波面の法則が成立するので細かく密になってもデメリットがなくコムフィルタ効果の軽減が期待できるので中等度の拡散で反射は分割して受け入れる。
3.早期はなるべくある程度拡散して、この時間が始まる前にしっかり-25dBは減衰させる。不十分であれば、さらに細かい拡散や吸音も併用する。
4.中期は疎で小さく受けて音の滑らかさを得るのもいいが、歯切れの良さの方が自分は重視したい。この時期の反射音はメリットにもなるがデメリットとなる場合も多い。不十分な拡散処理でもこの時間帯には残響になることが期待できる。なので中期反射音は残響音に変えてしまい、反射音レベルの大きさでは受け入れないのが良いと思われる。
5.残響時間は無理に長く取らなくてもいいと思われる。S/Nの確保が最大の目的である。中期反射音の時間帯に既にLEVを感じるような残響状態にして、結果的に残響と感じる時間を確保する。
吸音を最小限にしたらあとは部屋の容積の問題になるのでその量を受け入れる

インパルス応答としてはこんな設計図を思い描いている。


積分するとこうなる(わかりにくい)


他の室環境と比較


部屋のイメージとして無駄が多いのでこうはしないのと思うが音の流れ方としてはこんな感じをイメージしている

目的は正面と背面、天井はなるべく側壁に当たりやすく、リスニングポジションには入りづらくする。
前後方向の音の動きは前→後の方向が動きやすい。
というのが目的である。
内側からの反射音よりも外側からの反射音の方が有用なことが多いため。背面からよりも正面からの反射音の方が有用なことが多いため。リスニングポジションに入る反射波の数を減らすため(クサビの頂点の正面は少ない)である。

一通り読んでみてこういうスタンスで行くのがいいのかなと自分のスタンスを作ってみた次第。
あとはどうすればこういう音が作れるのかというシミュレーションを行っていく。