小職の研究テーマにはいろいろありますが、メインチャレンジとも言えるテーマは、
ストラディバリやグァルネリ・デル・ジェズなどに代表されるオールド・ヴァイオリン(Antique Violin)の音がなぜ良いといわれるのか。
先に、結論から言えば・・・
”まだよく分かっていない”
学術的な言い回しをすれば、明らかにしたいこと(リサーチ・クエスチョン)は、次のようになるでしょう。
1.「ストラディバリの楽器は良い音がする」といわれるが、何をもって良いといわれているのか?
2.その良いとされる音はどういうメカニズムで発生しているのか?
3.その良いとされる音を出せるヴァイオリンはどうやって作ったらよいか?
1の「良い」と言っているのは、音色が良いのか、大きな音が出るのか、操作性が良いのか、見た目が美しいのか・・・
細かな引用や議論は今回は読みにくくなるので止めておきますが、そもそも楽器において「良い楽器」とは以下の優位性が認めらえるときでしょう。
(a)音響的特徴
(b)操作性
(c)美的外見
(d)歴史・文化的な価値
(e)金銭的な価値
(a)(b)はこの記事の中心的なお題であるのですが、(c)~(e)についてもストラディバリのようなオールド・ヴァイオリンの評価に大きな影響を持っています。
実物のストラディバリやグァルネリらの楽器を手に取ってみれば、300年という時間により熟成した美しさと存在感があります。この点は古い絵画や仏像などでも容易に想像がつくと思います。だから、アンティーク品としての価値があり、そういった楽器は素晴らしいと評価され高値で取引されます。
さて、戻って(a)と(b)について話を進めると、この2点はもちろんこれまでにも多くの学者が手がけてきました。1970年代にハッチンスらのように科学的なアプローチが盛んになり、もう既に50年が経ちますが、いまだに科学的に明らかになったオールド・ヴァイオリンの優位性はないです。むしろ、フリッツらの実験のように、新作ヴァイオリンとオールド・ヴァイオリンの弾き比べ実験で有意性なし!といった報告も出ています。
ここで「科学的に」といっているのは、例えば、数値で点数化されているとか、統計的な比較がされているとか、式でモデル化されたか、といった客観的な指標で定量的に判断されたかどうかということです。音を聞いたことによるアンケート評価は主観評価といって、これも立派な科学的手法ですが、その場合は統計の母体の量と質が問題になりますので、説得するには相当のサンプル数と厳密さが求められます。
(a)の音響的特徴の優位性について考察してみましょう。
楽器の音は、「音の高さ」「音の大きさ」「音色」といったいわゆる音の三要素で分けて考えられますが、それにさらに時間的な変化のパラメータ(例えばADSRモデル:楽器を演奏したときの立ち上がり-減衰-保持-余韻)で人間は知覚します。

これらのうち音の高さと大きさは、どのバイオリンでも弾き手による入力値であり数値的に計測が容易で、高い音が出やすいとか、大きい音が出るとかは(b)の方の議論になりますので後述します。
3つ目の「音色」がこれまた曲者で、定量的な評価がそもそも難しい尺度なのです。
人が楽器の音色を知覚するとき、ADSRモデルでいうところの
i) SR区間のパワースペクトル
ii) A区間の立ち上がりの波形
で決まると思われます。
一つ目は音波の周波数解析(フーリエ解析)を計算することで、パワースペクトルという周波数帯域ごとの強度が分かります。
このパワースペクトルが違うと人間は「音色が違う」と知覚することは分かっています。


スペクトル包絡とは↑左図の赤い線で、パワースペクトル(青線)の概略線と考えていただければいいのですが、最初のピークから順に(音声ではフォルマントという)F1、F2・・・として、その周波数を基音の何倍かとして計算したグラフが右になります。
この例でいうと、ストラドとロッカの音色は似ていてファニオラは似ていないと知覚されます[2]。
しかし、パワースペクトルの値がどういう状態だと「深い音」「豊かな音」といったような音色の表現語に相当するのかということはよくわかっていないのです。もちろん「いぶし銀の音」なんて何のことやらで、人間の感覚ではイメージできても音響解析での明確な説明はつかないのです。もっとも、ストラディバリらしい音色とかグァルネリらしい音色とも聞きますが、それはあくまで主観的な思い込みです。その人が経験としていくつか聞いた音の記憶の中からイメージしているわけです。だから、他の人は別の経験による音源のサンプルでストラドvsグァルネリの音色のイメージ像を持っていることになります。
そして、もっと厄介なのは、このパワースペクトルは変化自在な数値だということです。現実的にはひと時たりとも同じ結果にはならないのです。再現性がないといいます。弓や弦や松脂の違いはもちろん、弓の当て方が変われば違いますし、そして奏者、ホール、録音しているマイク…全てがパラメータになるのです。
じゃあ、パワースペクトルなんか測ってどうするのよ?ということになりますが、まったく無能というわけでもないのです。
条件を極力そろえて、統計的に多くのデータをとって調べてみると、製作者の特徴が現れる可能性が期待できるからです。
筆者としては、さきほどのパワースペクトルの概形(スペクトル包絡)が音色の違いの弁別に使えるところまでは証明してきたのですが、まだストラディバリとその他の楽器の区別ができるところまではいってません。しかし、上述のADSRモデルのうちD区間~R区間で実験したところニューラルネットワーク(CNN、VAEなど)を使って、条件を限定したうえでストラディバリとその他の区別ができる可能性は示してきました。
あと残る2つ目(A)の立ち上がり区間=すなわち日本語で言えば子音に相当する短いノイズのところを解析する課題が残っています。ここになにか特徴があるのではないかとにらんでいますが、この短いノイズ区間は解析は難しいのです。
(b)の操作性について。これが演奏者が感じる最も重要な点ではないでしょうか。
これは楽器の振動特性でもあり(a)の音響特性にもつながります。
小職が考えるに、演奏者が言うオールド楽器に対する褒め口上を工学的に言うと次のように変換できそうです。
よく、反応が良い、意図を忠実に表現してくれる、という表現を聞きますが、これは、音の立ち上がりが早い、すなわちADSLモデルのアタック区間で短い時間で目的の振動の振幅に達することと説明できます。
擦弦楽器では、弓で弦をこすることで楽器本体が振動しますが、すぐには大きく振動できません。弾き始めて何回かの周期的な振動を与え共振によって大きな音が作られます。反応が良いということは、早く共振がすすみ大きな振幅が得られることですので、楽器の素材の内部抵抗が低いことを意味します。自転車をイメージしてもらえばいいのかもしれませんが、ペダルをこぐ時に抵抗が大きいとなかなかスピードが上がりませんよね。
内部抵抗は木材の組織内にある含水量(自由水、結合水)や細胞組織の並びが影響し、それが木材内部を伝わる内部音速の速さになります。
そして、楽器を弾いていて心地よいと感じるのは、その適度な残響です。これも内部抵抗によりますが、抵抗が大きければ振動を妨げるので早く振動が減衰し残響時間は短くなります。そうすると、演奏者は「響が悪い」楽器という印象を持ちます。
じゃあ、内部抵抗が低くければ低いほど、また内部音速が速ければ速いほどいいかというと、そうでもなく、"適度"な値である方が良いのです。つまり、抵抗が低く音速が速いとはいえ金属やガラスのようなカチコチの素材では、高調波成分が勝ってしまい、そういった周波数特性の音色はキンキンした音の印象になってしまうのです。バイオリンのような楽器の音色は、力強さや柔らかさはあまり高調波が多くないときにそのような印象を感じられる傾向にあります。
このような、発音の良さ=立ち上がり区間における速さ、そして演奏者が感じる反応の良さはどうやって計測したらよいか・・・
おそらく、筋電センサ―を手に付けたりボーイングマシンによる定量的な音響計測が期待されます。(いま試行錯誤中)
ちょっと長くなってしまいましたが、後半で書いた立上り区間での分析は、もう少し明らかになってからまた続きを書きたいと思います。
[1] CM. Hutchins, Research Papers in Violin Acoustics, 1975-1993: With an Introductory Essay, 350 Years of Violin
[2] M.Yokoyama, Possibility of distinction of violin timbre by spectral envelope