DOCONOのオーディオ礼賛 -154ページ目

ネットワークオーディオ追求編3: Ethernetの仕組みの音質への影響

Ethernetの規格の概要

ネットワークオーディオでは、LANケーブルを使って送られる信号の形式や符号化の方法の違いによっても、音が変わることがあります。現在の標準ネットワークは通常、Ethernetを使います。これは、IEEE802.3で規定された規格で、遅い方から、10Base-T、100Base-T、1000Base-T、10GBase-Tなどがあります。実はこのプロトコル毎に符号化の方法が異なっており、遅い規格ほど単純で頑健な仕組みを使って居ます。下表は、それぞれの符号化方式と、伝送方法、帯域、特徴をChatGPTを使って表にしたものです。

規格	符号化・変調	使用ペア	帯域	本質
10Base-T	Manchester	2ペア	～10 MHz	超単純
100Base-T	4B/5B → MLT-3	2ペア	～31 MHz	低帯域・安定
1000Base-T	PAM-5 + DSP	4ペア	～125 MHz	複雑化の始点
10GBase-T	PAM-16 + LDPC	4ペア	～500 MHz	極端

比較的単純な動作の10Base-T と 100Base-T

10Base-Tは送る電圧値は2値のみ。電圧が高いところから低く変化すると0、逆に低い電圧が高くなると1を表します。ですから、1つのデータは2つの電圧（2clock分）で成り立っています。また、信号線は2組のTwisted Pairが用いられ（ちなみに10Base-T、のTはTwisted PairのTです）、片方が送信用、片方が受信用です。

100Base-Tになると、電圧は、高ー基準点ー低　と言う3値を取るようになります。符号化はMLT-3という符号化の仕組みを使っています。この仕組みでは、電圧が変化した場合に1、変わらなかった場合に0と判断します。例えば、1011と言うデータは、今の電圧が基準電位にあるときには、クロック毎に、基準→高→高→基準→低と電圧が変化します。この説明でもわかる様に、仕組みとしては単純ですから、ノイズにも強く、かつ、器機への負荷は極めて小さいという意味ではオーディオ信号という事に限れば非常に有利に働きます。100Base-Tでも2組のツイステッドペアの信号線を使い、片方は送信用、片方は受信用です。

この、10Base-T、100Base-TはICの性能が非常に低かったときにできた規格です。従って処理そのものが非常に軽く、器機が受ける電源負荷が小さいために処理に伴う、電力需給の揺れが非常に小さいというオーディオにとっては非常にありがたい特性があります。

ただ、残念ながら、10Base-Tは遅すぎてオーディオデータであっても厳しいです。少なくとも一般的な192kHzまでのストリーミング用途であれば、100Base-Tで帯域的に困ることはほとんどなく、音質面では有利に働く場合が多いと感じています。

膨大な数学的処理が必要で消費電力の波が大きい1000Base-T

1000Base-TはPAM-5という-2、-1、0、＋1、＋２の五つの電圧値を使う符号化にDigital Signal Prossessing/Prossesorと言う信号の読み取り演算に特化した装置を用いて、実際の信号がどの値を取っているのかを常に確率的に推計しながら通信を行っています。

100Base-TXでも最低限のデジタル処理は行われますが、1000Base-Tと比べると演算量は桁違いに少なく、回路構成も非常に単純です。1000Base-Tになると桁違いに演算回数が増え、1秒間に数十億回の演算を常に行いながら通信を行っています。ここが前2者とはまるで違う仕組みです。1000Base-Tは通信速度が1Gbpsを達成するために物理的な限界を数学的に補って、何とか1Gを達成している、と考えて間違いありません。

実際にEthernetで使われる4組のツイステッドペア銅線を伝わる信号は、矩形波はケーブルが持つ線間容量やインダクタンスで乱れ、一本のケーブル内の他のツイステッドペア銅線からクロストークを受け、さらにEthernet端子のところで信号波が反射して乱れ、さらには自分が送信した信号の反射にも乱されてかなりぐちゃぐちゃの状態なのです。これをアナログ回路で成形して読み取ることは不可能で、サンプリングと、リアルタイムの高速演算処理を行い、その信号が5つの値のうち、どの値が最も確からしいのかを確率的に推計して読み取っているのです。

そのため、1000Base-Tでは多くの電力を必要としますし、外部条件などの乱れによって演算回数が大きく変動し電力需給を揺らします。またケーブルによっては、反射が多かったり、信号の電圧が乱れたりして、さらに演算回数が増えてしまい、データとしては普通に1Gで送れる物の、演算による負荷の増減が激しく電源電圧を荒らしてしまい、結果として、器機内のノイズを増加させ最終段のクロックや出力信号の品質に影響してしまうことは否定できません。

実際にはプロセッサの速度は以前に比べて飛躍的に向上しており、1000Base-Tであっても余裕を持って処理できていると思うのですが、ただ、究極の所ではやはりジッター等に影響しているのだろうなと思うのです。

プレーヤーとの接続で100Base-Tが音が良くなることが多い理由

ですから、Ethrernetでオーディオ信号をやりとりするのであれば、少なくとも対プレーヤーは、設定可能であれば100Base-Tを用いた方が音が良い場合が多いと思います。実際、私はDELA S1のストリーマーに信号を送り出すLAN端子のみ100Base-Tに設定しています。これはそうするとはっきりと音が良いと感じたからです。

実際、この感覚はここまで述べたようなEthernetの仕組みを知ると、実は十分にあり得ることなのだということがわかります。100Base-Tは受け取り後の動作が軽いために、プレーヤー側の負荷が非常に小さくなるのです。そのことが音が良くなる理由では無いかと考えています。

DELA S100/2では一つの端子が100Base-Tに設定されており、そこにプレーヤーやストリーマーを繋ぐとプレーヤー側の負荷が減るため音質が向上することがあるかも知れません。もし、こういった器機を持たれている方は是非試してみることをおすすめします。

とは言うものの、データは完全に保たれている

最後に、誤解がないように申し上げたいのは、Ethernetを使う限り、データの完全性は保たれているという点です。
したがって、高級なオーディオ用LANケーブルを使おうが、非常に安価なLANケーブルを使おうが、送られるデータそのものは同一です。

ただし、物理層を流れる実際の電気信号の波形や状態は、ケーブルや環境によって異なり得ます。
違いが出るとすれば、そうした信号を受け取り、データとして復元する際の計算量や処理負荷の部分であり、それが音質に影響しているのではないか、というのが私なりの仮説です。