2022年7月4日14時51分に流量制限を全て解消した模様。
今回、4日12時18分~13時18分にVolte交換機全国にある18台中6台のVolte交換機が加入者データベースに過剰なトラフィックを流していることが判明し解列したらしい。
これにより正常なトラフィックとなり流量制限をなくせたようだ。
これからはなにもせずに待つらしいが
私のメールなどにあるように各社色々あるのを対応するのがあるかもしれない。
ちなみに私はおっかけてなかったので分からなかったが
前回のドコモの障害はIotがらみ、
前回のソフトバンクの障害はライセンスの期限がらみらしい。
一応auでもドコモの対策として
Iotは既に別サーバ化しており、
Volteも何らかの対策はしていた模様。
ソフトバンクは輻輳ではないので今回の件にはからまない。
また今回の事象は1台のサーバの交換作業で
通信障害発生の為、切り戻ししたが
15分程の作業中に以下の現象が順に起きた。
1.VoLTE輻輳
2.加入者データベース輻輳
3.加入者データベースの不一致
この3つの問題で事象が拡大していったとのこと。
また復旧作業は総務省の指示により
豪雨である沖縄を含む西日本を優先的に行った。
ここからは私の妄想である。
また以下述べることは今回の現場旧多摩ではなく
静岡の件です。お間違いなきよう。
また今回は新多摩のサーバーで助かったらしいですね。
では始めます。
こういったサーバーには等値化というシーケンスがあると思われる。
私の会社のもよくやり問題となるのだが
個人の適当な判断で1台をメンテナンスする際に
特定の1台かどうかは不明だが何らかの設定を勝手に変えていくことで
等値化が正常に行われず狂っていくことはありそうだ。
(作業終了後で間違いに気付き、設定を戻してしまい、壊れていく可能性も大)
実際に何をやって壊れていくのか
私も現場にいなくて分からなかったが
他のサーバーと設定を合わせればよいわけではないと思われる。
等値化の手順もありそうで
途中で一時的に設定を変えながら等値化する場合
待たないと正常にならないのに待てないと壊れてしまう。
また今回みたいに停止出来ない場合は
また大変な気がする。
そうかといって例えばVolteを全て止めようとしても
音声もパケット上に乗っかってしまっている以上
なかなか難しい。
私はVolteの音声発呼シーケンスを知らないのでよく分からないが
もしかしたら発呼を全て禁止出来たら止められますけど出来るのですかね。
Volteはキャリア4社で全て違うらしいので
詳細は分からないのかもしれませんが
こういうのは統一してもよいのかもしれませんね。
いずれにしても音声のシーケンスも色々ありすぎて分からないです。
有線サービスでさえ音声シーケンスは沢山あるのでよく分からないのに
無線サービスでも沢山あるとよく分からないです。
公開されていないのかもしれませんが少しお勉強してみるかな。
あ、今回は加入者データベースなどの不一致ですか。
そうなると全ての利用者の通信を止めないといけなくなるので
止めるのは無理ですね…。
とりあえずSIPなのか分からないがS-CSCFを使用していることまでは判明しました。
今回、4日12時18分~13時18分にVolte交換機全国にある18台中6台のVolte交換機が加入者データベースに過剰なトラフィックを流していることが判明し解列したらしい。
これにより正常なトラフィックとなり流量制限をなくせたようだ。
これからはなにもせずに待つらしいが
私のメールなどにあるように各社色々あるのを対応するのがあるかもしれない。
ちなみに私はおっかけてなかったので分からなかったが
前回のドコモの障害はIotがらみ、
前回のソフトバンクの障害はライセンスの期限がらみらしい。
一応auでもドコモの対策として
Iotは既に別サーバ化しており、
Volteも何らかの対策はしていた模様。
ソフトバンクは輻輳ではないので今回の件にはからまない。
また今回の事象は1台のサーバの交換作業で
通信障害発生の為、切り戻ししたが
15分程の作業中に以下の現象が順に起きた。
1.VoLTE輻輳
2.加入者データベース輻輳
3.加入者データベースの不一致
この3つの問題で事象が拡大していったとのこと。
また復旧作業は総務省の指示により
豪雨である沖縄を含む西日本を優先的に行った。
ここからは私の妄想である。
また以下述べることは今回の現場旧多摩ではなく
静岡の件です。お間違いなきよう。
また今回は新多摩のサーバーで助かったらしいですね。
では始めます。
こういったサーバーには等値化というシーケンスがあると思われる。
私の会社のもよくやり問題となるのだが
個人の適当な判断で1台をメンテナンスする際に
特定の1台かどうかは不明だが何らかの設定を勝手に変えていくことで
等値化が正常に行われず狂っていくことはありそうだ。
(作業終了後で間違いに気付き、設定を戻してしまい、壊れていく可能性も大)
実際に何をやって壊れていくのか
私も現場にいなくて分からなかったが
他のサーバーと設定を合わせればよいわけではないと思われる。
等値化の手順もありそうで
途中で一時的に設定を変えながら等値化する場合
待たないと正常にならないのに待てないと壊れてしまう。
また今回みたいに停止出来ない場合は
また大変な気がする。
そうかといって例えばVolteを全て止めようとしても
音声もパケット上に乗っかってしまっている以上
なかなか難しい。
私はVolteの音声発呼シーケンスを知らないのでよく分からないが
もしかしたら発呼を全て禁止出来たら止められますけど出来るのですかね。
Volteはキャリア4社で全て違うらしいので
詳細は分からないのかもしれませんが
こういうのは統一してもよいのかもしれませんね。
いずれにしても音声のシーケンスも色々ありすぎて分からないです。
有線サービスでさえ音声シーケンスは沢山あるのでよく分からないのに
無線サービスでも沢山あるとよく分からないです。
公開されていないのかもしれませんが少しお勉強してみるかな。
あ、今回は加入者データベースなどの不一致ですか。
そうなると全ての利用者の通信を止めないといけなくなるので
止めるのは無理ですね…。
とりあえずSIPなのか分からないがS-CSCFを使用していることまでは判明しました。