定常・非定常が出てくると話がちょっと難しくなりますが、可能な限り
砕いて解説します。
「非定常的な時系列データに対して統計解析を施しても誤差が大きい
結果が出力される可能性が高いことから時系列データを定常化する
必要がある」
ということについての追加解説を行います。予定では時間がある時に
今回の記事を書こうかと思っていましたが、多くの方が現在行っている
分析が間違っているのではないかと不安に思われていることから先に
解説することにしました。
今回の記事に関する過去の記事は下記リンク先を参照してくださいね!
参考 : 差分と和分と市場分析
参考 : 階差と差分
参考 : 定常過程と非定常過程
【時系列モデルから考える】
まず話を進めやすいように時系列をモデル化して考えます。ちょっと数式
を扱いますが流れだけを追ってもらえれば良いかと思います。まず、時系
列モデルとして、
とします。ホワイトノイズ的な誤差は標準正規分布みたいな分布と思ってく
ださい。本来の価格変動は冪分布的な分布ですが、分布形状としては近似
的なので的外れな仮定ではないと思います。ということで、現在の価格は前
の価格と誤差項によって、
と表すことができます。この表現はランダム・ウォークになり非定常です。非
定常の特徴は平均や分散が一定ではないことです。
ちなみに上記のモデルは隣り合う値の2点のみなので、あらゆる時点を表す
形式に変形します。変形は、
と実際に t に値を入れていくことで行います。次々に展開していきますと、下
記のようにX2にはX1が代入でき、X3にはX2が代入と次々に代入できますよね。
ということは、
と表現し直すことができます。ついでにXt-1の表現も載せておきました。
では上記 Xt のモデルから非定常かを確認する為に平均と分散を期待
値計算で導きます。計算は省略しますね (^-^)/
計算すると上記のようになります。分散σ^2に時間tがかかっていますよね。
つまり時間と共に分散が無限大となり非定常となるわけです。じゃあ、定常
にするために階差をとったらとなりますが、本当に階差をとったら定常にな
るのかも計算してみましょう (^-^)/
階差は、
となります。ここに変形した時系列モデルを代入しますと・・
となりホワイトノイズ的な誤差項だけが残りました。ホワイトノイズは定常な
ので晴れて定常化されたのですねえ。実際の価格変動はホワイトノイズや
正規分布ではないと考えられていますが、複雑な動きを表す分布の近似系
として考えれば上記モデルによる非定常・定常に関する計算結果は間違い
と言い切れません。
これで「階差」を取ることがモデル的にも定常化の手段として有効そうだとい
う背景が得られました。
【非定常だと何がまずいのか?】
上記計算において分散が無限大になってしまうことが統計解析にとって非常
に都合が悪いのです。例えば、
回帰分析 (ノ゚ο゚)ノ
回帰分析における分析は分散がベースとなっていますよね?回帰分析に関し
ては下記記事を参照してくださいね (^-^)/
参考 : 回帰分析の知識一覧
そして回帰分析を行う時系列データが非定常であるということは分散が無限大
である可能性が高いことから、
分散が無限大となる可能性があるのに
分散をベースで解析していいの?
という疑問が湧いてきます。過去から現在にかけては結果であるため過去の傾
向を示すだけなら問題はありません。でも、
未来にかけて分散が無限大になるので
あれば解析による予測は大きな誤差を
伴うため無意味 ( p_q)
となります。無意味とは言い過ぎかもしれませんが、誤差が大きくなる可能性があ
ることから、回帰分析から得られた情報を基に予測を行うことには躊躇してしまうで
しょう。そして、
非定常な時系列データが引き起こす「見せかけの回帰」
Σ(゚д゚;)
という問題が発生するのです。これは、本来、無関係であるはずのデータ間にあ
たかも関係が存在するかのような結果が出力されることです。怖いですねえ・・・
もちろん非定常が関わる問題は回帰分析だけではありません。というのも、
分散が無限大ってことは標準偏差も無限大
であることから多くの統計解析がアウトになる可能性あるということです。何とも
恐ろしいことですよねえ。例えば、
売買戦略の性能をエクイティーカーブから測る
場合は統計的な側面から考える場合が多いのですが、エクイティーカーブが非定
常な場合は統計的側面からの判断が適切かどうかわからなくなりますよね・・
ということで、非定常な時系列データは分析に適さない可能性あるということになる
のです。
また、時系列解析に関する解析も非定常による影響を受けます。例えばフーリエ
解析です。フーリエ解析から導かれる周波数情報自体は問題ありません。問題に
なるのは、
得られた周波数情報を基にした予測 Σ(゚д゚;)
です。観測した区間のパラメータは、観測区間に対しては有効ですが、未来に渡っ
ての予測としては有効ではないことになります。
ただ、
勘違いしてはいけない部分は、
非定常にて生じる問題は、多くは未来に対しての予測部分
であり過去の時系列データへの分析ではないということです。予測をしないというこ
とであれば、過去に対する分析は非定常な時系列を直接使用しても良いでしょう。
まあ分析の意味がなくなってはしまいますが・・
【まだ続く・・】
長くなるので区切って新たな記事で解説を続けますね!