以前に時系列データの定常・非定常に関する記事を書きましたが、この内容
がシックリこない方も多かったのではないかと思います。そこで、実例を踏ま
えた解説を追加しますね (^-^)/
この時系列データと定常・非定常と分布の知識ってのは近似モデルを構築す
るに必須だけではなく、
分析精度に関わる Σ(゚д゚;)
のですね。なので、何で定常じゃないといけないのか?何で分布を考えないと
いけないのかを把握しないといけないのです。
今回の記事に関する過去の記事は下記リンク先を参照してくださいね!
参考 : 差分と和分と市場分析
参考 : 階差と差分
参考 : 定常過程と非定常過程
参考 : 非定常な時系列が分析に適さない理由①
参考 : 非定常な時系列が分析に適さない理由②
【簡単な事例で理解する】
まずは適当に時系列データを作成して、その時系列データを基に解説していき
ますね。条件としては、
・ 作成した時系列データは非定常
・ 対数をベースに考える
とします。まず適当な時系列を以下に示しますね (^-^)/
この時系列データを価格ベースと対数ベースで各々表示してみますと以下のよ
うになります。
そして時系列データのモデルとして以前も解説した下記のモデルを採用します。
μは誤差項となります。誤差項とはXtが定まった時のXt-1との階差になるので、
となりますよね。誤差項が属する分布は今は考えないようにします。とりあえず
与えられた時系列データにて計算しますと、
となり対数で扱っても階差と同じ値になります。(小数点はありますが・・)となれば、
となりましたよね。これすなわち、 X tは X0 と各誤差項である μ で構成される
ことになり、
となるわけです。これを再現してみますと、
となり無事に元の時系列データへと戻りました。でも、これって当然といえば当然で
すよねえ。変に話を難しくしているだけな感じもします。でも違うのですよ!
注目すべきは μ がどのように決まっているか?
です。例題では時系列データがあるので計算ができるわけです。なので、 X6 の時
系列データはいくつ?と問われた時に答えられる人はいないわけです。モデルとして
は、
となるので、 μ6 の値が決まれば予測できます。でも、これを相場に置き換えれば
無理な話ですよね?その無理な話に対して投資家の皆さんは情報や分析を駆使して
挑んでいるわけです。
【なんで分析精度に関わるの?】
時系列データをモデルによって再現したわけですが、再現しても次に来る値は予測で
きていません。ではどうするのか?
ここで定常・非定常が関わってくるのですよ。おさらいですが、
定常 ⇒ 平均・分散が一定
非定常 ⇒ 分散が無限大
でしたよね?そして、時系列データが非定常であっても、その時系列データの階差をと
れば階差は定常になる可能性高いと解説しました。そして μ は、
となる階差であるため定常と考えられます。つまり、 μ は平均・分散が一定と仮定さ
れるわけです。ということは・・・
平均と分散が与えられたら次の値の可動領域が判明 (ノ゚ο゚)ノ
するわけです。では時系列データ範囲で平均(AVERAGE関数)・分散(VAR関数)・標準
偏差(STDEV関数)を求めて95%範囲での X6 の予測値を示してみましょう。
こんな感じになりました。どうやら X6 の値は109~117の間に収まる可能性
が95%の確率であるようです。
でも・・あれ? 計算と、使った関数・・・それって正規分布で仮定したのです?
と思われる方もいるかと思います。そうなのです!勝手に正規分布を仮定して
予測値を出してしまってますが、
予測には想定する確率分布が必要 (^O^)/
なのですよ。よって想定する確率分布によって予測値の可動領域が変わってく
ることがわかります。ここでちょっとまとめましょうか (^O^)/
ⅰ) モデルを想定
ⅱ) 時系列データを階差で定常化
ⅲ) 平均・分散を決定
ⅳ) 確率分布を決定
ⅴ) 予測
※ ⅲよⅳは同列
この流れが時系列データと階差と分布の扱い方の事例となるのですねえ。これ
が非定常なままであったなら分散が無限大になるために予測は難しくなるわけ
です。どの期間のパラメータも全く意味をなさなくなりますからね・・
【で、分析に応用するには?】
ここまでの内容は未知の価格に対する可動領域の設定ということで、リスク管理
には役立つかもしれませんが売買で利益をあげるには不十分ですよね。現在の
価格に対して上下の可動領域が示されても売買できないですからねえ。
では全く売買を有利に導く分析には使えないのか?
実はそうでもないのです。ヒントはモデルにあり、
こういった固定化された初期値をベースに価格を組み立てていく方式が大いに役立
つのです。もちろん確率分布も意識しての組み立てになるのですが、
近似値かもしれないけど遅延が少ない近似値の作り方 o(^▽^)o
という面で参考にしなくてはいけないのです。補完を兼ねて記事なので分析への応用
については以上で終えますが、内容は新たに記事にしていく予定です。