『こうしたことが起こる理由の1つは「見せかけの相関」である。経済分析において最もよく利用される推計方法は線形モデルによる回帰分析であるが、時系列データを扱うときデータに強いタイムトレンドがあれば、変数間に何の関係がなくても相関があるかのような回帰結果が表れる。このようなことは直感的にもわかりやすく、注意深い研究者ならこのような見せかけの回帰(相関)が生じるような推計は避けるであろう。』(日本のマクロ変数の単位根検定より引用)
これを、もう少しわかりやすく書くと、データを解析してそれぞれのデータ間の相関関係を見比べる場合に、タイムトレンドがデータに含まれていると、そのタイムトレンドの影響で他のデータ間で、本来関係のないものまで相関があるように見えてしまうということですね。
「タイムトレンド」とは、時系列データにおいて、時間の経過によって一定幅の増加や減少があることですね。経済成長や人間の身長や体重など、基本的に右肩上がりとなっているものは、そのデータにタイムトレンドが含まれていることになります。
この見せかけの相関についての具体例を照会します。
平成25年の総務省統計局による年齢別の握力と視力についての相関を調べてみます。
・握力…年齢別の握力の平均(単位はkg)
・視力…年齢別の視力が1.0未満の割合(単位は%)
このようなグラフになります。
このグラフから考えると、「視力が悪くなるほど、握力は増加する。」という回帰(相関)があることがわかります。
これって、どうでしょう?グラフから考えると正しいように思いますが、なんか一般論としておかしくないですか?
これは、「年齢の増加によって、握力が増加する。」、「年齢の増加によって、視力が低下する。」という
タイムトレンドの含まれたデータということになります。
そうすると、この「年齢の増加によって」の部分(タイムトレンド)をそれぞれのデータから取り除いて、分析しないと
本当の意味での握力と視力の相関関係があるのかどうかがわからないということになります。
今回は、握力と視力という身近な例をあげましたが、これを相場に当てはめた時に、果たして一般的な違和感を持つことができるのかどうか?
というと、もしかすると本来まったく相関関係のないものを根拠にルールをつくっている可能性もあります。
これが、一定の期間でルールを検証し優秀な成績だったものが、違う期間でまったく結果を出せないという原因のひとつかもしれません。
長期で右肩あがりになっているような相場では、ストップを大きく許容するようなパラメーターで、買いをメインにしたシステムは、当然成績が高いことになります。ただそれは、背景に右肩あがりの「タイムトレンド」がある状況なので、言ってしまえば、「買いメインのシステム」なら何でも勝てることになります。よって、そのシステムをそのタイムトレンドのない相場で使用したり、タイムトレンド自体が崩れてしまった相場では、成績をだしていけないことになりますね。
