日記帳 -15ページ目

時系列分析の教科書（９）

昨日の続きをやっています。

○ビジネス・サーベイ

景気全般についての判断を企業に直接調査したもの。

ニュースで「景気がよいと回答した企業の割合は～」とやっているのがそれでしょうか。
ここでは日銀短観の説明が載っています。

項目だけみると「うわっ回答大変そうだな～調査来たら嫌だな」と思ってしまいそうですが
3つの選択肢から回答するようなので、コストかかるから出さないという選択肢には
なり得ないようになっているようです。

今日はあまり進みませんでしたが、明日には今の章を終わらせたいと思います。

時系列分析の教科書（８）

循環変動のところに来ています。

今日も「わからず」だらけの日記になりそう・・・

循環変動の推定で「季節変動とトレンドの除去」はまぁそうなんだろうなと思えますが
「コレログラムで推定」がよくわからず・・・

よくある右下がりの絵ばかり見てるからでしょうか？？
長い期間をとって変動に一定の周期性が見られれば捉えられるということ？
トレンドをとった後の系列に対する自己相関？

コレログラムの次は「ペリオドグラム」なるものが出てきました。
サインコサインタンジェントの世界で数学オンチな私にとっては嫌な話ですが、
周期を表すには自然かもしれないですね。

よく理解できていない状況ではありますが、コレログラムとペリオドグラムの分析は
「スペクトル解析」と呼ばれるそうです。名前だけは聞いたことがありました。
後の章で詳細な説明があるということなので、一旦先に進みます。

次はマクロ経済学で「横文字は覚えられない！」と嘆き苦しんだアレが出てきました。

【景気循環】
・コンドラチェフ・サイクル（長期変動）　→「コントラバスみたいなものは大きい」
・クズネッツ・サイクル（建築循環）　　　→　変換なしで記憶
・ジュグラー・サイクル（設備投資循環）　→「島袋さん」（ジャグラーやる人）
・キチン・サイクル（在庫循環）　　　　　→「キッチンに在庫がある」

上から長⇔短となっています。一回建てたらそうそう建て替えないですしねぇ

景気の判断・予測のための景気指数：DI（ディフュージョン・インデックス）
経済を代表する包括的な系列を用いる。
季節変動のパターンが一定で、季節調整済みであり、速報性のある系列であることが必要
とのことです。

どんな系列が各系列に入るかの例も載っていたのですが、
先行系列：新規求人数、一致系列：有効求人倍率、遅行系列：完全失業率（いずれも学卒除く）
なのはイメージしやすかったです。

そういえば基礎統計の宿題でこんな図を作ったりしました。
転換点にグレーで印をつけているようなのですが・・・

眠くなってきました・・・

時系列分析の教科書（７）

トレンド（傾向変動：長期推移）の部分を読んでいます。

モデルに当てはめて数式の形にしてしまう方法や、逆にモデルに当てはめずに推定する方法が
あるとのことです。

前者の例には

「多項式」（直線のトレンド）
「指数曲線」（幾何級数的に増加するトレンド）
「ロジスティック曲線」「ゴンペルツ曲線」（成長曲線）※産業の発展・衰退や人口動態等

があり、こちらは形が似ているものに当てはめるという理解をしています。

後者には

「移動平均法」（長期・短期・ランダムの変動成分のうち、長周期を取り出す）
「階差去」（p次多項式の場合、p+1次の階差をとることによってトレンドを除去）
「確率的トレンド」（？？？）

があるとされていました。

前の記事で

「移動平均がトレンドとサイクルの情報になるということがわからない」

と書きましたが、お風呂でぼんやり考えているうちに

・移動平均をとることによって滑らかな曲線ができる→トレンド＋サイクル
・滑らか曲線との差→季節＋ランダム
・各年の平均→ランダムを除去

ということなのかなと。

後からわかることもあるかもしれないし、今理解していないことで後に困ったらもう一度
読み返すこととして、取りあえず全部に目を通すことを優先させようと思います。

時系列分析の教科書（６）

休日にしては早起きしました。

教科書の進捗はまだ1割です・・・早く読まなきゃです。
今は季節変動の推定という部分を読んでいます。

季節変動には
「前年同月（期）比」「月別（四半期別）平均法」「連環指数法」「移動平均法」
「回帰分析による方法」「統計モデルによる方法」
などがあげられるということで、
そのうち「連環指数法」「移動平均法」「統計モデルによる方法（X-12-ARIMA）」は
昨日読んだ内容のことです。

こちらの説明で月次データの12項移動平均をとった後に2項平均をとる意味を理解しました。
手順はわかったのですが、移動平均がトレンドとサイクルの情報になるという部分は
まだよく理解できていません・・・「項数と等しい周期を消す」ということらしいのですが。
連環指数法で自分の頭の中が固定されちゃっているのかもしれません。
各年の情報がない状況からどうして取り出せるのかがイメージつかない感じです。

と思っていたら続きがあって、「可変季節変動指数」というものの説明が載っており
各期のSI系列の平均を計算するものということです。

１００％理解できている訳ではありませんが、この後にも出てきそうなので
とりあえず先へ進もうと思います。

「X-12-ARIMA」については、移動平均によって欠損した部分を埋めるだけでなく
ダミー変数で構造変化や外れ値を表すことによりこれらの影響を適切に処理するとのことです。
具体的にどうやって処理されるのかはわからず・・・

「前年同月比」は文字通り（もしくは変化率）ですが、
問題点もあるので先の章で説明するとされています。

「月別平均法」は各年の月毎に平均して求めることですが
あらかじめトレンドを除去した状態にしておくことに注意だそうです。

「回帰分析による方法」は分布ラグモデルを用いて行い、原系列をそのまま使用して
ダミー変数で季節変動の影響を取り除くものというものらしいです。
ただ「季節変動成分を季節ダミーに入れる」がわからず・・・季節変動成分は
どうやって取り出すのかとか・・・？

「わからず・・・」ばかりの頭が悪い記録を毎日垂れ流してるような（汗）

時系列分析の教科書（５）

季節変動の章に入りました。

○季節変動とは、「天候」「社会習慣」等の影響によって毎年繰り返される変動

○こちらを「経済データから除去」することにより、
　経済の基調的動向・諸変数間の関係をより的確に把握可能

○季節変動パターンには、以下の2通りがある。

「固定季節変動型（毎年同じ）」
　→”連環比率（原系列の前月比）を月別に平均し、1月を100とした1月基準の指数を作成。
　　　その上で12月と1月と差分を各月に対して修正し、各月の修正値を修正値の平均で割る”
　　というステップで季節変動を捉えられるが、傾向変動の変化率が大きかったり外れ値が
　　あると正しく推定できないことがある。

「可変季節変動型（徐々に変化）」
　→原系列の12か月合計をそれぞれ求め、次に12月合計の隣り合うデータをそれぞれ
　　足し合わせて24か月合計を作成し24で割ることにより、季節変動を除いた
　　「トレンド×サイクル」が求まる。
　　原系列をこちらで割ると「季節変動×不規則変動」（SI要素）となる。
　　SI要素を月別に平均することによって不規則変動を取り除き、こちらの12か月分の
　　平均が100となるよう指数化する”

移動平均をとることによって欠損した月をARIMAモデルによって埋めるX-12-ARIMAという
季節調整法がある。

めちゃ眠くなりました・・・あまり進んでいませんが今日は一旦寝ます。

時系列分析の教科書（４）

本の要約ということで、
誤認があったら以下は当てにならない情報であることを最初にお断りしておいて・・・

--------------------------------------------------------------------

○経済時系列の構成要素

１）傾向変動
「トレンド」と呼ばれるもの。長期的な推移

２）循環変動
「サイクル」と呼ばれるもの。傾向変動の間に繰り返される変動
ほぼ周期的であるが、ふり幅は必ずしも一定ではなく、発散傾向なし

３）季節変動
季節的な要因によって毎年繰り返される変動。（「ビールは夏に売れやすい」のような）
変動の形は徐々に変化

４）不規則変動
規則性をもたないランダムな変動
一般的には定常とする

--------------------------------------------------------------------

この他に曜日変動などもあり、更に授業内容を記録したメモには

「ハッピーマンデー導入（生活スタイルが変わるとパターンが変わる）」
「うるう年（1日プラスで影響大→調整必要）」
「中国の旧正月（日本の経済にも影響）」

などの影響があると書かれていました。

--------------------------------------------------------------------

自分が理解しやすいように、ミニスカートで考えてみました。

１）オシャレする女性は年々増え、洋服の売り上げ全体が増えていく（少子化はおいときます）
２）流行は巡る（ミニスカートが流行る→流行らなくなる→流行る→流行らなくなる→・・・）
３）季節によって売れる服は異なる（ミニスカは夏売れやすく冬売れない）
４）その他の変動（ミニスカ女性を狙った犯罪の多発？とか）

こちらを考えた後に「景気循環」というキーワードが出てきて
こちらは循環変動なのですが、「流行が巡る」の周期とどちらが長いんだろう？

ということを考えてしまいました。（わかる気がしませんが）

時系列分析の教科書（３）

○1変量の時系列データ分析→時間の推移に伴う特性・データの特質を捉える
○多変量の場合→変数間の関係の分析が重視される

電子カルテのデータを使って分析を行うとしたら、何をどのように使えるか？
ということについて少し考えてみたのですが、

結果と要因の場合、転帰（質的データ）が外的基準となり、
各要因候補（量的・質的どちらもあり）を説明変数として調べる？

あと、外的要因（院内からのアクションや家族等の環境要因など）の扱い方も
どんな風にするんだろう？。

時系列分析の場合はどうだろうか？
当科の場合病状は質的データになりますので、予測的な使い方はあまり思い浮かばず。

ただ、病院のデータは当然経時的ですし、
とりあえず今の本を読んで何か掴めたらよいなと思っています。

時系列分析の教科書（２）

続きを読みました。

のっけから「外的基準の有無」の意味が理解できず。

外的基準というのは馴染みのある言葉で言えば被説明変数ということなんだろうけど
外的基準がある場合（客観的分析）についてはなんとなくわかりました。
その場合、外的基準が量的か質的かによって数量化の目的や分析の種類が異なり
前者は重回帰分析・後者は重判別分析の対応になるということです。

でも、「外的基準がない」（主観的分析）がわかっていないので、
後半部分の説明が読めませんでした。

こちらは「分割表の相関関係の最大化」「一対比較表に基づく類似性を最小化」に
分類され、主成分分析・因子分析に対応し、更に後者は主座標分析に呼応とされています。
例を見たらパッと理解できるのかもしれませんね。

クロスセクションデータとパネルデータはgretlの教科書の方を読んで把握しました。

時系列の1時点のデータセットがクロスセクションデータで
クロスセクションを時系列に並び集めたものがパネルデータと理解しています。

お寿司

食べてきました。美味しかった～！

勉強は・・・土日でがんばります

時系列分析の教科書（１）

さっきチョコ食べたので、結構元気です。

教科書を読みながら簡単にキーワードを羅列していきます。

○データの対象や精度を確認する。
○統計の対象から外れているデータが存在することにも留意する。
○調査項目の改廃・変更にも注意する。
（例：「農家」の定義の違い）
（例：1人暮らしかつ不在がちで国勢調査に協力が得られない世帯）

○数値で表せるデータ→「量的データ」
○数値で表せないデータ→「質的データ」
○質的データも分類後何らかの数値を付すことで量的データとして扱うことができる。
（質的変数←名義尺度・順序尺度）

○ダミー変数
　質的データをコード化したもの
○３つ以上の値にコードを伏すと順序関係があるかのように見えてしまうため
　項目ごとに「１（○）／０（×）」の２値で表す必要がある。
○「グループ数が２より大きいときには、ダミー変数の数はグループのカテゴリーの
　　数より１つ少なくしなければならない」の意味がわからず。
　読み進めればわかるようになる？定数項が関係あり？
○ダミー変数が多くなると統計的有意性が低下することがある。
○ダミー変数が被説明変数の場合、ロジットモデルやプロビットモデルで推定

まずいです・・・睡魔が～