まず最初に、表計算シートの設計は、教科書とかにひな形がある場合は、それを使った方が絶対に楽です。自分で作ると、途中でいろいろ修正が入って、結局新しいシートを作り直す羽目になるわけで、なんか、昔と同じことをやらかしているような感じです。
で、本題ですが、夜な夜な数日かけて、結局失業保険だけでシートにしました。でないと、週単位の失業保険と月単位の雇用統計のデータで、シート上が訳のわからない状況になってしまうんですよね。この後のシート作り、本丸の雇用統計が待っていると考えると、気が重いです(ADP雇用統計は、原典に当たれないので、逆に作業は楽そう)。
で現段階で発生している問題点は3点です。
- アメリカ労働省サイトから入手した元データにある比率が何を指しているのかが未だにわからない。
- 日本語データのサイトはできるだけ統一して、同じところからデータをとりたいのですが、メインに使用と考えているマーケットデータのサイトに失業保険データがない。仕方がないので、みんかぶを使用することに。
- データは4週平均で入力し始めたけど、みんかぶに掲載されている予想値は、その週の季節調整値で4週平均の予想値ではない。結局、どっちを使うのがベターなのか???悩む羽目に....。
まず最初の問題点ですが、よく見ると注釈に
Most recent week used covered employment of 148,060,578 as denominator
(分母として、カバーしている既存の雇用者数の1.48億人)
※used coveredが訳しにくいですが、要するに労働省が集めて利用している一般的な統計=雇用統計の雇用者数を分母にしているということでしょう。
と書いてあり、季節調整済み週データ(4週平均ではない)をこの数字で割ったら、0.01165となって、四捨五入で0.012≒1.2%となるので、たぶん計算式はこれでしょう。統計上の全雇用者に対する失業者の比率ということでしょうか。でも、だとしたら、失業率とずれることになるので、何を示す数字なのかは未だ謎です(しばらく、この比率については謎の比率と表記することにします)。
2点目は仕方がないとして、困るのは3点目です。長期的に傾向を見るのであれば、データをならした方がよいので、4週平均でデータを見ていった方がよいと思うのですが、予想値にせよ、比率にせよ4週平均を使っているわけではないみたいです。4週平均を打ち込んでしまったので、結局後付けで季節調整値と4週平均値の両方を打ち込む羽目になりました。
で、打ち込んだというか、作った項目は以下です。
- 新規申請件数(季節調整済)
- 前週との増減(前の週との差)
- 前週比 ←計算式を貼り付け
- 前年の数値
- 前年比 ←計算式を貼り付け
- 予想値
- 予想値との差 ←計算式を貼り付け
- 4週平均(季節調整済)
- 前週との増減(前の週の4週平均との差)
- 前週比 ←計算式を貼り付け
- 前年の数値
- 前年比 ←計算式を貼り付け
- 継続件数(季節調整済)
- 前週との増減(前の週との差)
- 前週比 ←計算式を貼り付け
- 前年の数値
- 前年比 ←計算式を貼り付け
- 予想値
- 予想値との差 ←計算式を貼り付け
- 謎の比率
- 4週平均(季節調整済)
- 前週との増減(前の週の4週平均との差)
- 前週比 ←計算式を貼り付け
- 前年の数値
- 前年比 ←計算式を貼り付け
計算式は、単なる引き算か割り算です(実数の差をとるか、増減をパーセントで示すかの違いです。この辺は昔取った杵塚で感覚的に決めようかと....)。しかし、意外と項目が多いですね。たぶんこの後、いくつかの項目はリストラになるでしょうか。
暇があったら、過去データをさかのぼるかもしれませんが、基本は新しいデータを足していく感じでしょうか。週ごとのデータだと数ヶ月くらいあればデータがたまるはずですが、使い物になるまでにどのくらいの時間が必要かはまだわかりません。