最近アリゾナで2週間、統計のワークショップに参加した(車で奥さんと交代しながら行ったけど、遠かった。。。汗)。
ニュースでもよく聞くようになったビッグデータ(データマイニング)や縦断的データの分析を学んだ。ただ、最新の分析になればなるほど、その“手法”を分析した研究がなく、だからガイドラインもあまりない。だから、論文を読んでると、最近流行りだした分析では特に、間違ったやり方で論文が出てることも多い。
そして、もっと困るのは、ソフトにバグがあったりする。。。ワークショップではRを使ってたんだけど、当然Rは無償のソフトなので、開発する人は他に仕事を持ってるだろうし、だからバグの修正に結構時間がかかる(早い人もいるけど)。データマイニングとSEMを合体した分析をしようと思ったけど、どうしてもエラーが出て、断念。異なるアプローチで分析するしかない。
でも、このワークショップを通して、いくつか研究のアイディアが浮かんだ。統計の分析は手段にすぎないけど、その手段を事前に知っとかないと、いい研究はできない。データを集めてから、こういう分析をしたいだとか、こういった仮説を検証したいだとか言われても、すでにあるデータから答えられることは限られてる。アメリカの統計のクラスを取ってると、先生がよくgarbage in, garbage outという。つまり、ゴミみたいなデータをいくら分析しても、ゴミみたいな結果しか生まれないということ。だから研究計画はとても大切。
最後に、まだ確定ではないけど、秋学期のアシスタントシップで学部生の統計を初めて教えることになりそう。研究法のクラスと似てて、メインのクラス(講義)とラボがあって、講義は教授がして、ラボは院生が教える。初めて統計のクラスを教えるので、ちょっと楽しみ~☆
せっかくアリゾナに行ったので、セドナにも行ってきました。
そして、本当のお目当てはIchiro!!!
ニュースでもよく聞くようになったビッグデータ(データマイニング)や縦断的データの分析を学んだ。ただ、最新の分析になればなるほど、その“手法”を分析した研究がなく、だからガイドラインもあまりない。だから、論文を読んでると、最近流行りだした分析では特に、間違ったやり方で論文が出てることも多い。
そして、もっと困るのは、ソフトにバグがあったりする。。。ワークショップではRを使ってたんだけど、当然Rは無償のソフトなので、開発する人は他に仕事を持ってるだろうし、だからバグの修正に結構時間がかかる(早い人もいるけど)。データマイニングとSEMを合体した分析をしようと思ったけど、どうしてもエラーが出て、断念。異なるアプローチで分析するしかない。
でも、このワークショップを通して、いくつか研究のアイディアが浮かんだ。統計の分析は手段にすぎないけど、その手段を事前に知っとかないと、いい研究はできない。データを集めてから、こういう分析をしたいだとか、こういった仮説を検証したいだとか言われても、すでにあるデータから答えられることは限られてる。アメリカの統計のクラスを取ってると、先生がよくgarbage in, garbage outという。つまり、ゴミみたいなデータをいくら分析しても、ゴミみたいな結果しか生まれないということ。だから研究計画はとても大切。
最後に、まだ確定ではないけど、秋学期のアシスタントシップで学部生の統計を初めて教えることになりそう。研究法のクラスと似てて、メインのクラス(講義)とラボがあって、講義は教授がして、ラボは院生が教える。初めて統計のクラスを教えるので、ちょっと楽しみ~☆
せっかくアリゾナに行ったので、セドナにも行ってきました。
そして、本当のお目当てはIchiro!!!