松井ゼミ９期生のブログ -4ページ目

Chapter18 DISCRIMINANT AND LOGIT ANALYSIS

全国1億2000万人の松井ゼミファンの皆様おはこんばんちは！

皆さんがお待ちかね、松井ゼミの隠し玉にして最強の飛び道具、こまぴょんです！やったー！

最近は統計的手法について英書で読み解いていくという鬼畜仕様なため、毎週が天国のようですね！！！

さて、今週は松井ゼミ10期生になるであろうそこのキミたちのために、

今週学んだ内容を噛み砕いて、ちょっとだけ分かりやすくブログ書いちゃうぞ★

☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*

Chapter18では、「判別分析」と「ロジスティック回帰分析」について勉強しました！

さて、こいつらは一体なんぞやと言いますとですね…。

例えば、一橋生で所属ゼミ不明の学生Aさんがいたとしましょう。

そんなAさんの素性を僕たちはどうしても知りたい…ヤツはいったいどこのゼミ所属なんだ！（憤怒）

という時に判別分析を使うと、
Aさんの所属ゼミを予想することが出来るのです（驚愕）

ここに商学部3年生200名分のデータがあるとしましょう。

そこには「性別、所属団体、英語の好き嫌い、数学の好き嫌い、所属ゼミ、帰国子女かどうか、取得単位数、興味のある分野」などなど様々な情報が詰まっています。

この情報をもとに判別式というものを導き出します、判別式は以下の通り。

D=b0+b1X1+b2X2+b3X3+…+bkXk

（D=判別得点、bn=判別係数、Xn=独立（説明）変数）

といった具合です。

するとですね、各ゼミの分布とか重心ってのが分かってですね(〃∇〃)

んでもってAさんの判別得点とそれを照らし合わせつつ所属ゼミを予想するのです！（ﾄﾞﾔｯ

続いてロジスティック回帰分析、別名ロジット分析とは―――

まず、ロジスティック回帰分析において、目的変数は「あり・なし」のように二元的なものをとります。

例えばある人の「恋人の有無」を知りたい！といった具合。

このような場合は目的変数に「恋人の有無」をとり、

説明変数に「年齢、身長、体重、出身校、過去の恋人の有無」を取ることで分析が可能となるのです！

他にも「病気の発症確率」のようなものをロジスティック回帰分析で予測することも可能です。

元データにおいて病気の発症は「有・無」の二元的なものですからねヽ(゜▽、゜)ノ

ここから少し難しい話。ゼミテンたちが頭を悩ませていたWald検定量についておさらい。

Wald検定量はロジスティック回帰分析の有意性について検定するために用いるものです。

・Wald=(ai/SEai)^2

（説明変数に対する係数を係数の標準誤差で割り、それを二乗したもの）

・Wald統計量はχ^2分布に従う

これは説明変数のp値を求めるときに使用し、

「その変数は予測に役立たない」という帰無仮説を検定するために用いるのです！

つまり、この帰無仮説を棄却することで説明変数の有意性を立証するんだよ！言わせんな恥ずかしい。

最後に判別分析とロジスティック回帰分析の違いについてまとめておきましょう。

判別分析

「松井ゼミor山下ゼミor神岡ゼミ」というように群の違いが確定的なものを判別するために用いる。

ロジスティック回帰分析

「恋人の有無」といったように二項的なもの、また「病気の発症確率」のように確率で表わすものを分析するために用いる。

ということです！

☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*☆*ﾟ゜ﾟ*

調べたい内容や目的に応じてただしく分析方法を使い分けましょうということですね(ﾉ´▽｀)ﾉ

ちなみに難しい計算は全部コンピューター任せなのです。

なぜなら、

「私たちは数学者ではないですから（迫真）」（byモニカ）

ではではまた来週お会いしましょう。

PS. 先生、ゼミテンの皆様へ

間違ってたり補足する点があればコメントお願いしますm(_ _ )m

１７章　回帰分析

中村です。
マークストラットの大逆転、未だに信じてやみません。

さっそく今回の内容振り返ります。
17章は相関と回帰分析です！
【相関】
・積率相関
2つのメトリック変数の結合の強さをあらわす統計量r。2変数の直接的な相関をあらわす。rをだす公式はテキストp562参照。
・偏相関
ある変数の影響を操作した後の、2変数の相関をあらわす。操作する変数はいくつでもよい。
・ノンメトリック相関
ノンメトリックな2変数の相関をあらわす。
【回帰分析】
・回帰分析とは
メトリックな従属変数と1つ以上の独立変数の相関関係の分析を行う有効な手段。相関の有無の決定、相関の強さの決定、変数間の方程式の決定、他の変数の操作、が行われる。
・単回帰
単一メトリック従属変数と単一メトリック独立変数の相関をあらわす式を見出だす。手順は以下のとおり。散布図を描く→一般モデルを形成→パラメーターを予測→標準化回帰係数を予測→有意性を検定→予測正確性を確認→残差を検証→モデルを交差検証。
・重回帰
1つの従属変数と2つ以上の独立変数の相関関係をあらわす式を見出だす。手順は単回帰のときと同様。
・ステップワイズ回帰
最初回帰方程式に変数を入れず、1つずつ増やしていく、または最初回帰方程式に変数を全て入れ、1つずつ減らしていく。

こんな感じです。
いやぁ、テキストもだいぶ終盤ですね！素敵ですね！

あっハロウィン仮装したんで写真のせますねー

シュールで面白かったですね！！

16章~分散分析あのーば！~なう。

こんにちは！
またしても私、はるなです。じゃんけんに負けました。望を信じなさいということですね、はい。

今回からブログの各章分析を400字以内におさめよという指令が下されました。
さくっとわかりやすくテキストを説明しよう☆
という難題ですね。頑張ります。

ではいきます！

16章～分散分析～

今回は二つ以上のグループの平均値や中間値の比較方法、分散分析/共分散分析について学びました。分散分析の代表的な方法には一元配置分散分析、N元配置分散分析があります。
一元配置分散分析…ひとつの独立変数（要因）の複数のカテゴリーに対するひとつの従属変数の効果の比較
N元配置分散分析…ひとつ以上の要因による効果を同時に調査する
　N元配置分散分析においては要因間での相互作用があるかどうかの検討も可能です
分散分析で用いられる記号を紹介します
X:独立変数（要因）
Y:Xの効果を受ける従属変数
η(イータ~2)：XのYに与える効果の強さ
群間平方：Xのカテゴリー間の違いで説明できるデータのバラつき
群内平方和：Xのカテゴリー間の違いでは説明できないデータのバラつき
これらを求め、群間平方と群内平方を用いて平均平方をもとめ、検定統計量Fを求めます。
あとは以前扱ったように臨界値とFの値を比較し、帰無仮説を棄却するか否かを決定します。
ここでいう帰無仮説とは「独立変数は従属変数に大きな効果を与えない」です。

（あら、あっという間に400字超えてしまった。。。）

二元配置分散分析にでは
・X全体の効果
・Xの相互作用効果
・X1の効果
・X2の効果
それぞれのFを算出し、有意性を検討します。

共分散分析では制御下にないXのYに対する効果を考慮に入れる場合に行います。この場合要因ではない共確率変数（計量的独立変数）を用いて外部変化を除去します。

テキストには以上３つの分析に対して同じ事例（デパートにおけるクーポンと店内販促の効果、常連の増加の効果）を用いて手計算/ソフトを使った計算の練習を行いました。

ほかに非計量分散分析、多変数分散分析についても軽く扱われました。

ごめんなさい400字すっかりはみ出しましたね。。。
結構難しいものです。
これで今回私たちが学んだことがわかっていただけたら幸いです＾＾
だんだん統計統計してきました。
松井ゼミ９期は完全に数学得意男子と数学不得意女子にわかれています…
毎週のグループ課題がRという統計ソフトを使った課題なのですが、女子はいつも男子に救われながらなんとかこなしているようです。がんばりましょう。

MSOLは第四期が終了しました！
もう少しで第四期の結果が出ます…どきどき。

三商の準備も始まる気配が…？うん、大変(￣＾￣)

ちなみにこの週は9期でゆほ/たんたん誕生日会＆望お別れ会！！！として飲みに行きました。
誕生日(もう過ぎてたけど)のふたりにはケーキが、
望にはみんなが書いた望の似顔絵が集まったスタバのタンブラーがプレゼントされました(・ω・)
インドのスタバでも使えるといーね。

すべらない話はいろいろ飲み会でうまれた気がしましたが
一番我らがくるみ大先生が爆笑してたのは
○○が●●に泣かされていたことですね…やれやれ、チャラいんだから=3笑

では～
気付けば明日もゼミです。レジメ終わりません。がんばります。

Chapter18 DISCRIMINANT AND LOGIT ANALYSIS

１７章 回帰分析

16章~分散分析あのーば！~なう。

１７章　回帰分析