心理学からちょっと寄り道して、「社会調査」を見ました。
調査・統計・分析をちょっと勉強しなおしたくて。。
社会調査や統計学の授業は受けてたけど、苦手意識が強かったので、この苦手意識を克服したい!!
心理学や仕事でも調査分析でベースとなる知識だし^^
というわけで、再度見てみました。
以下、個人的メモ。
調査
・探索型調査・仮説検証型調査
・明らかにすることは、どちら?
・記述: 状態を明らかにする
・説明: 状態の背後にある法則性や因果関係を明らかにする
・概念はデータを掬い上げるための「網」である
→概念を適切に設定する。 例)社会的孤立→ 一日何人と話すか などデータで把握できるものにしていく
・理論概念: 理論的に考えるために用いられるが直接には観察ができない概念 (例 社会的孤立)
・操作概念: 直接、観察が可能な概念 (例 何人と話すか)
・概念の操作化: 理論概念を操作概念に変換すること
・仮説の種類
・理論仮説: 抽象度が高くて調節には検証ができない仮説
・作業仮説: 実際の調査によってその真偽が検証可能であるように設定される仮説
・ある事柄とある事柄の間に因果関係がある場合、その事柄ら示す変数について、以下のようにいう。
・独立変数: 原因とされる変数(説明変数 indipendent variable)
・従属変数: 結果とされる変数(被説明変数 dependent variable)
・流れの例
最初に理論仮説を立てる
理論概念x → 理論概念 y
(x:社会的に困難な立場にある程度 y:社会的孤立の程度)
次に作業仮設を立てる
操作概念x1 → 操作概念y1、 操作概念x2 → 操作概念y2、 ・・・
(x1:経済的な貧しさ、y1:友人・知人の数、 x2:年齢、y2会話頻度)
※適切に設定するのが大事!
・データでわかるのは相関関係まで。因果関係および因果関係の方向は、別で確認が必要。
研究・調査の流れ
最初の問いを立てる
先行研究の検討 ー先行研究で明らかにされていないことは何かも含む
実態を記述する・仮説を立てる ー探索型調査の企画・実施。仮説索出のための調査になることもある。
仮説を検証する ー仮説検証型調査の実施仮説検証の結果から次の研究へ
質的調査と量的調査
・質的調査
質的データを使う
メリットは、事例の全体像の把握、仮説の索出、主観的意味世界の把握
・主観的意味の把握 (他者・自称の内在的理解)
・対象を丸ごと捉える(他者・事象の全体的理解)
・仮説を索出する(仮の答えの発見)、機能的アプローチ
対象規模が少ないことが多い
インタビュー、観察など、非構造化面接(非指示的面接)、ライフヒストリー法
探索的性格…全体像や詳細がわかっていない対象や現象を明らかにしていく 例)アイドルの追っかけー観察
・量的調査
量的データを使う
全体についての量的側面からの把握、全体の中での事例の位置付けの把握、仮説の検証
対象規模が大規模なことが多い
調査票(質問し)を用いての標準化された質問でデータ収集、構造化面接(指示的面接)
個別面接調査法、留め置き調査法、郵送回答法、郵送調査法、集合調査法、電話調査法、RDD法、インターネット調査
・量的データ(定量的データ) 例)身長、金額、順位
・質的データ(定性的データ) 例)性別、職業、日記、自由意見
・調査対象、方法、標本の抽出方法、回収率、用語の定義
・マルチメソッド(≒混合研究法、トライアンギュレーション)
量的調査
・目標母集団→調査母集団→計画標本→有効標本・有意抽出法: 何らかの方針のもとに母集団から意図的に特定の個体を標本として抽出
・割り当て抽出法:
・無作為抽出法: 調査者の作為を加えずに母集団から標本を抽出
・単純無作為抽出法
・系統抽出法
・多段抽出法
・層化抽出法
・RDD法(Random Digit Dialing): 電話調査で採用されている。
・エリアサンプリング:
・選択肢設定の原則…①網羅的である ②相互排他的である
・エディティング(検票)…回答内容を確認し、漏れや間違い、矛盾、不審な点がないか確認し、必要によっては修正を行う。無効な回答表を除外する。投資番号をつけるなど。
・修正・訂正の履歴等は必ず残す
・コーディング…pre-cording, after-cording
・欠損値の種類
・不明・わからない=DK(Don't Know)、無回答・空欄=NA(No Answer)
・その質問の対象者ではない=非該当
※たいてい、99とか98とかを割り当てるらしい
・クリーニング
・カテゴリーエラー: 変数の性質やコードの割り当て上あり得ない値
・論理エラー: 複数の項目の組み合わせにおいて論理上あり得ない値
・離散変数
順序づけ不能な離散変数 …種類や質によるもの。質的変数とほぼ同義 例)性別、人種
順序づけ可能な離散変数 例)マラソン着順、高い低い順序、賛成する・まあ賛成する・賛成しない
・連続変数 例)身長、体重、年齢、収入額
・擬似相関
・媒介関係 例)学歴→職業→所得
・記述統計
・推測統計 ←母集団から標本を抽出して分析し、母集団の特性を推定
・統計的推定: 標本から得られた統計量(標本統計量)から母集団の統計量(母数)を推測する
・点推定: 標本統計量を母数を一つの値として推定すること 例)標本平均から母平均を推定
どのくらい確かかがわからない。
・区間推定: 母数の値が含まれる範囲を推定する。
・統計的検定:
・母集団に関してある仮説を立てた上でその仮説が真であるかどうかを標本統計量に基づいて推測する
例)t検定、F検定、χ二乗検定
・流れ…①帰無仮説(H0)を立てる ②検定統計量を計算する ③判断する
※対立仮説(H1)
・検定統計量:
・帰無仮説を前提とした場合に得られる値と実際に標本から得られた値との差。算出方法は検定方法により異なる。
・検定統計量が大きい=帰無仮説を棄却(対立仮説が採択)
検定統計量が小さい=帰無仮説を採択(対立仮説が棄却)
・有意水準を設定した上で、検定統計量の大小の評価を行う=帰無仮説を棄却するか否かの判断
例)有意水準5%で帰無仮説(H0)を棄却(=5%水準で有意である)
・誤差と有意水準
・変数間に関連がないという真実の場合に、
帰無仮説(変数間に関連なし)を採択する判断 →正しい判断
帰無仮説(変数間に関連なし)を棄却する判断 →第一種の過誤(発生確率はα) あわて者の誤り
・変数間に関連があるという真実の場合に、
帰無仮説(変数間に関連なし)を採択する判断 →第二種の過誤(発生確率はβ) ぼんやり者の誤り
帰無仮説(変数間に関連なし)を棄却する判断 →正しい判断
・第1種のカゴの発生率(α)を一定の小さな値に設定した腕検定を実施 ・αについて設定する値を有意水準(level of significance)あるいは危険率と呼ぶ。社会統計学の場合、5%(α=0.05)または1%(α=0.01)を使うことが多い。
・有意確率(P値 P value):
・帰無仮説が真である場合に対立仮説の方向にずれる極端な検定統計量が得られる累積確率
・有意水準α(5%、1%など)を設定した時に、
有意確率(p値)が有意水準α以下 →帰無仮説を棄却して対立仮説を採択
有意確率(p値)が有意水準αより大きい →帰無仮説を棄却しない
雑感
トライアンギュレーションなんて…あったっけ?と思ったり…本当に忘れているなぁと思いました。
良い復習&学び直しになりました。
検定にとても苦手意識があったけど、今回見ていて、そんなに難しくない?と思ったりしました。
…いや、もしかしたら、勉強をもっと進めたら難しいのかも。
でも、とりあえず変な苦手意識は克服できたかな。
それにしても、心理学の講義は、先生方のお声(音声)が小さい方が多かったけど、社会調査は先生がはっきりお話しされていて、分野の違いというか…ちょっと面白かったです笑