世論調査は難しい (慶応の入試問題より) | 感じる科学、味わう数学

感じる科学、味わう数学

科学は、自然そのものというより、モデルです。数学は、関係性を捉える枠組みです。
だから、正しいか否かより、大事なのは視点です。

大学入試問題に統計の問題を見つけた。 慶応大学商学部2011年度の 「論文テスト」 である。
 

 
<問> 以下の文章を読み、次の問1~問4に答えなさい。
 
 世間一般の意見や考え方を調査する世論調査は、我々にとって重要な情報を提供してくれる。 調査をするうえで、すべての人々について調べることはできないため、無作為に選ばれた一部の人々への調査をしている。 たとえば、内閣支持率も代表的世論調査の1つであろう。 内閣支持率とは、有権者のうち内閣を支持している人々の割合である。 もちろん有権者に対する全数調査は、コストと時間の両面から不可能であり、実際には1000人程度に聞き取り調査をしているようだ。 このように、世論調査の重要性は明らかであるが、世論調査にもいくつかの問題点がある。
 たとえば、「過去1年間に大麻を吸ったことがありますか」 という質問を、無作為に選ばれた1200人に聞いたところ、60人が 「はい」 と答えたとしよう。 このとき、大麻を吸ったと答えた人は、全体の  ①  %となっている。しかし、(ア) この調査では、値を低めに推定している可能性がある。 この問題を解決するには、「回答のランダム化」 という調査手法を用いる手がある。 調査員は回答者に、まずサイコロを振るようにお願いする (サイコロは、1から6の数字が書かれた、歪みがない正6面体とする)。 また、回答者は、サイコロの結果を調査員に知らせないとする。 もし6が出たら、回答者は次の質問には 「はい」 と必ず答える。 それ以外の目が出たら、正直に 「はい」 か 「いいえ」 と答える。 こんな当てにならない調査結果を、調査機関はどうやって利用するのだろう? 確率論を使うのだ!
 先ほどのように、最初にサイコロを振ってから答えるように指示された1200人が、「過去1年間に大麻を吸ったことがありますか」 という質問に回答したとしよう。 そのうち、380人が 「はい」 と答え、残りが 「いいえ」 と答えたとする。 このとき、平均すると6人中  ②  人が6の目を出して 「はい」 と答えるだろう。 それを調査結果から除くと、有効な回答者は  ③  人であり、そのうち  ④  人が 「はい」 と答えたと考えられる。 つまり、回答者のうち  ⑤  %が大麻を吸っていたと推定される。 回答のランダム化を、一般的な表記で考えてみよう。 回答者数を N 人、「はい」 と答えた人を M 人とする。 そうすると、サイコロを振って6の目が出て 「はい」 と答えた人々を除くと、有効な回答数のうち
      ⑥  ×M/N -  ⑦  
の割合だけ大麻を吸っていたと言える。 このように、(イ) 回答のランダム化を行えば、通常の調査結果の問題を解決することができるのだ
 また結果自体は完全に有効であっても混乱が起きることがある。 たとえば、2004年のアメリカ大統領選の出口調査 (投票を終えたばかりの有権者に、誰に投票したかを尋ねる調査) では、(ウ) 投票にあたって最も重要な争点について聞かれた有権者が選んだ回答は、「倫理的価値観」 が1番多かった。 最終的に勝ちを収めたジョージ・W・ブッシュの批判者は、これはブッシュの支持者が、みんな過激なキリスト教徒の保守派である証拠だと主張した。 一方、保守派は、アメリカの世論が信心深く敬虔な視点へと根本的にシフトしていることを、この調査結果は示していると主張した。 ところが、よく調べてみると、「倫理的価値観」 を選んだ回答者は22%にとどまることがわかった。 そのうえ、「倫理的価値観」 という言葉の捉え方は人それぞれだったのに対して、選択肢として同時に示されていた他の6項目 (「イラク」、「テロ」、「医療」 など) は、もっと具体的だった。 そして、実は 「テロ」 は投票者の19%、「イラク」 は投票者の15%に選ばれており、合わせると34%に達した。 だから、これら2つの争点が1つのカテゴリー (たとえば、「安全保障」 とか 「外交政策」) に設定されていれば、それが投票者の最大の関心事という結論になっていたかもしれない。 これはずいぶん違った結論だし、おそらくこのほうが現実に近かったのだろう。
 
問1.  ①  ⑤  に最も適切な整数を、 ⑥  ⑦  に最も適切な分数を入れなさい。

問2. (ア) この調査では、値を低めに推定している可能性がある とあるが、過小評価の問題はなぜ起きるのか。
    20字以内で答えなさい。

問3. (イ) 回答のランダム化を行えば、通常の調査結果の問題を解決することができるのだ とあるが、
    回答のランダム化は、どういう意味で通常の調査方法の問題を解決できるのか。 50字以内で答えなさい。

問4. (ウ) 投票にあたって最も重要な争点について聞かれた有権者が選んだ回答は、「倫理的価値観」 が1番
    多かった とあるが、この出口調査の問題点は何か。 20字以内で答えなさい。
 

 
《 解答例 》
問1. ①  5   ②  1   ③  1000   ④  180   ⑤  18  ⑥  6 / 5   ⑦  1 / 5

問2. 回答者が正直に答えるとは限らないから。 (19 字)

問3. 「はい」 と回答した理由が他の人にわからないので、正直な回答を得られることが期待できる。  (43 字)

問4. 選択肢の一部に具体性がなくて不適切。 (18 字)
 
 
《 関連記事 》
◇ あいまいの科学 -統計の勘どころ-  (→ http://blogs.yahoo.co.jp/ccomori/64467655.html
◇ 正直に挙手してもらう方法         (→ http://blogs.yahoo.co.jp/ccomori/63276878.html
◇ アンケートの極意               (→ http://blogs.yahoo.co.jp/ccomori/49107309.html )