ほたるいかの書きつけ -26ページ目

愛すればこそ :p

 kikulog のコメント欄で、TAKESANさんが紹介 していた早期教育に関する論文 を読んだ。
 でまあ今回はその話ではなく(内容は良いので御一読あれ)、そのあと、以前ここでも取り挙げた『子どもの貧困』 との関係だとか、「ホメオパシー」が貧困化と結びついて政策的に導入されたらいやだなあ、とか、そんなことを漠然と考えていて、ふと思ったこと。

 なんで私はニセ科学を批判しようとするのか?

 いやまあ以前も考えましたよ。理屈はいろいろあります。だけど、理屈ではなくて、感情の部分はなんなんだろう、と。なんでニセ科学を批判したくなるのか、と。

 どうやら、それは私がトンデモを愛しているから、と考えるのがいいようだということに気付いてしまったのだ。
 トンデモを愛しているからこそ、トンデモがニセ科学となり人を喰い物にするのが許せないんだと思う。
 トンデモはトンデモとして、ちょっと切ない気持ちで愛でていたいのだ。ハマッてしまって人生を無駄にしてしまう人には申し訳ないとは思いつつ。それこそ「町の発明家」みたいな人が楽しそうに珍「発明」をしたり、熱くUFOや宇宙人について語ったり、4次元の世界について語ったり(そーゆー意味ではアセンションで移行する5次元の話はつまらん!!)、そういうものを、文化として、受容したいと思うわけだ。

 ところが、現実にはびこる「ニセ科学」はそういうものではない。「水伝」のように人間の価値を貶めたり、「血液型性格判断」のように人間それ自体を見ずに優生学のように人を判別したり、ホメオパシーのように無知な人々を取り返しのつかない容態にしたり。要するに文化を破壊し、人間性を貶めるのが現実の「ニセ科学」なわけだ。というか、そういうものを批判しているわけだ。

 トンデモがニセ科学化し、暴虐の限りを尽くしていたら、楽しく愛でてなんていられないじゃないか。

 だから、たぶん、科学を愛するが故に批判する、というのではなくて(もちろんそれはあるんだろうけど)、それ以上に、トンデモを愛するが故に批判しているという側面の方が強いんじゃないか。私の場合。

 これは例えば、自衛隊の海外派兵を批判する心情にも通ずるものがあるだろう。
 これだって勿論海外派兵をすることが日本にとって世界にとってどういう意味があるのかという観点から批判を展開するわけだ。するわけだけど、でも単に論理的におかしいから批判しているだけではなくて、おそらく私を含めた多くの人は、日本を代表している集団が海外で人を殺すということに耐えられないからなんじゃないかと思う。日本が好きだからこそ、日本にはそういう役回りを演じて欲しくない、もちろん論理的に考えてどうしても日本がそういう役割を果たさなければならないことが国際社会の合意としてあり、実際それがもっとも合理的だという結論になればそれを認めるだろうけれども、実際はそうではない。だったら、「やめてくれ!」と叫びたくなるわけだ。日本が好きであるが故に、日本が海外で人を殺すことはやめてほしい、と。

 マンガや小説の中だけではなくて、現実の世界でバカやってる人はいっぱいいる。自分だって、まあ時にはやるわけです。罪のない、意味のないことを楽しくやるのは我々の権利でもあるわけだ。非生産的なことにどっぷり漬かっている姿というのは、ある意味「あこがれ」でもあるわけです。町のマッドサイエンティストになってみたいという心性はやはり自分の中にあるわけですよ。
 
 ちうわけで、まどーでもいい戯言ではあるのですが、今後もトンデモを愛でつつニセ科学を批判しようとあらためて思ったのでした。

『虹は七色か六色か』板倉聖宣

(追記09.04.19 こちらのエントリもどうぞ。「Pink Floyd も6色だった! 」)

 著者は「仮説実験授業」で有名な板倉聖宣氏。副題に、「真理と教育の問題を考える」とある。
 この本、「本」というより冊子と言った方がいいくらいの、手帳サイズの薄い本である。が、その内容は実に深い。

 虹の色はいくつあるか?という問からこの冊子は始まる。いや、板倉さんの趣旨を汲めば、こんなところで結論を紹介するのはよくなくて、「考えろ」ということになるんだろう。が、まあそれはそれとして、興味を持ったら御自分でまた読み直していただけばいいと思うし、それでこの本の価値が下がるということはない。
 で、その問への答である。大方の日本で教育を受けて来た人々なら、「7色」と答えるだろう。虹と言えば七色、Personz だって "Seven colors ~" と唄っていたではないか。
 ところが、アメリカではそうではない、6色なのだ、というところから話は展開する。

 虹の色が、国(あるいは民族)によって違っているということを聞いた人も多いだろう。私もそうで、そしてそれは文化によって色の認識の仕方が違う、という文化相対主義的なものだと考えていた。もちろんそういう面はあるのだろうが、「七色か六色か」という問題、特になぜアメリカで6色なのか、という問題を考える際には、単に文化相対主義で片付けるわけにはいかない問題がある、というのがこの本の中身なのである。

 実は、アメリカ人も昔-ここでは南北戦争の頃が例として挙げられているが-は虹は7色であるとしていた。当時出版された科学の本には、どれも虹は7色と書いてあったそうである。ところが、ある時から、「藍(indigo)」が抜け、6色になったのである。そして、そもそも7色とされたのも、始まりがあったのである。
 分光学の開祖、ニュートンは、『光学』の中で、プリズムで分光して出現する色は5色である、と書いているそうである。ところが、その後、ニュートン自身が7色に立場を変えた。それは、宗教的な理由(一週間は七日である)もあっただろうが、それだけでは宗教的すぎるので、音階との対比を考えたからだそうである。つまりドレミファソラシの7つの音階と対応させたわけである。しかし、ニュートン自身には、プリズムで分光した白色光は7色には見えなかった。6色しか見えなかった。ところが、7色見える(「藍」が見える)という人が現れ、そこで「藍」と「橙」は半音階に相当するので、幅が狭く自分には見えなくても仕方ない」ということで7色にしてしまった。
 では一般の人はどうだったか。ニュートンが言うのだから虹は7色に違いないが、7色には見えないという人が大勢いたのだろう、その証拠に、7色の覚え方があちこちに残されている。たとえば Richard of York gave Battle in vain. という文章を覚えると、単語の頭文字が red, orange, yellow, green, blue, indego and violet, となるので覚えやすい、というわけだ。そうまでしないと覚えられないくらい、普通の人には7色に見えなかったのだろう。

 では、いつから6色ということになったのか。
 それは、1941年に出版された教科書からだそうである。1940年までの小中学校の理科の教科書には、どれも7色と書いてあったらしい。では、その教科書が6色を押し付けたのかというとそうではない。おそらく、当時の子どもも虹は7色というのが常識だったのだろう。だから、実際に、その教科書では、プリズムを設置して壁に虹色の帯を映すようになっている。そして、「7色のうち、壁に映った虹色の帯の中で、見分けにくい色がありますか」と質問するような授業展開になっているそうだ。つまり、子どもが自ら虹は6色であると納得するように仕向けてあるのだ。上から教え込むのではなしに。
 この教科書の著者は B.M. パーカーという人で、シカゴ大のラボラトリー・スクールに所属していたそうである。この学校は、あのデューイが作った学校とのことだ。
 他の教科書執筆者たちも「虹は6色」を否定しなかったので、やがてそれが広まり、70年代には「虹は6色」が常識のようになっていったそうである。

 ここから読み取るべきは何か。もちろん教科書で教える内容に6色と書くのであるから、その意味では6色と認識するのも広い意味では文化だろう。しかし、6色と7色は対等ではない。自然界が-色を認識する人間の、多数派の人間の目の構造を含め-6色を自然と感じるように出来ているのである。むしろ、それを無理矢理7色にしてきたのが、観念の押し付けであったのだ(無論、色について頓着しない文化であれば、数は減るだろうが)。

 ちなみに日本では、記録を探ると2色だったり5色だったり、あまり数には頓着していなかったらしい。初めて「7色」となるのは1835年の本だそうだが、その著者は西洋の近代物理学をはじめて日本に紹介した人で、つまりニュートンが言ったことが輸入され、それが広まって日本でも7色ということになったということだ。つまり、虹は7色というのは日本の伝統でもなんでもない、ということのようである。

 さて、この本の面白いのはこれだけではない。当時(70年代)、アメリカでは虹は6色とされていることを紹介し、それは文化の違いであると言った4人の学者を名指しで批判している。それは日高敏隆、村上陽一郎、桜井邦朋、鈴木孝夫である。なぜ文化の違いであると公言できるようになったかなどの社会的考察も面白いのだが割愛して(まあ要するに日本が日本として自信を持てる程度に経済的に成長したというのが背景にあるのだろう、ということ)、そこには、村上陽一郎氏に典型的な相対主義的な(あるいは社会構成主義的な)世界観があると指摘する。現実との対応を考えずに、頭の中だけで「それは文化の違いによるものだ」と決めつけてしまう傾向である。ちょっと長くなるが、引用する。

〔4人の学者たちの誤り〕
 しかし、その4人の学者たちは、揃いもそろって、対応をまったく間違えたのでした。アメリカ人が〈虹は六色〉と考えるようになったのは、〈虹は七色〉という考えを知ってのことであったのに、〈アメリカ人の言語文化にはインジゴ=藍という概念が希薄であるからだ〉などと何の根拠もなく考えてしまったのです。
 その人々は、どうしてそんな根拠のないことを考えてしまったのでしょうか。それは、「その人々が〈科学上の真理もその国の文化の伝統や言葉の違いによって変わることがある〉という当時流行していた科学論に魅せられすぎたせいだ」といって間違いないでしょう。
 たしかに、〈科学上の真理もその国の文化の伝統や言葉の違いによって変わることがある〉ということもあり得ないことではありません。しかし、人びとによる科学上の意見の対立があることを知ったとき、〈どちらが正しいか〉と考えても見ずに、その対立をすぐさま〈その国の文化の伝統や言葉の違い〉のせいにすることは、とんでもない間違いです。
 この〈虹は七色か六色か〉の話題は、「日本の多くの学界の指導者たちでも、そういう初歩的な間違いに陥る危険を示している」といっていいでしょう。この人々は、アメリカでの科学教育研究者たちの成果を知りながら、そのことから学ぶこともできなかったのです。

 我々の感覚は間違うこともあるし、惑星の配列のように覚えるしかないこともある。しかし、「実験」抜きに、なにかわかったような気になってしまうことも往々にしてある。この話は、現象に寄り添い、己の感覚を疑いつつ信頼し、真理を探っていくというプロセスの重要性を示し、自戒を迫るものと言えるだろう。

 内容の面白さだけでも読む価値があるが、どう展開して読者を納得させるか、その方法もまた面白い。
虹は七色か六色か―真理と教育の問題を考える (ミニ授業書)/板倉 聖宣
¥630
Amazon.co.jp

帰無仮説と「強い相関はない」の関係

 松井論文の報告はお楽しみいただけましたでしょうか。アクセス数が物凄いことになってビックリしました。まあ hotentry に出たからなんでしょうけど、それだけ「ソース」を求める要求が強いのかな、とも思っています。

 ところで、今回久々に統計の教科書を読んでいて、面白かった記述があったので紹介します。『確率・統計入門』(小針晛宏、岩波書店)という本で、随分昔、統計の勉強をするために買ったのですが、検定のところは読んでいなかった(χ二乗分布関数については調べたいことがあったので、そのあたりだけつまみ喰いしましたが)。これ、結構面白い本なんですよね。いま amazon のレビューを見てみましたが、みなさん絶賛してます(って3人だけですが)。

 検定の章の最初のほうに、帰無仮説Hについてこんなことが書いてあります。
上の三つの方法のうち、特に検定については、論理の構造上非常に陥り易い落し穴がある。というのは、仮説Hというのは、棄却(否定)される時にだけ意味を持ちうる、まるで流しびなのようにはかない運命を背負った仮説なのである。これが危険率αで棄却(否定)できないからといって、うっかり情を移して'信頼率β=1-αで採用(肯定)できる'と言ってしまうと、《流しびなをしまい込むと禍が起る》という言い伝えが生命を吹き返し、文字通り禍が起るのである。このゆえに、仮説とはしばしば'帰無仮説'と呼ばれる。
味わい深い文章でしょう。
 さらに続けて、具体的な例が挙げられています。ある水産試験場Aで養育している金魚について、体長5cm以上のものは5%、7cm以上のものは1%いることがわかっていたとして、さて同種の金魚で体長6cmのものが持ってこられたときに、これはA試験場の水槽から取ってきたものかどうかを検定しましょう、というのです。
 当然、まず帰無仮説として、
   H: これはA試験場からの金魚である
をとります。すると、当然ながら、体長6cmの金魚ですから、
   仮説Hは、有意水準1%では棄却(否定)できない
となります。しかし、A試験場には、5cm以上のものは5%はいるわけですから、有意水準5%では棄却できるわけです。
…体長6cmの金魚がA試験場からとれる確率は5%以下だから、有意水準(危険率)5%で、この仮説は棄却(否定)できる。つまり、目の前にいる1匹の金魚がA試験場からのものではない、どこか他の水槽で飼われた、より大型のものだと判定するとき、その危険率は5%以下である。ではその判定は99%確かか、と問い直されると、それほどの自信をもって太鼓判が押せるものでもない。
というわけ。

 では、4.5cmの金魚だったら?
   これは金魚です。
と言う以外、何も言えないのである。相手がさらに何か言うのを待っている様子なら、'美しいですね'とか何とか言って、その場をしのぐしか仕方がないのである。つまり正解は
   '95%の確からしさで、これがA試験場のものでないといえる'わけではない。
のである。否定できる時は意味があるが、否定できないときは、何もわからないのである。つまり無になってしまうのである。だから帰無仮説という名もついているのである。体長4.5cmの金魚では、A試験場のものかも知れないし、他所から持ってきたものかも知れない。二重否定は肯定だということを信じて疑わない読者は、よく味っていただきたい。'返さないとは言わない'は'返します'と同義ではないのである。
   帰無仮説を肯定的に使ってはならない。
ということを、くり返し強調しておこう。
わかりやすいですね。統計の心が実によく説明されている。

 その一方、こんなことも書いてあります。
 ある製薬会社が、鶏用に「ケッコッコー」という綜合ビタミン剤を売り出したとします。途中のデータや計算は省略しますが、製薬会社が「これをにわとりに与えると卵は5g以上大きくなる」と宣伝していたとして、これが正しいといえるかどうかを検定しましょう、というのです。この薬自体は、やっても効かないということは既に検定で明らかになっています。で、薬をやっていない集団とやった集団との平均の差が、この例題では-1.025g~3.425gの間が危険率5%で棄却できない範囲になりました(興味のある方は本を見てください)。「5g」という値は1%で棄却できるのですが、ということから、「99%の信頼率で製薬会社の宣伝はインチキな誇大広告だと告発できるのである」となります。
 さらに重要なのがこの次です。
つまり'差がない'、'薬が無効である'という仮説は否定できなかったけれど、非常に効くとか、逆効果で2grも減ったとかいうことは否定できるのである。で、結論として'効くのか効かないのか'と迫られたら'何とも言えないが、ものすごく効くことはない'と答えるしかない、ということである。
これを血液型性格判断の場合に当てはめると、松井論文(をはじめとする、心理学者による多くの結果)は、「血液型と性格に相関があるのかないのかと迫られたら、なんとも言えないが、強い(ものすごい)相関があるということはない」と答えられるということになります。「強い」って一見曖昧に見えるけど、こういう定量的な把握が重要なんですよね、検定では。
確率・統計入門/小針 あき宏
¥2,940
Amazon.co.jp

「血液型と性格」の正しい理解のために:松井(1991)その2

 本エントリは、以下の論文の後半部分を紹介している。
    松井豊「血液型による性格の相違に関する統計的検討」、1991、立川短大紀要、24、51-54
以下のエントリと合わせてご覧いただきたい。

   「血液型と性格」論文レビューをするにあたって(前々エントリ )
   1.はじめに
   2.方法(以上前エントリ )
   3.結果
   4.考察(以上本エントリ)

3. 結果
 表4~7は、4年度分それぞれの、各質問項目(表3)ごとの肯定率、及び比率の差の検定結果である。ただし、図が大きいため、ブログ形式ではすぐ下に掲載すると読みづらくなるので、この4つの表については本エントリ末尾に並べておいた。なお読者の便宜のため、表3を本エントリにも掲載しておく。表4~7の左端の列は項目番号を、右端の列は検定結果を示している。検定結果のうち、アスタリスクが一つついているもの(*)は5%有意、二つついているもの(**)は1%有意を示す(*1 )。
ほたるいかの書きつけ
 さて、有意水準5%で差の見られた項目は、24項目中幾つあるだろうか。
   1980年度…3項目
   1982年度…3項目
   1986年度…4項目
   1988年度…4項目
であった。なお、差が有意だった項目数は、24項目のうちおよそ12~17%程度である。完全ランダムであるとすれば、24項目の5%ということで1~2項目程度は(母集団に差がなくても)差が有意になる項目が出ることは当然考えられるため、この程度の項目数が有意になったからと言って、血液型と性格に相関があると判断を下すのは早計である(早計である理由は他にもある。後述)。
 では、4年間を通して差が有意だった項目は幾つあるかというと、それは1つしかない(項目番号4)。つまり、他の項目は、たまたまある年度で偶然にも差が有意になってしまった(本当は差がないのに、たまたまそうなるような標本だった)、ということである。24項目のうち1項目しかないのであるから、全項目数における割合は5%以下となった。
 さらに、全年度で差が有意となった項目番号4(「物事にこだわらない」)の結果の詳細を見てみよう。表8は、各年度ごと、各血液型ごとの肯定率を示す。すると、最も肯定率の高い血液型は、年度によって異なっていることがわかる。
ほたるいかの書きつけ
わかりやすくするために、表を書き直してみよう。
年度 1位 2位 3位 4位
1980 B AB O A
1982 O AB B A
1986 AB O B A
1988 B O AB A
1位(もっとも「物事にこだわらない」と答えた回答者の割合が多かった血液型)が年度によってバラバラなのがわかるだろう。これでは、差が有意になったと言っても、「血液型と性格」の相関を示すものになっていないということがよくわかるだろう。
 なお、肯定率の差も小さく、80年で6.2ポイント、82年が6.1ポイント、86年7.5ポイント、88年9.2ポイント、となっている。この程度の差では、(仮に差が一貫したものであったとしても)日常生活で使えるようなものではないことは明らかだろう。

 さて、というわけで、「血液型と性格の間には日常生活で使えるような強い相関はない」ということがわかったと思うが、上の結果はそれ以上の示唆がある。以下では、論文では末尾に「注」としてまとめられていることであり、かなり細かい、かつ詳細な分析ではないことではあるが、大変に示唆的であり面白い結果についてまとめておく。

この章、これ以降は「注」の内容であり、メインの結論ではない。従って、ここをスキップして「4 考察」に進んでいただいて構わない。興味のある方だけご覧下さい。

 一つめは、年度を通して、常にA型が最下位であることである。そこで、データをA型とそれ以外とに再分類し、差の検定を行うと、どの年度でも有意差が認められるとのことである(論文では「表7のデータを…」となっているが、「いずれの年度でも」とあることから、「表4~7のデータを…」の間違いであろう)。ただし、関連係数(ユールのQ)は、大変低く、0.082~0.148ということである。
 なお、元論文のこのパラグラフ、すぐ上でも書いたようにタイポ(おそらく)があり、意味がとりづらい。そこで、このパラグラフの一部を引用しておく。
 …表7 のデータをA型とその他の型に再分類し、差の検定を行うと、いずれの年度でも有意差が認められる。しかし、この検定における関連係数(ユールのQ)は0.082~0.148と低めである。分析された24項目のうち、1項目だけが低い関連しか示していない点を考慮すれば、本報告の結論を改変する必要はないと考えられる。
よくわからないのが、24項目すべてを再分類して解析しなおしたのか、この項目4のみを解析しただけなのか、である。そこで、表7(1988年)の項目4についてのユールのQを求めてみる。各血液型の人数はわかっているので、項目4に対する非A型の肯定率を求めることができ、それは42,8%となる。A型の肯定率は35.9%なので、A-非Aと、「当てはまる」-非「当てはまる」(1-肯定率で計算した)でざっとユールのQを求めてみると、およそ0.145、同様に表4(1980年)で求めると0.083となったので、各年度ごとに項目4について計算したのだろうと推測できる。
 もっとも、上に引用したように、「1項目だけが低い関連しか示していない点を考慮すれば」の意味がまたよくわからない。相関がない方が値が低いので、ここはおそらく「1項目しか高い関連を示していない点を考慮すれば」の間違いではないかと思われる。あるいは、「24項目もあるうち、たった1項目だけに有意な差が認められたが、その1項目でさえ、関連は低い」ということか。

 2つ目は、この連関係数(ユールのQ)が、年を追うごとに増加しているということである。論文に挙げられている数値を出しておくと、
   0.082→0.095→0.148→0.144
となっている(1986年から1988年にかけては若干減少しているが)。自分でもざっと計算してみたが、最後の桁が1程度ずれただけで、ほぼ再現した。これを、表8の数値と合わせて解釈してみる。まず、どの血液型も、後の年度になるにつれて、「物事にこだわらない」を肯定する率が増える傾向があることに注意する必要がある。つまり、血液型に関係なく、日本人全体として「物事にこだわらない」(少なくとも自分では自分のことをそう思っている)人が増えている、ということである。次に、連関係数の上昇の意味であるが、これは、A型における肯定率の上昇率よりも、非A型における上昇率の方が大きい、つまり非A型はえらい勢いで「物事にこだわらな」くなっている、ということを意味する。このことは、日本人全体の傾向として「物事にこだわらな」くなっているけれども、A型は「こだわる」性格なのであるという知識汚染により、自らを「こだわらないことはない」性格であると規定してしまう傾向がある(こだわらなくなる方向にたいして一定のブレーキがかけられている)ということを示唆している。
 この論文では、これを「予言の自己充足現象(self-fulfilling-prophesy)」が進行している可能性の示唆であるとしている。いわゆる「自己成就予言」であろう。
 この2つ目の論点は重要で、これが山崎-坂元論文につながっていくのだが、それはまた別の機会に譲る。

4. 考察
 本論文では、全国から多段層化無作為抽出した延べ10,000名の調査結果を基にして(論文では「層化」が入っているが、どう「層化」された抽出なのかは不明)、血液型と性格との関連を分析した。
  • この調査の実施方法・標本抽出法は統計的に十分な信頼性を有していると考えられる。
  • 性格に関する24項目への肯定率は、どの年度も3~4項目が血液型別に有意な差を示した。
  • しかし、すべての年度で有意であった項目は、1項目しかなかった。
  • その1項目も、最高の肯定率を示す血液型が年度によって異なっており、一貫性を欠いていた。
もし、血液型ステレオタイプが妥当なものであれば、最後の点では一貫した差が見られなければならない。しかし、24項目もありながら、一貫した差のある結果は見られなかった。
 以上より、血液型ステレオタイプは妥当性を欠く、と結論される。

ほたるいかの書きつけ ほたるいかの書きつけ
ほたるいかの書きつけ ほたるいかの書きつけ

*1 ) 表4の項目4は、χ2=9.639で**、つまりP<0.01だ、となっている。ところが、自由度3の場合、P<0.01になるためには、χ2>11.34でないといけないはずなのだが(少なくとも私が持っている教科書の表では)、よくわからない。P<0.05のためにはχ2>7.81 なので、それは満たしている。同様の理由で、項目14も、P<0.01ではなくP<0.05ではないかと思うのだが。
 念のため、表4の項目4についてのみ、χ2を計算してみた。方法は、各血液型ごとに、人数×肯定率と人数×(1-肯定率)を計算し、4×2のマトリックスを作る(数値は丸めて整数にする。人数なので)。あとは通常の(おそらく、通常の)χ2を求める方法で計算する。実際に表4に書かれている9.639に丸め誤差の範囲で一致した。この方法を取る以上、自由度3であることは明白なので、自由度3のχ2分布を見ると、これはP<0.01ではない(P<0.05ではある)。
 この計算が正しいとすると、表4の項目4、項目14は**ではなく*、つまりP<0.01ではなくP<0.05と修正されなければならない。他の年度については、χ2の値を信じる限り、アスタリスクの数は正しく付けられている。


***

以上が松井(1991)の内容である。コンンパクトかつ簡潔な論文であり、実に力強い印象を与える。
 ABO FAN氏のウェブページを見ると、なんとか誤差の範囲ということにして、相関があるという結論を維持するのに必死であることが窺える(ABO FAN氏が「タイプIIエラー」にこだわるのも理解できよう)。しかし、当然ながら、そもそも相関があるとは言えない、という結論が出ているのである。帰無仮説が棄却できていない。この状態でどんなに誤差の議論をしても-それ自体は重要なことではあるが-そこから血液型と性格に相関があるなどという結論に持っていくことが不可能なのは、統計学の心を理解していればすぐにわかることであろう。

 本論文に出てくる計算をすべてフォローしているわけではないことは御了解いただきたい。チェックした一部については本文に明記した。本来ならば、すべての数値について再解析して報告すべきであろうが(血液型と性格に興味を持つ、心理学を学ぶ大学院生ならそうすべきだ!)、そこはご容赦願いたい。
 JNNの調査は現在でも行われており、自己成就予言が現在の時点でどうなっているかは興味のあるところである(質問項目が同じかどうかは知らないのだが)。続報が待たれるところだ(このすぐ後に出た山崎-坂元論文については、いずれまたご紹介したい)。

 私自身は統計そのものにはそれなりに慣れ親しんでいるけれども、検定についてはきちんと体系的に学んだことがない。特に、「ユールのQ」については、この論文で初めて知ったし、それで慌てて計算ができる程度に学んだにすぎない。であるので、その深い理屈や定量的な理解などはまったく不十分なままであり、表面をなぞるだけの報告になってしまった。フォローしていただければ幸いである。

 今回のレビューでは、表をあえてスキャンしたものを載せた。そのため若干見にくくなってしまったかもしれないが、本物の息吹を少しでも皆さんと共有したいとの思いからである。血液型性格判断批判の資料として役立てていただければ幸甚である。

「血液型と性格」の正しい理解のために:松井(1991)その1

 本エントリでは、以下の論文を紹介する。
    松井豊「血液型による性格の相違に関する統計的検討」、1991、立川短大紀要、24、51-54
取り上げることにしたいきさつ等については、前エントリを参照いただきたい。なお幾つかの論文を孫引きしているが、そこまでは参照していないことをお断わりしておく。また、論文に書いていないことも若干ではあるが補足していることも注意していただきたい。章番号はこちらで勝手につけたものである。さらに、論文自体がコンパクトであるため、方法や結果についての紹介の部分では、限りなく引用に近い記述となってしまっているところがあることをお詫びする。

   「血液型と性格」論文レビューをするにあたって(前エントリ )
   1.はじめに
   2.方法(以上本エントリ)
   3.結果
   4.考察(以上次エントリ )

1. はじめに
 ABO式血液型によって人の性格が異なるという信念を、血液型ステレオタイプと呼ぶ(詫摩武俊・松井豊1985、「血液型ステレオタイプについて」、人文学報(東京都立大学)、145、57-71)。この手の研究のうち、現代において流通している血液型性格判断の直接のルーツとなるものは古川竹二によるものだろう(古川竹二1932、「血液型と気質」、三省堂)。これはアカデミックな場だけでなく、一般社会においても反響を呼んだが、医学界や心理学界から多く批判され、1930年代には姿を消した。ところが、1970年代以降、能見正比古らにより「血液型性格学」「血液型人間学」などの名でアカデミックな場とは無関係に大衆向けの書籍が数多く出版され、今に至るブームとなっている(なおこのあたりの流れについては、こちらのエントリ を参照してください)。
 ステレオタイプ自体、社会においては危険なものであるため、心理学者によって批判がされてきた。批判の立脚点は、心理学の立場からであるためと思われるが、心理学者が取ったデータにおいて血液型による性格の差が見られない、ということであった。また、能見らの「血液型性格学」のデータの収集法が明確でないことも批判の対象となった。一方、擁護側は、批判者(心理学者)が用いたデータの数が少ないということから再批判を展開しているた。
 ところが、統計学的に見ると、どちらの立場も立脚するデータに多くの問題が存在していた。それは、(1)データの代表性、(2)結果の交差妥当性、である。実際のデータ解析に入る前に、これらの問題を概観しておく。

  1. データの代表性
     これはいわゆる「ランダムサンプリング」の問題である。能見らのデータが、自著の読者カードに基づいたものであり、著しく偏ったものである(著書に納得した読者の方が読者カードを返送する割合が高い)ということは良く知られた問題であるが、一方、批判者側も、自身の勤務する大学の学生がサンプルであるなど、必ずしもランダムサンプリングになっているとは言い難いものであった。松井の言葉を引用すると、「これらのデータは母集団の規定が明確でない。従って、これらのデータには本来一切の統計的検定を行なうことができない。」となる。

  2. 交差妥当性
     交差妥当性とは、いわゆる結果の安定性の問題に関連するものである。ある標本で成り立つ関係が、別の標本でも成り立っているか、というものである。例えば、母集団からある標本を抽出し、回帰分析を行ったとしよう。そこで得られた関係式が、別の標本についても成り立っているか、ということである。これを示すために、標本を二つに分け、片方の標本で解析を行い、それがもう片方でも成立しているかどうかを検証するなどの方法が取られることもある。
     批判側のデータの多くは一回の測定で得られたデータに依拠しており、他の標本にも妥当するかどうかの検証がない。また擁護論のデータは測定指標などがデータごとに異なるため、交差妥当性の検証を行っているとは言えない。

 以上の問題点をふまえ、この論文では、「血液型ステレオタイプに対する科学的な検討を行うことを目的として」、既存のデータを再解析する。そのための留意点として、(1)統計的に信頼性が高く、代表性のあるデータを用いる、(2)複数の結果を比較し、交差妥当性を検証する、を挙げている。前者については13歳以上59歳までの日本在住者から無作為抽出されたデータを用いる(論文では「日本に在住する成人」となっているが、20歳未満も含むため、「成人」というのは誤りだろう)。後者については、同一の測定指標を用いた複数の結果を比較し、それらの間に一貫する差が認められるかどうかを検証する。ここでは複数年度の調査結果を比較することにする。

2. 方法
 本論文では、JNNデータバンクの調査結果、4年度分を使用する。以下、正確を期すために引用する。
 このデータは、満13才(ママ)から59才(ママ)までの男女約3000名(有効データ数は表1を参照)を、全国無作為3段抽出した調査である。抽出は、1段で都道府県または市部を抽出し、2段で町丁を抽出し、3段で対象者を抽出している。標本は、都道府県人口によるウェイトで各地区に割り当てている。調査地域は、全国の都市部で、全人口の4分の3をカバーしている(調査地点は表2参照)。
 調査は留置法と面接法の併用で実施されている。
ということである。なおJNNデータバンクについては、このウェブページ あるいはこちらのページ を参照されたい。
ほたるいかの書きつけ ほたるいかの書きつけ
 調査時期は、1980年10月、1982年10月、1986年10月、1988年10月である。なお1984年10月のデータには血液型に関する設問が含まれていないため、分析から除外された。

 分析対象となった質問項目は、「性格・人柄」に関する項目(24項目;表3)と、ABO式血液型の項目である。血液型に関して、「型がわからない」と回答した者、無回答の者は解析から除外した。「性格・人柄」の設問は、回答者に当てはまるか否かを2件法で答える多重回答形式である。

 「性格・人柄」への回答と血液型への回答をクロス集計(2件法×4つの型)、比率の差についてχ2検定を行った。
ほたるいかの書きつけ
(次エントリに続く)