「血液型と性格」の正しい理解のために:山崎-坂元(1991)その2(追記・修正あり) | ほたるいかの書きつけ

「血液型と性格」の正しい理解のために:山崎-坂元(1991)その2(追記・修正あり)

前エントリ に引き続き、以下の論文の後半を紹介する。
   山崎賢治、坂元章「血液型ステレオタイプによる自己成就現象-全国調査の時系列的分析-」、1991、日本社会心理学会第32回大会発表論文集、288-291

   1. 問題と目的
   2. 方法
   3. 結果(この章の前半まで前エントリ 、後半以降は本エントリ)
   4. 考察

3. 結果
重回帰分析
 回帰分析を実行するため、値に数値をふった(A型:0、B型:1、男性:0、女性:1)。主効果として、血液型・性別・年齢・調査年次の4つを用いた。そして多重共線性の影響を避けるべく(一次従属な変数があると困るので)、これらを標準化(平均=0、標準偏差=1)した後、それらのうちの2変数をかけあわせることで2次の交互作用項6変数を作成した。つまりは血液型と調査年次の交互作用により「A-B」得点がどう応答するかを見る、ということだ。
 以上の10変数を説明変数とし、「A-B」得点を目的変数として、ステップワイズ法(これについては申し訳ないが私は説明できない)により重回帰分析を行った。その結果が Table 4 である。
 ただし、Table 4 も、これ以降のグラフも、10変数すべてについて載っているわけではない。そこが、この論文の結果の解釈をする際の困難さを与えている。
ほたるいかの書きつけ
 論文では、(1)年齢、(2)血液型、(3)調査年次、(4)血液型と調査年との交互作用、の順に説明しているが、前エントリでも触れた(2)血液型から先に解説しよう。

【血液型】
 前エントリでも出した Fig.6 をもう一度示す。
ほたるいかの書きつけ
前回触れたように、8.15, 2.71 という「A-B」得点(100倍されてこの点数であることに注意)は、おそらく血液型・性別・年齢・調査年次で220のセルを作り、その上でセル同士を重み1で平均して血液型別の得点を出したのでは、と推測するが、そうやって得られたものである。ここで Table 4 を見ると、上から2番目の血液型の欄では、標準偏回帰係数βが-0.240となっている。これについてちょっと調べてみよう。
 数値化するために、最初にAを0、Bを1としたことは上で述べた。これを正規化(標準化)する。
 まず、A型は12466人、B型は6852人、合わせて19318人である。ここから平均値は
(12466*0 + 6852*1)/19318 = 0.3547
であり、標準偏差は 0→02=0, 1→12=1 であるので、(自乗平均-平均の自乗)の平方根を求めて0.2289である。正規化するには元の値(0または1)から平均値を引き、標準偏差で割れば良い。すると、Aは -0.7414、Bは1.3489 となった。これを使うと、ほぼ平均0、標準偏差1となることが確認できる。
 次に、回帰直線を求める。単純に考えて、いまは2点しか通っていないので、その2点を結ぶ直線の傾きを求めよう。これは単純に、
β = (0.0271-0.0815)/(1.3489+0.7414) = -0.026
となるはずである。
 ところが、Table 4 を見ると、β=-0.240となっている。一桁値が違う。これは一体どういうことだろうか?ここは残念ながら理解できないままである。なにか全然違う方法でやっているのだろうか?わかる方がいれば、御教示いただけると有り難い。私が重回帰分析あるいは「標準化」について理解していないというだけならいいのだが。

【年齢】
 次に、年齢と「A-B」得点の関係を見てみよう。私としては、これが実はこの論文で一番の衝撃であった。Fig.5 がそれである。
ほたるいかの書きつけ
見てわかるとおり、明らかに年齢が高くなるに従い「A-B」得点が高くなっている。10代と50代では、なんと0.25点も違うのだ(とりうるレンジが-1~+1であることに注意)。A型とB型では0.055点しか違わなかったのに比べ、およそ5倍も差があるのである。はっきり言えば、「A-B」得点を決めるプライマリーは年齢であり、血液型ではない。もし年齢によってA型の人数とB型の人数が少し異なれば、色々説明できてしまいそうな勢いである。
 無論、サンプルサイズがとても大きいので、年齢ごとの血液型分布のゆらぎですべて説明できるわけではないだろう。ごく単純に各年代に等分配されていれば、各年代でB型だけでも1400人程度いる計算になる。だから、±40人程度が予想される誤差であり、これだけではたとえ年齢で0.25点違うといっても、A型とB型との間でその1/5「も」ある違い(0.055点)を説明することは無理だろう。
 とはいえ、やはりこちらがプライマリーなのであるから、年齢ごとの血液型分布(A型とB型の人数)も示して欲しかったと思う。

(追記)修正ついでにこんな図を作ってみた。年齢による「A-B」得点の違いが、血液型に比べてどれくらい大きいかを示す図である。ここでA型、B型の得点は、Fig.6 のものである。
ほたるいかの書きつけ


【経時的変化】
 さて、いよいよ年次経過の話に移る。しかしまずは血液型別ではなく、全体の傾向を見てみよう。
 下に示すFig.7は、「A-B」得点が時とともにどのように変化してきたかを示すものである。白抜き四角は各年次の得点、破線は回帰直線である。横軸に調査年、縦軸に「A-B」得点を100倍した値をプロットしている。
 これを見ると、最近になるにつれ、「A-B」得点が減少している、つまり「B型的」になっていることが見て取れる(念のために言っておくと、「B型的」とカッコをつけたのは、もちろん美術大生の血液型ステレオタイプにおいて「B型的」という意味だからである。実際のB型の性格と関係あるかは最後になって結果としてわかることである)。論文の文章を引用すると、
日本人は「B型的」性格になりつつある。
ということになる。
 この理由はもちろんわからないが、これも年齢による「A-B」得点の違いが大きな影響を及ぼしていると見るべきであろう(無論、なぜ年齢によって違うのか、というのが本質的であろうというだけで、その理由はここではわからない)。
 さて、回帰直線が引かれると、それにつられて右に下がっているような気になるものである。実際、回帰分析をやってそういう傾きの直線になったのだから、データ解析の結果としてそれが間違っているというわけではない。しかし、注意しなければならないのは、データ点が単調に減少しているわけではない、ということである。確かに最終年度が一番「A-B」得点は低い。しかし、二番目に低いのはその前年ではなくて、ずっと前の1980年なのだ(グラフが歪んでいなければ)。これは、グラフには描かれていないけれども、各年ごとに大きなエラーバーがつくものと見るべきだ。つまり、サンプリングにより、回帰直線まわりのデコボコを含む程度には大きな誤差がある筈である。これについては、一通りこの論文を論文に沿って紹介したあと、再び議論することにしよう。
ほたるいかの書きつけ

【血液型別の経時変化】
 いよいよお待ち兼ねの、血液型別の経時変化である。とりあえず図を見ていただこう。下のFig.8がそれである。Fig.7と同様であるが、白抜き四角はA型の人のみのもの、プラス記号はB型の人のみのものである。各年ごとに、A型とB型の得点を2:1程度で平均してやると、Fig.7になるはずのものである。
 …と当初は思っていたのだが、実際にそうやって図に描き込んでみると、どうもそうではないようである。単純にA型とB型の得点を足して2で割っているだけのように見える。ということは、前エントリでも少し触れたが、血液型(2)×性別(2)×年齢(5)×調査年次(11)で220のセルを作り、各セル内で平均したあとは、それぞれのセルは対等(重み1)で平均されているのでは、と思わざるを得ない。とすると、Fig.7でプロットされた得点は、「日本人の」ではなくて、B型の日本人のウェイトを重くして平均した得点、ということになってしまう。ここは一つ問題だろう。

 さて、それはそれとして、結果を眺めてみよう。すると、確かに調査年が最近になるにつれ、A型とB型の得点は開きつつあるように見える。これをもって、論文では、
 血液型と調査年次の交互作用が検出された。A型は相対的により「A型的」に、B型は相対的により「B型的」にという変化を示した。これは、血液型ステレオタイプによる自己成就現象を意味する結果である。
と述べている。

 なお、Table 4 にある通り、血液型×調査年の重回帰分析では、結果が5%有意であることが示されている。かなり弱いと言えよう。
ほたるいかの書きつけ

4. 考察
 本章はすべて箇条書きにまとまっているので、そのまま全文引用する。太字は引用者によるコメントである。
  1. 大学生は明確な血液型ステレオタイプを有する。→Table 1
  2. 血液型と性格の自己報告との間の相関は、弱いが認められた。さらに、一般の人々の性格の自己報告は、大学生の血液型ステレオタイプに合致していることがわかった。→合致していると言えるだろうか?相対的には合致していると言ってもよさそうだが、B型の「A-B」得点も正、つまり「A型的」なのである。また、回帰直線を信用するとしたら、1970年代前半には血液型との相関はなくなると推定されることに注意。能見正比古が「血液型人間学」を提唱したころである。
  3. 年々、人々が「B型的」(物事にこだわらず、気がかわりやすい、等)になっていることが示された。これは近年の社会の非抑制化・自由奔放化を示唆するかもしれない。→定性的にはそう言えそうだが、注意すべき点が2点。「年々変化している」のか、「A型的」な高年齢層が徐々にサンプルから抜けているかなのかが不明(無論、若年者がなぜ「B型的」かという問題は残る)。それからFig.7の平均のとりかたに問題がありそうという点。
  4. A型は相対的により「A型的」に、B型は相対的により「B型的」にという変化を示した。それは血液型ステレオタイプによる自己成就現象を示している。これは、「血液型性格学」のマスコミ活動に原因を求められるのかもしれない。→「血液型と性格に強い相関がある」という誤った信念をもたらした「知識汚染」により「血液型と性格」に相関が生じてしまった、と言える(相関を「リアル」と見るならば)。
  5. 従来の研究は、(1)サンプル数が少なかった、(2)単独の特徴毎に分析していた、(3)A型とB型だけではなく、O型とAB型をも含めていた、などにより血液型と性格との関係を見いだせなかったのかもしれない。→そこまでデータをこねくりまわさないと見えない程度の微弱なシグナルである。
  6. ただし、血液型と性格の自己報告との間の関連は小さいものであり、その差を統計的に検出するには数千人単位のデータを要するのであり、個々人単位に「▽型の人は△△だ」といった主張はできないと思われる。→「○型××の説明書」的な本には根拠がまったくないということ(強い相関を仮定しているので)。
  7. 本研究では性格の自己報告を分析対象としたので、いくつかの未解決の問題が残った。それは、(1)血液型と性格との間に実際に関連があるのか、それとも、認知の歪みなのか、(2)自己成就現象に関しても、性格が実際に変化したのか、認知が変わっただけなのか、というものである。→定量的にはデータの取り扱いにも議論の余地があると思われる(後述)。
以上が山崎・坂元(1991)の紹介である。

【FSMによる考察】
 さて、ここから私による批判的考察に移る。「批判的」というのは「懐疑的」と言っても構わないのだが、その理由は、ひとえにこの論文が帰無仮説を棄却しようとしているからに他ならない。帰無仮説を棄却するということは、そこになんらかの意味のある状態があるということであり、それは強い主張である。強い主張をするからには、当然あらゆる方向からの批判が寄せられるものであり、それに耐え抜いた仮説が正しいものとして生き残るのである。それが通常の科学のプロセスである。そういう意味で、私としては、定量的にはともかく定性的にはこの論文が正しいだろうという予想を持ちつつ、考えられる「穴」を探ってみることにする。

 焦点はFig.7, Fig.8だ(本当は年齢の違いも重要だと思われるのだが、年代が10年ごとで調査期間が10年以上なので、示されているデータだけではどうにも考察ができない。考えられる点は既に述べたので、ここでは経時変化に焦点を絞る)。上でも述べたように、年ごとのバラツキが非常に大きい。それが何を意味するかを順次考えていこう。

 まず、図をちょっと改変して(便利な時代になったものだ)、回帰直線を消してしまおう。それを見て、どう思われるだろうか。
ほたるいかの書きつけ
この図から、元の回帰直線がどのあたりを通っていたか、想像できるだろうか。
 次に、最終年度(1988年)のデータを消してしまおう。これはつまり、1987年までのデータしか入手できなかったとしたら、結論がどう変わっていただろうか…という思考実験である。消した場合の図が以下である。
ほたるいかの書きつけ
ここまで来ると、「なんとなく右下がりかなあ」という気もするが、フラットであるという可能性も十分あり得る、と読めはしないだろうか。無論、1979年、1981年、1982年という組み合わせと、1983年からの4年間が、それぞれ似たような傾きで右に下がっているので、右下がりに見えてしまうけれども。
 無論、1980年(左から3つ目)のデータを消せば、こんどはかなりクリアに右下がりになっていると読めるようにも思える。
 これはつまり、回帰分析で有意になったからと言って、それが実際にどれくらい意味のあるものなのかを示したことにはならない、といういい例になっているのだ。そして、各データ点は、このバラツキ程度には誤差を持っているのだろうということが想像できるわけだ。

 次に、Fig.8 についても同様の処理をしてみる。
 まずは回帰直線を消してみよう。
ほたるいかの書きつけ
まだなんとなく右下がりに見える。次に、最終年度のデータを消してみよう。
ほたるいかの書きつけ
すると、A型については、1981年以降は単調に減少しているものの、1980年以前のほうがより「B型的」であり、全体を通してみると、「B型的」になっていると言うにはかなり抵抗を感じざるを得ない。B型については、バラツキが非常に大きく、1984年までのバラツキがむしろ普通で、それ以降似たような得点(正であることに注意!)であることの方が偶然ではないかと思われる。
 ただし、A型とB型では、相対的には系統的な違いがあるようには見えるので、違うのは違うのだろう。無論、その違いは論文でも述べられているようにごくわずかなものである。「A-B」得点が[-1,+1]のレンジを取るのに対し、A型は0.08点、B型は0.02点程度なのだから、少なくとも日常生活で意味のあるような強い相関ではない。

 最後に、ちょっと(かなり)強引ではあるが、試みにFig.8にエラーバーをつけてみよう。A型の標準偏差を0.03、B型を0.04としてみたのが下の図である。この数値の根拠は実に適当であるが、Table 2 で82名のサンプルを220のセルに分けたときの標準偏差が0.11であり、JNNデータでは各年次でA,Bの人数が合わせて1680人程度というところから、ざっと見積った。(エラーバーの大きさには根拠はない)。無論、本来は220のセルでの標準偏差ではなく、各セルでの標準偏差を見ないといけないのだが、それはわからないので、強引につけてみた。
 (追記)Table 2 の平均値、標準偏差は、おそらくはFig.5の年齢による「A-B」得点の分布が決めていると思われる。というのは、Table 2では、平均値が0.054、標準偏差が0.11となっているが、Fig.5はまさにそんな感じだからだ(Table 2によると最小値が-0.24、最大値が0.28なので、それらを出したのがどのセルかは気になるところではあるのだが)。すると、血液型ごとに年齢構成がそう大きく変わらないのだとすれば、A型の得点もB型の得点も、個々のデータ点のまわりに±0.11(100倍すると±11)程度の分布の広がりがあると解釈すべきである。だから、この図では±0.03, 0.04 でエラーバーをつけてみたけれども、実際はもっと大きいと推測しても問題はないであろう。(ここまで)
ほたるいかの書きつけ
これくらいのエラーバーがあると、年度ごとのバラツキも「ああ、偶然だったんだな」という気になってくる。もちろん本当はもっと小さいかもしれないのだが、バラツキ程度にはサンプリング誤差があると考えるのは妥当であろう。でなければ、なぜ1980年だけ点が低いのか、とか、理由を考えなければならなくなる(そしてそんなことはありそうにない)。
 そしてもう一つは、標準偏差(誤差)の大きさは、違いが有意であるかどうかとは無関係(直接的には)、ということを示すいい例にもなっている、ということである。これについては「忘却からの帰還」の Kumicit さんがわかりやすい解説をされているので、そちらを参照されたい。
   「ブログ記事を動画にしてみるテスト
   「ABOFAN says personality does not depend on blood type.
   「ABOFAN fools abofans.
   「有意差 again
これらはABO FAN氏の主張を題材にしているけれども、単にそれだけではなく、標準偏差と有意差というものの違いをわかりやすく解説しているので、大変参考になる。

 というわけで、結論に対してはそれなりに批判的に書いてしまったけれども、おそらくは心理学界内部ではこの程度の批判はあっただろうと予想(期待)している。書籍では無批判に自己成就現象の示唆ということで載っている場合が多いけれども、それは専門家向けではないのだから、それはそれで良いのだと思う。ただ、非専門家といえども、興味のある人はこれくらいの分析は見ておいてもいいのではないかとも思う。
 で、私の結論であるが、自己成就現象はたしかにありそうに見えるけれども、ここは保守的に「なんとも言えない」という立場を取っておきたい。「ある」となったならば、それは血液型と性格に関係があるという言説がいかに非人道的か(人の一生を根拠のない主張によって左右する)ということが明瞭に浮かびあがってくるので、血液型性格判断を否定したいという立場からは自己成就現象はあってくれた方がいいわけである。その一方、そんな簡単に影響受けてたまるか、という実に主観的な気持ちもある(自分の成長過程を考えると、受けちゃうだろうなあ、とは思うのだけど)。
 そういうわけで、ぜひ、「その後」の結果を見てみたい。その後もこの論文で示したような傾向が続いているのであれば、結論は明らかになるだろう。その際は、年齢ごとの違いについても詳細な分析があると望ましい。

 最後に余談であるが、研究というものは、最初はどこかでエイヤッとやるところから始まるものだ。なので、この論文の結論が、もし今後より大規模な調査によって確定したとすれば、これは先駆的な仕事として高い評価を確定するだろう。
 そのような状況を辿った研究で有名なものが、宇宙の膨張を示す「ハッブルの法則」である。ハッブルの法則とは、我々からの距離が遠いほど、距離に比例して遠ざかる速度が大きくなる、というもので、これは空間が膨張していることを示すものだ。時々新書などでも出てくるので見た方もいるかもしれないが、一番最初にハッブルが報告したときは、以下のような図であった。
ほたるいかの書きつけ
1929年のことである(横軸が我々からの距離、縦軸が遠ざかる速度)。その後、距離の評価に系統的な誤差があることがわかり、傾きはおよそ1/7程度になったけれども、ここで示されているような直線であることに変わりはない。そして、直線のまわりのデータ点のなんとバラツいていることか! その後の詳細な観測によって追認されたから良かったものの、そうでなければ「蛮勇」の謗りを免れなかっただろう。

 自己成就現象が今後どういう道を辿るのかはわからない。しかし、それを研究する意味があることを示しているだけでも、この論文の価値は非常に大きいというべきだろう。ぜひ、「その後」を見てみたいものである。