心理学の性格テストで血液型の差が出ない理由と根拠は統計学的に説明できる

「血液型と性格」は、はっきりいって、従来の心理学にとっては鬼門です。

というのは、心理学で「正統」とされている従来の性格検査(性格テスト)では、血液型による差がほとんど出ないか、あるいはバラバラだからです。

つまり、統一的な説明が不可能なので、「関係ない」としか言いようがない…。

たまに、あるいは偶然かどうか知りませんが、“予想どおり”の差が出ていたとしても、無視できるほど小さい場合がほとんどです。

しかし、全く反対に、性格検査を使ってない理学論文「有名な特性」についての大規模なアンケート調査では、明確な差があることが繰り返し確かめられています。

 

最近になって、その理由が徐々にわかってきました。

 

実は、現実のデータを調べてみると、たとえ一見すると同じように思える質問でも、「血液型」より「年齢」「性別」の影響が大きい場合もあり、そうでない場合もあるようです。

※厳密に言うと、時代背景によっても微妙に影響があることがわかっています。

 

当然のことですが、血液型より年齢や性別の影響が大きい質問なら、統計学の“常識”に従って、老若男女を均等に調べる「ランダムサンプリング」なんかをすると、結果が極めて不安定になってしまうのです。

確かに、そういうことなら、心理学の性格検査の結果が見事にバラバラで、ほとんど一致しないのにも納得です。

 

つまり、安定した結果を出すためには、大学生のような同質なサンプルで、しかも大きな差が出る「有名な特性」を使うのが一番確実ということですね。

 

これだとわかりにくい人がいるかもしれないので、もう少し具体的に説明してみましょう。

 

例えば、手持ちのデータで「精神的ダメージがあると体に変調が現れる」というのがあります。

結果のグラフを見ると、全般的にA型にそういう傾向が多いことが見て取れます。

※AB型は数が少ないため、ややグラフが凸凹しています。

こういう質問では、男女の差が血液型より大きいため、従来のアンケート調査のように、男女同数で全年齢をくまなく調査した「世論調査」のようなランダムサンプリングのデータでは、差が目立たなくなる(統計的に有意な差が出なくなる)傾向があります。

理由は統計学的(数学的)に証明できるのですが、ここでは厳密な説明はせず、イメージ図を使ってお話しすることにしましょう。

 

さて、質問はこのデータにならって、次のようなものとします。

 

  【質問

  あなたは精神的ダメージがあると体に変調が現れますか?

  あてはまるかどうか、0から100%の間で回答してください

 

この質問には、現実に女性の方があてはまると回答しているので、仮に女性の平均を60%、男性の平均は40%とします。すると、回答者の分布は次のイメージ図のようになります。

ここで、男女別の回答者の分布の山の形と、男女合計の山の形を比べてみましょう。

当然ながら、男女を合計した方が「なだらか」で差が目立たなくなります。

元々が違うものを合計したのだから当然ですね!

まぁ、ここまでは直感的に理解できると思います。

 

では、血液型別の傾向を、男女別々に比べた場合と、男女を合計して比べた場合はどうでしょうか?

これまた考えるまでもなく、男女別々に比較した方が差が目立つことになります!

 

ということですから、一般的に血液型の特徴を比較するときは、男女、年齢…を別々にして比較した方がいいのです。

そう言われれば、確かにそのとおりですね!

だから、多くの人が血液型による差を感じることができるのでしょう。

 

それを、血液型による差は「年齢」や「性別」に関係ないはずだ、だから無視していい、というように頭から決めつけて、男女や年齢構成に関係なく比較してしまうと、当然のことながら差が小さくなるか、ほとんど目立たなくなります(少なくとも見かけ上は…)。

 

これを裏付けるように、多くの心理学者のデータでは、自分の教えている大学生のような「同質」なデータでは差が出ているのに対して、統計の“常識”に従って「ランダムサンプリング」をした世論調査のようなものでは、仮に差が出たとしても小さくなっているようです。

 

ところで、通常のケースでは、血液型の差(回答率の差で10%から20%)を安定的に検出するためには、数百人のデータが必要となります(計算方法は省略します)。

この場合に、ある質問の「血液型」の影響と「年齢」や「性別」による影響が同じだとすると、血液型の統計的な差を安定的に検出するためには、少なく見積もっても1000人以上のデータが必要となります(t-検定のt値は、サンプル数の2乗、あるいは標準偏差に反比例するので…)。

ましてや、「有名」な特徴の質問ではなく、差が小さいと思われる質問なら、数千人程度でもきちんとした結果が出るかどうか…。

 

これらのことは、心理学の性格検査にも、ほぼそのままあてはまります。

一般的な性格検査では、1つの「性格因子」を決めるのに、普通は数問から数十問の質問をします。

それなら、100人や200人程度の調査で安定した差が出るはずがありません!

逆に、大規模な調査では、性別や年齢による差は考慮していないようですし、質問も血液型による差が小さいと予想されるものが多いのです(「有名」な特徴ではないため)。

 

なぜ心理学の性格検査の調査では差が出なかったのか、あるいは出たとしても予想される結果と違ったり、差が小さい場合が多いのか?

そしてまた、なぜ心理学の性格検査の調査ではほとんど差が出なかったのにもかかわらず、日本人の約7割が血液型と性格に関係があると感じているのか…。

その理由は、以上のことから統計学的にうまく説明できます。

これで、理論的な考察と、マクロ的な分析、そしてまたミクロ的な分析が全て一致しました。

 

以上から言えることは、心理学者の調査で血液型による差が出ない、あるいは小さいという結果は、あくまで見かけ上のことだけということです。

なぜこんな簡単なことに誰も気が付かなかったのでしょうか? 

 

あとは、追試や他の人の検証を待つだけです。 v(^^) 

2017.11.12更新