心理学の性格テストで血液型の差が出ない理由と根拠は統計学的に説明できる

「血液型と性格」は、はっきりいって、従来の心理学にとっては鬼門です。

というのは、心理学で「正統」とされている従来の性格検査(性格テスト)では、血液型による差がほとんど出ないか、あるいはバラバラだからです。

つまり、統一的な説明が不可能なので、「関係ない」としか言いようがない…。

たまに、あるいは偶然かどうか知りませんが、“予想どおり”の差が出ていたとしても、無視できるほど小さい場合がほとんどです。

しかし、全く反対に、性格検査を使ってない理学論文「有名な特性」についての大規模なアンケート調査では、明確な差があることが繰り返し確かめられています。

 

最近になって、その理由が徐々にわかってきました。

 

実は、現実のデータを調べてみると、たとえ一見すると同じように思える質問でも、「血液型」より「年齢」「性別」の影響が大きい場合もあり、そうでない場合もあるようです。

※厳密に言うと、時代背景によっても微妙に影響があることがわかっています。

 

当然のことですが、血液型より年齢や性別の影響が大きい質問なら、統計学の“常識”に従って、老若男女を均等に調べる「ランダムサンプリング」なんかをすると、結果が極めて不安定になってしまうのです。

確かに、そういうことなら、心理学の性格検査の結果が見事にバラバラで、ほとんど一致しないのにも納得です。

 

つまり、安定した結果を出すためには、大学生のような同質なサンプルで、しかも大きな差が出る「有名な特性」を使うのが一番確実ということですね。

 

これだとわかりにくい人がいるかもしれないので、もう少し具体的に説明してみましょう。

 

例えば、手持ちのデータで「精神的ダメージがあると体に変調が現れる」というのがあります。

結果のグラフを見ると、全般的にA型にそういう傾向が多いことが見て取れます。

※AB型は数が少ないため、ややグラフが凸凹しています。

こういう質問では、男女の差が血液型より大きいため、従来のアンケート調査のように、男女同数で全年齢をくまなく調査した「世論調査」のようなランダムサンプリングのデータでは、差が目立たなくなる(統計的に有意な差が出なくなる)傾向があります。

理由は統計学的(数学的)に証明できるのですが、ここでは厳密な説明はせず、イメージ図を使ってお話しすることにしましょう。

 

さて、質問はこのデータにならって、次のようなものとします。

 

  【質問

  あなたは精神的ダメージがあると体に変調が現れますか?

  あてはまるかどうか、0から100%の間で回答してください

 

この質問には、現実に女性の方があてはまると回答しているので、仮に女性の平均を60%、男性の平均は40%とします。すると、回答者の分布は次のイメージ図のようになります。

ここで、男女別の回答者の分布の山の形と、男女合計の山の形を比べてみましょう。

当然ながら、男女を合計した方が「なだらか」で差が目立たなくなります。

元々が違うものを合計したのだから当然ですね!

まぁ、ここまでは直感的に理解できると思います。

 

では、血液型別の傾向を、男女別々に比べた場合と、男女を合計して比べた場合はどうでしょうか?

これまた考えるまでもなく、男女別々に比較した方が差が目立つことになります!

 

ということですから、一般的に血液型の特徴を比較するときは、男女、年齢…を別々にして比較した方がいいのです。

そう言われれば、確かにそのとおりですね!

だから、多くの人が血液型による差を感じることができるのでしょう。

 

それを、血液型による差は「年齢」や「性別」に関係ないはずだ、だから無視していい、というように頭から決めつけて、男女や年齢構成に関係なく比較してしまうと、当然のことながら差が小さくなるか、ほとんど目立たなくなります(少なくとも見かけ上は…)。

 

これを裏付けるように、多くの心理学者のデータでは、自分の教えている大学生のような「同質」なデータでは差が出ているのに対して、統計の“常識”に従って「ランダムサンプリング」をした世論調査のようなものでは、仮に差が出たとしても小さくなっているようです。

 

ところで、通常のケースでは、血液型の差(回答率の差で10%から20%)を安定的に検出するためには、数百人のデータが必要となります(計算方法は省略します)。

この場合に、ある質問の「血液型」の影響と「年齢」や「性別」による影響が同じだとすると、血液型の統計的な差を安定的に検出するためには、少なく見積もっても1000人以上のデータが必要となります(t-検定のt値は、サンプル数の2乗、あるいは標準偏差に反比例するので…)。

ましてや、「有名」な特徴の質問ではなく、差が小さいと思われる質問なら、数千人程度でもきちんとした結果が出るかどうか…。

 

これらのことは、心理学の性格検査にも、ほぼそのままあてはまります。

一般的な性格検査では、1つの「性格因子」を決めるのに、普通は数問から数十問の質問をします。

それなら、100人や200人程度の調査で安定した差が出るはずがありません!

逆に、大規模な調査では、性別や年齢による差は考慮していないようですし、質問も血液型による差が小さいと予想されるものが多いのです(「有名」な特徴ではないため)。

 

なぜ心理学の性格検査の調査では差が出なかったのか、あるいは出たとしても予想される結果と違ったり、差が小さい場合が多いのか?

そしてまた、なぜ心理学の性格検査の調査ではほとんど差が出なかったのにもかかわらず、日本人の約7割が血液型と性格に関係があると感じているのか…。

その理由は、以上のことから統計学的にうまく説明できます。

これで、理論的な考察と、マクロ的な分析、そしてまたミクロ的な分析が全て一致しました。

 

以上から言えることは、心理学者の調査で血液型による差が出ない、あるいは小さいという結果は、あくまで見かけ上のことだけということです。

なぜこんな簡単なことに誰も気が付かなかったのでしょうか? 

 

あとは、追試や他の人の検証を待つだけです。 v(^^) 

2017.11.12更新

 

【追記】裏付けとなる心理学論文を発見!

なんと、私の推測は大阪大学の大規模調査のデータでも裏付けられていました。

しかも、これらの結果は「発達心理学研究」という、れっきとした心理学の学会誌にも掲載されていたのです!

  

代表的な心理学の性格検査である「ビッグファイブ」の結果が典型で、この論文で注目すべきもの(外向性=Extraversionと開放性=Openness)を示しておきます。見たとおりで、「ランダムサンプリング」をすると、年齢(age)や性差(gender)の影響が大きくなるので、(血液型などの)性格の差は見かけ上小さくなります。

しかし、我々が観察する場合は、年齢や性差が同じ場合を比べているはずなので、きちんと差が出ることになります。

[注:性格検査の項目の選び方からすると当然の結果である]

 

これで、「血液型と性格」をめぐる謎は、少なくとも統計的には解決したことになります!

実にうれしくなってしまいました。v(^^)

2018.1.28更新

出典

ビッグ・ファイブ・パーソナリティ特性の年齢差と性差:大規模横断調査による検討

川本 哲也, 小塩 真司, 阿部 晋吾, 坪田 祐基, 平島 太郎, 伊藤 大幸, 谷 伊織

発達心理学研究 発達心理学研究 / 26 巻 (2015) 2 号 / p. 107-122

https://www.jstage.jst.go.jp/article/jjdp/26/2/26_107/_article/-char/ja

 

抄録

本研究の目的は,大規模社会調査のデータを横断的研究の観点から二次分析することによって,ビッグ・ファイブ・パーソナリティ特性に及ぼす年齢と性別の影響を検討することであった。分析対象者は4,588名(男性2,112名,女性2,476名)であり,平均年齢は53.5歳(SD=12.9,23–79歳)であった。分析の対象とされた尺度は,日本語版Ten Item Personality Inventory(TIPI-J;小塩・阿部・カトローニ,2012)であった。年齢と性別,それらの交互作用項を独立変数,ビッグ・ファイブの5つの側面を従属変数とした重回帰分析を行ったところ,次のような結果が得られた。協調性と勤勉性については年齢の線形的な効果が有意であり,年齢に伴って上昇する傾向が見られた。外向性と開放性については性別の効果のみ有意であり,男性よりも女性の外向性が高く,開放性は低かった。神経症傾向については年齢の線形的効果と性別との交互作用が有意であり,若い年齢では男性よりも女性の方が高い得点を示した。

 

【再追】参考となる情報

韓国で実際に得られた結果も、これらの推測が正しいことを示唆しています。

 

大学生を対象に研究を実施した結果、最も一般的な性格検査と呼ばれる性質のビッグファイブ性格検査と血液型の間には統計的に有意な関係がないことがわかった。しかし、ビッグファイブ性格検査ではなく、血液型別の性格、特定の固定観念形容詞としての性質を測定した場合には、血液型に応じた性格の有意差があることが分かった。特に4つの血液型の中でも、血液型別の性格特徴の固定観念のレベルが高いA型とB型にあっては、統計的に有意な結果が明らかになった。そして血液型別性格類型の信頼レベルに基づいて集団を分けて比較した結果、信頼性の高い人ほど、血液型別の性格、特定の固定観念に一致する方向に自分の性格を見ている傾向があり、信頼レベルが低い人の場合には、血液型別の性格、特定の固定観念に関する性格を測定した場合には、ビッグファイブと同様に、血液型による有意な性格の違いを示さなかった。これらの結果は、血液型と性格の間に実質的な関係がなくても、血液型と性格についての人が持っている信念が人の思考や行動に影響を及ぼし、実際の自分や他人の評価を変更することもあることを示唆している。

出典:Sohyun Cho, Eunkook M. Suh, Yoenjung Ro. (2005). Beliefs about Blood Types and Traits and their Reflections in Self-reported Personality. Korean Journal of Social and Personality Psychology, 19(4), 33-47.

 

血液型別性格類型の差があると言っても、ビッグファイブがこれを測定することができないのではないのか慎重に検討してみる必要がある。個別の質問では有意差があっても、ビッグファイブ因子として合計すると、血液型による差が相互に相殺されて現われない可能性を排除することができないからだ。

(中略)

[上記Sohyun Choらの]データを質問項目別に再分析してみた結果、10個の質問項目で血液型との関係が発見された。☞下の図の赤枠部分

出典:Sung Il Ryu, Young Woo Sohn. (2007). A Review of Sociocultural, Behavioral, Biochemical Analyses on ABO Blood-Groups Typology.  Korean Journal of Social and Personality Psychology, 21(3), 27-55.

 

2018.5.6追記