(公開日:2020年5月28日)
以前の「実験法」の2回目の授業では,統計法の考え方の基本についてお話ししました。…が,どうしても数学的なお話になるので,難しかったという意見をたくさんいただきました(ごめんなさいね)。でも,統計法を用いるのは実験に限ったことではありません。また,心理学だけが統計法を使うわけでもありません。心理学に限らず,すべての学問において,科学的な観点から現象をとらえるときには,必ずデータに基づいて,統計分析が行われ,その結果に基づいて推論がなされます。
前回は,そのときの基本的な考え方をお話しさせていただいたわけです。でも,まだみなさんは1年生だし,わからないところが残っても構いません。これまでにも何度か言っているように,心理学の授業はこの後もたくさん受けることになります。その中で,心理学研究法や統計的な分析については,繰り返し耳にするはずですから,徐々に慣れていってくれればと思います (^^)。
勉強や学習で身につけるものには「知識」と「スキル」の2つの側面があって,「研究法」は,知識だけでなく,スキルとしての側面ももっています。ですから,使いながら身につけていくのがいいので,社会臨床心理学科では,そのための実習・演習授業を設けています。だから安心してくださいね。今のところは,「ふ~ん,そんなものなのか~」という感じで,わからないところは流しておいてもらっても構いませんので。
さて,今日も調査法の2回目の授業になりますが,例によってちょっと難しいお話をすることになります。よろしくお願いしますね。
観察法,実験法,調査法,検査法,面接法など,心理学の研究法にはさまざまな方法がありますが,これらの方法は,単にデータを収集するための方法というわけではないのです。 データを収集するときにとても重要なこととして,データを収集する時点で,すでにどのような分析をするのかを決めておく必要があります。というのは,分析手法が決まっていないと,どのようなデータが必要なのかが決まらないからです。だから,データ収集と分析は常にひとつのセットとして考えなければならないと思ってください。また,そのセットは,「その調査を通して,あなたは何を明らかにしたいのか」によって変わってくるのです。
前回の「イヌ・ネコ対決」では,みなさんをイヌ派とネコ派に分けてとらえる方法で調査をしました。質問紙調査ならば,下のような聞き方になりますね。
すると,結果の分析については,次の図のような形でそれぞれの割合を表して,どちらが多いかというような分析をすることになりますね。結果は,確率統計的に見て,ネコ派よりもイヌ派が有意に多いとは言えないというものでした。
でも,このデータ収集と分析で,見逃しているところはないでしょうか?
同じイヌ派(あるいはネコ派)に回答した人の中でも,たぶん,イヌ好き(ネコ好き)の程度はさまざまなはずですよね。先の調査では,その好みの程度を無視して,単にイヌ派とネコ派に強制的に分類してしまっているわけです。また,同じイヌ派(ネコ派)の中でも,「イヌも好きだけどネコも好き」とか「ネコも好きだけどイヌも好き」という人,いらっしゃいますよね! あるいは,「イヌひとすじで,ネコなんて眼中にない!」とかその逆の人もいらっしゃるはずです。そういった細かなところは,このデータ収集と分析方法を通して見えてくることはありません。
そこで,質問紙調査では,下のような尋ね方もできるわけです。それぞれの人で,イヌ好きの程度とネコ好きの程度を独立に調べるわけですね (この「独立に」というような表現にも慣れていきましょう ^^)。
この方法では,みなさんの中のイヌ好きの程度とネコ好きの程度を,それぞれ「ものさし」を使って測っています。このものさしのことを「尺度」といいます。とても重要な用語なので覚えておいてくださいね。
こうやって測定すれば,みなさんの中のイヌ好きの程度とネコ好きの程度を得点化(数値化)して,平均値はいくらかとか,どのくらいばらつき(個人差)があるかを標準偏差で示すことができますし,イヌ好きの程度とネコ好きの程度に違いがあるかをt検定という統計検定で調べることもできます。
また,それぞれの相関関係を調べることもできるようになりますね。「イヌ好きの人はネコ嫌い」なのでしょうか? これは負の相関ですね。それとも,「イヌ好きの人はネコも好き」なのでしょうか? これは正の相関ですね。他にも,みなさん自身は「アウトドア」派ですか? それとも「インドア」派? このような,人間がもつ特性が,イヌ好きやネコ好きの程度と何か関係していないでしょうか?
こういったさまざまな分析を行うことができれば,何か新しい発見に結びつくような気がしませんか? そうやって,切り込んでいくのが心理学研究なのです!
世の中に存在するものは,何らかの方法で「測る」ことができます。ものであればものさしを使って長さを測ることができますし,量りを使えば重さを測れます。新型コロナ感染症の脅威についても,さまざまな指標があるのですが,今,「新規感染者数」が重要な判断指標として用いられています。下の図は5月24日現在の全国の新規感染者数推移のグラフですが,4月11日には全国で720人報告された新規感染者数が最近は50人以下に抑え込まれていることが,緊急事態宣言を解除する判断の根拠になっているわけです。「1か月半経ったし,そろそろ解除していいんじゃないの~」というようなあいまいな判断でなく,このように数値的な指標を使って評価することで,現状をモニタすることもできますし,物事を判断する基準も与えてくれるわけです。
世の中で起きていることに比べると,心の中で起きていることは,手に取ってさわることもできないし,直接的には目にすることもできませんから,その数を数えることもできません。それを何とか工夫して測れないかと発展してきたのが「心理測定法」です。そこでは,目に見えない心を観察可能にするための「ものさし」(尺度)が開発されてきました。
まず,尺度には4つの分類があるので,それを説明します。これはとても重要なので(今は覚えられなくても,将来的には)覚えておく必要があります。重要な点は,ものさし(尺度)といっても「数量」とは言えないものもあることです。
名義尺度では,測定された値は単なる「ラベル」(名義)でしかありません。たとえば,男女の性別,病気の診断名,プロ野球の好きな球団,あるいはイヌ派かネコ派かなど,これらはどれもデータとしての意味は十分にもっていますが,そこには,順序や大小関係はありません。このようなデータを「名義尺度」と呼びます。
順序尺度とは,測定された値に大小関係はあるけれども,等間隔性がないものを言います。たとえば,大学の成績は「秀」,「優」,「良」,「可」,「不可」の5段階で出てきますが,これらは順序性はあるものの,「秀と優」の差が「優と良」の差と同じというような保証はどこにもありません。競技の順位なども,1位,2位…と数字はついているものの,等間隔ではないのでものさしとしては不完全です(数量化された指標ではありません)。ですから,足し算や引き算などの計算ができず,平均値などを求めてもあまり意味がないという欠点をもちます。
間隔尺度は,大小関係だけでなく,数値の等間隔性が保証されるものです。得点を数値化できますので,間隔尺度であれば足し算や引き算の計算ができ,平均を求めたり,標準偏差を求めたりなど,さまざまな統計処理が可能になります。実験法で得られる参加者のパフォーマンス(正答率や反応時間など)は一般的に間隔尺度として扱えます。また,標準化がなされた性格検査で得られた得点や,質問紙の評定法で測定された結果の一部も間隔尺度とみなされるのですが,厳密にいうと,心理的な反応ではなかなか等間隔性が保証されないので,そこを補うためにいろいろな尺度構成法や統計的手法が開発されています。
比率尺度は,等間隔性が保証されるだけでなく,絶対的なゼロの点が存在する尺度になります。心理学では,実験で物理的に測定される長さや大きさ,時間など以外に,比率尺度といえるものはほとんどないのが通常です。たとえば,ある科目のテストの成績が0点だったとしても,その人がその科目に関する知識がゼロだということはないですよね。
心理に限らないのですが,私たちがデータをとるときには,収集されたデータが,これら4つの尺度のうちのどの尺度に相当するのかを,正確に把握しておかなければなりません。なぜならば,それによって,使える統計分析も違いますし,適切な結果の集計方法も違いますし,研究の結果として結論できることさえも左右されるからです。
現実的には,統計分析を用いて結論を導こうとするならば,間隔尺度として分析可能なデータを収集することを目標にしますが,この下のリッカート尺度のところで述べるように,厳密には順序尺度データなのだけれども,間隔尺度とみなして分析を行うことも多くみられます。
物理的世界にあるものは,いろいろな方法でその特性(長さ,重さなど)を測ることができますが,人の心の中にある態度などを測定しようと思うと,ものさしを工夫しなければなりません。そのための方法が「尺度構成法」です。以下に主要な尺度構成法を示します。
順序尺度では使える統計分析が限られてしまいますが,それに対して,個人の態度を測定する方法のひとつである「サーストン尺度」は,間隔尺度として統計分析を可能にするために開発されました。下の表は,南アフリカ黒人に対する心理尺度の例(岡本,1991による)ですが,質問項目にはそれぞれ尺度値という得点が前もって与えられています。回答者は,質問項目に「賛成-反対」で答えるか,自分の意見に近い項目を2~3項目選ぶように指示され,賛成項目の尺度値の平均値や中央値をその人の態度得点とするという使い方をします。尺度値は,(簡単なところだけを言えば)たくさんの態度記述文を50~300人くらいのたくさんの判断者に11段階などで分類させます(もっとも極端なものを1と11におき,中立を6にするような形で分類させます)。その後,人によって判断が大きく異なるものを取り除くなどして,最終的に各項目が分類された段階の中央値を使って尺度値を割り当てますが,この予備調査が非常に面倒なので,最近ではあまり使っているところを見ることはありません。
順序性のある一連の態度文に対する賛否を求め,ひとつの態度文への賛成は,必ずそれより下位のすべての文への賛成であると考えて得点を与えます。下の例は外国人に対する社会的距離尺度の例です(態度文は実際にはランダムに配列されているそうです;岡本,1991による)。これで測定された得点は当然ながら順序尺度となります。
態度を測定するために,態度対象に対する賛否両論があるような記述文を複数提示して,それぞれの記述文について「賛成-反対」,「そう思う-そう思わない」などの1つの次元からなる態度を,5段階から7段階くらいで表明させる方法です。下の例は,情動的共感性の程度を調べる質問項目の一部です(加藤・高木,1980より抜粋)。リッカート尺度は,現在,さまざまな質問紙調査でもっとも広く応用されている手法です。この方法では,下の例で言えば,「全くそうだと思う」を7点,「全くちがうと思う」を1点として得点化するのですが,こうやって得られた得点は,厳密にいえば順序尺度であるという点は知っておかなければなりません。ただし,実際上,これを間隔尺度に近いと解釈して,得られた尺度値をそのまま統計分析に使うことも多く行われています。
反対の意味をもつ言葉を両極にもつ尺度です。リッカート尺度が,人の態度を測定するのに用いられることが多いのに対して,SD法は,さまざまな事物に対する心理的評価尺度として用いられます。下の例は,林(1978)が対人認知(他者のパーソナリティの認知)を調べるために使用した特性形容詞尺度の一部です。人に限らず,さまざまな製品の印象評価などにもしばしばSD法が使われています。
他にも,(実験でも使う方法ですが)一対比較法といって2つの項目のどちらが好きかなどを答えさせるのだけれども(例えば,巨人と広島とか,中日と阪神とか,すべての組み合わせで好きな方を選ばせる),その(それぞれ名義尺度の)データをもとに各球団の好感度を間隔尺度として表すことができる方法などもあります。ですが,主要なものは上に述べたものかなと思います。このうち,リッカート尺度法とSD法で作られたものがよく使われていますから,みなさんも目にすることがしばしばあるのではないでしょうか。
この後の解説は,理解できなくてもかまわないので,わからなければふ~んと流して聞いてくださいね (^^)。
以前お話しした実験法では,研究者が実験計画(要因計画)に基づいて独立変数を操作して,それが従属変数にどのように影響を及ぼすかを調べます。そのとき,測定される従属変数は,たとえば反応時間と正答率というように,せいぜいひとつかふたつで,たくさんあるわけではありません。ですから,実験法で用いる統計分析は,t検定や分散分析など,ひとつの従属変数を使ったシンプルなものが一般的です(難しかったってみんな言ってたけどね ^^;)。
それに対して,調査法では,ひとりの参加者から質問項目の数だけたくさんのデータ(変量)が得られることになります。このようにたくさんの変数を全体的かつ同時に分析する方法として「多変量解析」という統計分析法があります。多変量解析はひとつの統計分析法ではなく,得られたデータのどのようなところを知りたいかによって,必要な分析法が違ってきます。
たくさんの変数の中のどういう要素間の関係を知りたいのか,そのときに因果関係の存在を仮定しているのか,尺度は名義尺度や順序尺度のような「質的」な尺度なのか,それとも間隔尺度や比率尺度のような「量的」な尺度(数値)なのか…によって使用する分析手法も変わってくるのですね。ちなみに,多変量解析では,因果関係を問題にするときに,独立変数に相当する変数を「説明変数」,従属変数に相当する変数を「目的変数」(あるいは「基準変数」)と呼びます。下の表は,「多変量解析」をキーワードにネット検索すると出てくる主要な分析手法の分類です。実際の分析はコンピュータの統計パッケージ(プログラム)を使ってやるので,やり方さえ教えてもらえばなんとかできるのですが,研究目的と尺度に沿って正しい分析方法を正しく使うことが必要になります。
例えば,下の表は,リッカート尺度のところで例として示した「情動的共感性尺度」(全25項目,加藤・高木,1980による)の結果を「因子分析」という分析手法(量的データを整理して関連を検討するのに使えます)で分析した結果の一部です(昔の3年生のゼミで分析実習を行ったものを各因子上位5項目のみ示しました)。たくさんの質問項目が3つの心の中の特性をとらえていることがわかります。水色に色づけた部分は,共感に対してむしろしらけてしまうという冷淡な傾向,ピンクの部分は,困った人や動物をほっとけないという共感的暖かさ,緑の部分は,周りから影響されやすい(あるいはされにくい)傾向ですね。このようにたくさんの質問項目への回答(多変量)の裏にある潜在的な変数(これを「因子」と言います)をとらえて,その相互の関係性や,他の心理・行動特性との関連を調べることができるようになるわけです。私のゼミでは顔の研究を行うことがあるのですが,この3年生の実習では,表情識別能力を調べる実験データとの相関を調べることで,共感的に冷淡な人は,他者の表情の微妙な変化に鈍感だという関係性が認められました。
というわけで,調査研究って,何か興味をもつことがらがあれば,調査用紙を作って実施することは比較的容易なので,心理の卒論研究でも調査研究をする学生さんは多いのですが,得られたデータの分析段階でみんな苦労します (^^;)。でも,たくさんのデータを適切な分析手法で分析して,データに基づいて人間の行動やいろいろな社会的問題を説明・予測することは,これからの時代,とても必要とされる能力であることは間違いありませんから,調査法を勉強する中でそういったスキルを身につけていただければうれしく思います。
調査法については,「心理学研究法B」で実習を通して習うことになります。
今日は以上です。どうもお疲れさまでした m(__)m。