4 まとめ
本解説文では、心理学実験における反応時間データを、 理論分布でのフィッティングを用いて解析する方法を紹介した。 理論分布としてはとくにex-Gaussian分布を用いた方法をとりあげ、 分布のもつ数理的な性質や、それを用いた解析の特徴、 また実際にRを用いてこのような解析を行なうための実習など、詳細な解説を行なった。
反応時間解析における理論分布でのフィッティングの利用は、 1980年代にはすでにその利点が提唱されており、 じつのところそれほど目新しい手法というわけではない。 しかしながらいま現在、 この方法が反応時間データの解析におけるツールとしてひろく普及したとは、 とうてい言い難い。 ほとんどの認知科学・心理学研究者は、 なんの疑問ももたずに、 平均値のみを対象としたt検定や分散分析などの手法を盲目的に信仰し、 データのもつ分布的特徴をこれっぽっちも気にかけていないことが多い。
もちろん、ex-Gaussian分布を用いた解析を採用していない研究すべてが、 一概に不適切な解析をしていると主張するつもりはない。 たしかにこの方法は、 平均値や中央値に関する統計学的検定法よりいくぶん複雑であるように思える1414 じつは筆者自身は、本解説文中で用いた最尤推定法などの方法が、 t検定や分散分析よりもややこしいとはまったく思わない。 とくに分散分析は、要因数・水準数・対応の有無・下位検定の選択基準など、 実験計画に依存してさまざまな作法が存在し、信じられないほど複雑である。 分散分析を「簡単だ」といえるひとは、よほど統計学に精通しているか、 さもなければ分散分析についてほとんど何も知らないひとだと断言してもいい。 そしてそのような方法と比べ、最尤推定のロジックは非常に明確であり、 どんな場合にも一貫して分かりやすいと感じる。 しかし、仮説検定は現在の学術研究におけるスタンダードであり、 それと比べて最尤推定を用いる研究はかなり少ない。 この現状を鑑みれば、 本解説文で用いた分布解析の手法が読者の目に 「あまりみたことのない複雑な方法」と映ってしまうだろうことは予想できるので、 本文中のような表現となった。。 また、信頼性の高いフィッティングを行なうためには、 それなりに大きなサンプルサイズが必要だという制約もある。 これらのことから、解析の頑健性や説明の簡単化のため、あえて分布特徴に踏み込まず、 平均値のみを使うという選択も、実際のところありだと思う。
しかし問題なのは、そのような考えはまったくなしに、 単に「他の研究がやっているから」「指導教員にやれっていわれたから」 というだけの理由で分散分析を使い、 データ分布がもつ特徴など気にもとめない研究の多さである。 自分が苦労して集めた実験データなのに、 反応時間のヒストグラムを描いてみるという基本中の基本の解析すらしない実験者が、 信じられないほど多いのだ。 なぜ取得した生のデータをじっくりとみることなしに、 その背後に隠された意味を抽出することができると思うのだろうか。
生のデータと真摯に向き合うのは、すべてのデータ解析における基本である。 そして一度でもヒストグラムを描いてみたことがあれば、 反応時間データのもつ特徴的な歪曲を見落とすはずがない。 その分布の情報は、明らかに平均と標準偏差だけでは表現しきれていないものである。 よって、条件間における分布特徴の違いを検討するには、 安直にt検定や分散分析を行なっているだけではだめなのだ。 そしてex-Gaussian分布を用いた解析は、 そのための方法を提供してくれる強力なツールである。
大事なのは、そこに存在する差を見逃さないことだ。 もしあなたのデータが歪曲をもたないなら、 理論分布でのフィッティングを使う利点はほとんどないだろう。 その意味でこの方法は、常に有効な万能薬ではない。 しかしあなたのもっているデータが歪曲をもち、 課題条件間で反応時間の分布的特徴が変化しているのなら、 ex-Gaussian分布を用いた解析は大きな助けになるはずだ。 この解説文が、読者が抱えている興味深いデータの特徴を的確に定量し、 課題遂行中のヒトや動物の心理過程をより詳細に理解するための一助となれば幸いである。