さて皆さん、「数字は魔物、統計は数字のトリック」などといわれ、統計学は、ある人々からはエイズのよう忌みに嫌われ、またある人々からは金科玉条のごとく無条件に信奉され、はたまた別の人々からは塵芥のごとく無視されています。 しかし、やかましくいわれている割には、その本質が十分理解されているとはいい難いのが現状ではないでしょうか?
研究現場の研究者が統計手法を利用する時に犯す間違いのうち、ほぼ90%のものが非常に初歩的なものです。 そしてそれらの間違いは、研究者が統計学の基本的な事柄をはっきりと理解していないか、あるいはそれらを誤解していることが原因になっています。 例えば、現場でしばしば間違って使われている統計手法のベスト3は次のようなものです。
これらは、全て非常に初歩的かつ基本的なことです。 しかし、実はこういった初歩的な間違いがクセ者であり、現在の学界や学術雑誌はこれを正すような機構になっていないのです。 学界や学術雑誌に発表される論文を検閲する人達の中には、統計学者もいることはいます。 しかし実際には名前だけのことが多く、中心になっているのは、論文の著者と同じように研究現場の研究者です。 したがって、その人達の統計学についての知識は論文の著者と大差ありません。 そしてその人達は、自分達で理解できる(と思い込んでいる)ような簡単な統計手法を使った論文は、統計学者に検閲を頼まずそのまま素通ししてしまい、自分達の手に負えないような高度で難しい統計手法を利用した論文だけ、統計学者に検閲を頼むのが常なのです。
ところが、このシステムにこそ統計学的構造汚染の元凶が存在するのです! 本当は、統計学的に間違いだらけで、統計学者の検閲を必要としているのは、素通ししている簡単な統計手法を使った論文の方であり、高度な統計手法を利用した論文ではないのです。 なぜならば、高度な統計手法を利用した論文は統計学者が共同研究者として仲間に入っているか、著者が統計学に詳しいことが多く、統計学上の間違いはほとんどないからです。
しかも構造汚染をますます増長させることに、こういった初歩的な間違いの原因になる事柄はあまりにも初歩的すぎるため、統計学の専門書はおろか、入門書の類にも詳しく説明されていないことが多いのです。 専門の統計学者にとってそれらの事柄は初歩的な常識であり、現場の研究者がそれらを理解していないということを、彼等は知らないのです。
そこで、現場で研究者と一緒にデータ解析処理をしている者のひとりとして、統計学の基本的な事柄を、できるだけ数式を使わず、極力やさしく説明したいと思います。
「あたしゃ、数学はどうも……。 何しろ数学アレルギーでして」