玄関雑学の部屋雑学コーナー統計学入門

前口上

さて皆さん、「数字は魔物、統計は数字のトリック」などと言われ、統計学はある人々からは疫病神のように忌みに嫌われ、またある人々からは金科玉条のごとく無条件に信奉され、はたまた別の人々からは塵芥のごとく無視されています。 しかしやかましくいわれている割には、その本質が十分理解されているとはいい難いのが現状ではないでしょうか?

研究現場の研究者が統計手法を利用する時に犯す間違いのうち、ほぼ90%のものが非常に初歩的なものです。 そしてそれらの間違いは研究者が統計学の基本的な事柄をはっきりと理解していないか、あるいはそれらを誤解していることが原因になっています。 例えば研究現場でしばしば間違って使われている統計手法のベスト3は次のようなものです。

これらは全て非常に初歩的かつ基本的なことです。 しかし実はこういった初歩的な間違いがクセ者であり、現在の学界や学術雑誌はこれを正すような機構になっていないのです。 学界や学術雑誌に発表される論文を検閲する人達の中には統計学者もいることはいます。 しかし実際には名前だけのことが多く、中心になっているのは論文の著者と同じように研究現場の研究者です。 したがってその人達の統計学についての知識は論文の著者と大差ありません。 そしてその人達は自分達で理解できる(と思い込んでいる)簡単な統計手法を使った論文は統計学者に検閲を頼まずそのまま素通ししてしまい、自分達の手に負えない高度で難しい統計手法を利用した論文だけ統計学者に検閲を頼むのが常なのです。

ところがこのシステムにこそ統計学的構造汚染の元凶が存在するのです! 統計学的に間違いだらけで統計学者の検閲を必要としているのは本当は素通ししている簡単な統計手法を使った論文の方であり、高度な統計手法を利用した論文ではないのです。 なぜなら高度な統計手法を利用した論文は統計学者が共同研究者として仲間に入っているか、著者が統計学に詳しいことが多く、統計学上の間違いはほとんどないからです。

しかも構造汚染をますます増長させることに、こういった初歩的な間違いの原因になる事柄はあまりにも初歩的すぎるため統計学の専門書はおろか入門書の類にも詳しく説明されていないことが多いのです。 専門の統計学者にとってそれらの事柄は初歩的な常識であり、現場の研究者がそれらを理解していないということを彼等は知らないのです。

そこで研究現場で研究者と一緒にデータ解析処理をしている者のひとりとして、統計学の基本的な事柄をできるだけ数式を使わず、極力やさしく説明したいと思います。

「あたしゃ、数学はどうも……。 何しろ数学アレルギーでして」

なんて言わないで、少々我慢して付き合ってください。 何しろアレルギーには減感作療法が一番なんですから!