• Japanese

提言

便利な時代の統計リテラシー

三田ITC 所長:新保 一成


過去2回のITC年報において「Big Dataと統計学教育」と題して、米国統計学会の機関誌Chanceの”Taking a Chance in Classroom”と題するコラムで提案された「Big Data時代の学部統計学カリキュラムに導入すべき5つのキーエレメント」を紹介した。過去2回のコラムでBig Dataという呼び名で私が想定してるのは、いわゆる物理的に巨大なデータのみならず、これまでは紙媒体でしか利用できなかった様々なデータがcomputer readableになってきたことも範疇においている。Tabulaというオンライン上のアプリケーションは、PDF文書を登録して、その文書中の表をcomputer readableなデータに変換してくれる大変便利なアプリである。開発途上国では、未だに数々の統計データが統計年鑑や各種報告書などの出版物としてのみ利用可能で、それらがやっとPDF化されてネット上で閲覧またはダウンロードできるようになってきた国も多い。Tabulaのようなアプリは、このような状況下において至極便利で重宝している。また、国連、世界銀行、そして各国の統計局も各組織が蓄積してきたデータをデータベース化し、APIを通じていろいろなプログラムから直接にデータにアクセスできるようになってきている。斯様に、教育、研究の場で使えるデータの量は'BIG'になってきた。

学生にとっても、上記の意味で'BIG'データを三田ITCのマシンにインストールされているRやSTATA等の統計ソフトに読み込むことによって、回帰などの統計分析が極めて容易になっている。次の問題は、社会・経済的問題を解決するために正しく統計的方法が使われているだろうかということだ。特に、

  1. 統計的有意性の誤った解釈
  2. 因果性の問題

の2つの問題は、昨今の統計的分析におけるリテラシーと言っても過言ではない。

紙面の都合があるから、これらの問題についてここで詳細に紹介することは差し控えたい。統計的に有意じゃないからって、帰無仮説を採択していいの? 同じことであるが、p値を絶対的に信じていいの?これが最初の問題である。政策の効果は、その政策がなかった場合の結果と政策を施した結果の差だよね。これってタイムマシンでもないとわからないんじゃないの?これが2番目の問題だ。三田に所属する文経法商のすべての学部で統計的方法は必要であるし、上の2つの問題を学生にきちんと理解してもらうことを意図した講義も様々あるに違いない。1つの統計的方法が異なる分野で様々な使われ方をしていることは珍しくないし、ある分野で開発された方法が別の分野でさらなる発展を遂げることも多い。その意味で自分の分野以外での統計的方法の使い方を知ることが有益なことが多いのであるが、それに対応する他学部の授業を探すのはかなり骨の折れる仕事である。これまでの三田ITCはハード、ソフトの提供に注力してきたわけであるが、それらを適切に使うことをサポートする情報発信が将来的にはあってもよいのではないかと考えている。

最終更新日: 2017年9月16日

内容はここまでです。