少し前ですが、こんな記事がありました。

 

 

記事のタイトルは「データサイエンス修士(学部はこちら)」となっていますが、「米国で毎年4,000人」というのは統計学修士のことです。竹村彰通・滋賀大学データサイエンス学部長へのインタビュー記事で、日本のデータ教育が遅れていることを指摘した内容となっています。

 

――そんな大量のデータの分析を手がけるのがデータサイエンスということになると思いますが、なぜ日本は出遅れたんでしょうか。

 

統計専門家が、アメリカに比べるともともと少ないんです。統計の勉強は研究室単位でやっていて、統計専門の学部や学科がありませんでした。だから、そもそも人材の量が少ない。それがかなりネックになっていると思います。

 

――体系的に学ぶ場がなかったということなんでしょうか。

 

個人では、勉強しているひとは多いでしょう。でも米国では、統計学の修士が年間4000人ぐらい出ている。日本はまだゼロです。(今年4月に開設された滋賀大学大学院のデータサイエンス研究科が、統計学を体系的に学ぶ初の大学院になる)

 

この「米国で毎年4,000人」という数字は、実はアメリカ統計学会(American Statistical Association)のウェブサイトから簡単に入手することができます。「統計学」と「生物統計学」の学位を合わせた数字のようですね。

 

アメリカの医療系の大学・大学院は、この「生物統計学」の他にも「公衆衛生」「ヘルスケア・マネジメント」「ヘルス・インフォマティクス」等、興味深いプログラムをたくさん出しています。そこまではなかなかフォローできないのですが…。

 

出所:アメリカ統計学会(https://ww2.amstat.org/misc/StatBiostatTable1987-Current.pdf)

 

目についたことを幾つか書き出しておきます。

  • 学士より修士の方が多い(!!)。これには2つの原因があるものと思います。

    • 外国人留学生の存在。外国人にとって、アメリカで理系(STEM)分野の学位を取ることは移民制度上、アメリカでの就職に有利なため、修士から多くの外国人が入学して来ているものと思われます(移民制度の詳細はこちらもご覧ください)。
    • 学部で統計学を専攻していない院生の存在。例えばスタンフォード大学統計学部のウェブサイトを見ると(サンプル数が少ないと思いますので敢えてスクリーンショット等は張りません)、同大学の統計学修士課程入学者の学部での専攻は統計学(他分野との2重専攻多し)の他、数学、経済学、工学等となっています。

統計学修士課程の入学要件は大学によって異なりますが、理系レベルの数学(線形代数、微積分)の他、学校により数理統計学、確率論、応用統計学等の理解が求められるものの、一般的に学部で統計学を専攻していることは必須ではないようです(「実際には募集要項を超えるレベルの勉強をしていないと入学は難しい」等あるかもしれませんので、留学を考えられている方はご注意ください)。

  • 学生数の急増。2001年には1,000人足らずだった修士号取得者数は2010年には2,000人を超え、2017年には4,000人を上回っています。「10年で倍」を上回る急速な拡大を20年近く継続しているということですね。昨今のデータサイエンティスト・ブームは概ね2010年代に入ってからだったかと思いますので、統計学の修士課程の拡大はそのかなり前から生じていたものと思われます。

    • 一方、学部は2010年を過ぎてから急激に拡大していますね。最近でこそ学部と修士の人数は近づいていますが(「Biostatisitcs」はほぼ大学院しかないので、「Statistics」だけで見ると2018年は学部の方が上回ります)、かつて(といってもほんの数年前)はむしろ、統計学は大学院から勉強するのがスタンダードだったことが伺えます。

また、上のグラフには入っていませんが、元のデータには男女比も掲載されています。学部・修士・博士の各レベルで40%-50%が女性という、日本では考えられないような割合となっています。日米では女性の社会進出の程度も大きく違いますが、そのことはこうした所でも伺えます(アメリカの女性プロフェッショナルのキャリアについてはこちらもご覧ください)。

 

アメリカの修士課程はコースワーク中心になっていることが普通であり、修士論文等は求められない場合が多いものと思います(卒業試験や、もう少し軽めなプロジェクト等はあるものと思いますが)。ただ、だからといってアカデミックな内容を捨てているということはなく、もちろん学部よりも高度で、十分、博士課程に向けての準備になるレベルのカリキュラムになっているようです(但し修士号取得から博士課程に移った場合、前期博士課程1年目から再度、やり直しになるとは思いますが)。フルタイムなら1年-1年半程度で取得できることが多いようです。

 

ちなみに、アメリカ統計学会のウェブサイトにはデータサイエンス分野の統計もありましたが、人数が少ないこと、以前調べたときに出てきたプログラムがあまり出てこなかったこと等から取り上げませんでした(この辺は、もしかしたら統計学会とコンピュータサイエンス関係の学会の間の綱引きとか、あるのかもしれませんね…)。

 

 就職・キャリアパス

 

理系分野では、分野によっては就職には博士が必要、ということもありますが、統計学については必ずしも該当しないようです。例えばForbes「Best Masters Degree For Jobs」を見ると、「Biostatistics」と「Statistics」の修士号がワンツー・フィニッシュを飾っており、極めて就職に強い学位であることが伺えます(2017年の結果はこちらも参照)。博士課程でやることは新しい統計分析手法を作ったりとかそういったレベルのことだと思いますので、通常のデータ分析であれば修士レベルで問題ないということなのだと思います(もちろん「Googleで最先端の製品開発がしたい」とかいったことでしたら、実際に博士レベルの知識や能力は必要になるでしょう)。他分野の博士と統計学の修士が肩を並べて分析している例もあります。

 

もちろん、博士号取得者が民間に行く例も多く見られます。また、博士は政府機関に就職する人も比較的、多いようです(原則、アメリカ国籍がないと行けませんので、分からないところもありますが)。学部については以前の記事もご覧ください。学部卒でもかなりの高収入を獲得できる専攻と言えるものと思われます。

 

具体的な就職先は多岐に渡るものと思います。所謂データサイエンティストの他、個人的にイメージがわきやすいのは、例えば以下の本に出てくるような領域です。

 

 

日米のP&Gでマーケティングを担当された後、USJで多大な功績を上げられたご著者による定量マーケティングの本です。ご著者の森岡氏と今西氏のうち、今西氏が需要予測モデルの開発、市場分析・売上予測等を専門とされるアナリストの方です。バックグラウンドとしては、日本の大学で数学専攻、その後、P&G本社のお膝元、シンシナティ大学で数学修士を取得されています(後者は統計学の修士なのか、どのタイミングで取得されたのか(もしかしたら一旦、P&Gを引退された後なのかも)は分かりませんが)。森岡氏のようなブランド・マネージャーと、今西氏のようなアナリストがタッグを組んでマーケティングを主導していくのは、個人的なアメリカ式のマーケティングのイメージともぴったり一致します。

 

本書の内容は統計モデルとマーケティング戦略の実践的な組み合わせとも言えるもので、とても面白いので是非、読んで頂ければと思います。この本に出てくる統計モデルや分析手法は特にユニークなものではありません(但しP&Gは消費財マーケティングの世界では掛け値なしの世界最強企業であり、先進的な内容であることは確かでしょうが)。また、最近の所謂ビッグデータ・AI・データサイエンスの世界の話でもありません。ビッグデータ時代のかなり前から、統計学の専門家がビジネスの現場で活躍していたことが伺えます。

 

もう一つ、以前もTweetを引用させて頂いた、アメリカの大学で統計学の教員をされているWilly氏のブログに、少し古いですが興味深いポストがありましたので引用します。

 

Willyの脳内日記:そろそろ日本は教育でも米国に負けるのでは

私はミシガン州デトロイトにある中規模の大学に勤めている。州内では4〜10番くらいの位置につけるローカルな大学だ。ミシガン州を地理的な条件の似ている北海道に例えるなら私の大学は北海道大ではなく、北海道の中規模の公立大や私立大に相当すると言って良い。

 

しかし、そんなありきたりの地方大学にもたくさんの社会人大学院生が入学してくる。ビジネススクールやロースクールではなく数学科にである。それは、高校の先生だったり、メーカーのエンジニアであったりする。大学院に限って言えば、これらの学生は学科にとってメインの顧客だ。

 

今学期、私と機械学習のセミナーをやった地元の修士課程学生Aは、従業員千人弱のマーケットリサーチ会社のミシガン事務所に勤めている。私がこの大学に来て間もない頃、彼は大学4年生で私の数理統計学の授業を取っていた。評価が甘めのクラスで成績はA-かB+。ごく平均的な印象に残らない学生だった。

 

彼は就職して少ししてから修士課程に入学して、1学期に1つずつコースを取り続けている。修士を取るには10コース程度履修する必要があるので、5年かかることになる。昼に行われるセミナーや授業もあるので会社から許可をもらって大学に来る。5年間で4万ドルほどの学費がかかるはずだがこれも全て会社持ちだ。仮に博士課程に進みたい場合でも、会社から無条件に学費が出るそうだ。仕事でデータを扱いながら、修士課程にもう3〜4年も通っているので、セミナーを一緒にやっている数学科出身の博士課程2年目の留学生より理解度が高い。

 

彼が日本の難関国立大の入試問題を解けるのかどうかは分からない。しかし同規模の日本企業の地方事務所に勤める日本人が、彼と同程度のスキルを持ってデータを分析できるかどうかと言われれば、疑問を感じざるを得ない。(長く日本で働いていないので、私のこのような認識が誤りであることを願うが。)

 

マーケティングの話題が重なってしまったのは他意はありません(個人的にイメージしやすかっただけです)。アメリカでは職務に関係する修士号や専門資格を取得することが昇進要件になっている職場が多いこともあり、パートタイムで大学院に行って勉強している人は沢山います(パートタイムMBA等も含む)。こうしたところでの人材育成が機能していることもあり、プロフェッショナル人材の層の分厚さは日本とアメリカでは段違いで、統計学・データ分析の世界でも、ビッグデータが喧伝されるはるか前から、日米ではこうしたところでかなり大きな差がついてしまっていたというのが実態ではないかと思います。

 

こうした人材の育成というのは、とにかく時間がかかります。統計学にせよなんにせよ、まずその分野で教えられる人材を育成してからでないと、十分な質・量の人材を育成し、現場に投入することはできません(何十年といったタイムスパンの話になります...、こちらもご覧ください)。あまりに遅きに失した感はありますが、所謂バブル的に流行り物として注目したり短期的にお金を投入するだけでなく、より長い視点での人材育成・知的資本の蓄積が行われて行ってくれることを願います。