1. はじめに(動機)
59歳のとき、私は「定年後はデータサイエンティストとして働こう」と決意しました。
昔からデータを見るのが好きで、何より「予測すること」に強い関心がありました。
2000年ごろからeラーニング開発に携わり、学習データを分析して「個別最適な教育」を実現したいと考えていましたが、当時は技術的に難しく、夢に終わっていました。
しかし、AIやデータ分析技術の進化により「今なら実現できる」と感じたのが59歳。
「やり残したことを形にして定年を迎えたい」──それが挑戦の出発点でした。
2. 最初の一歩:統計学の学び直し
最初に取り組んだのは、統計科学研究所が中央大学の校舎で開講していた統計学講座です。
1回数万円という企業研修向けの講座でしたが、退職金を活用して受講しました。
統計学を体系的に学ぶことで、データサイエンスの土台を固めることができました。
もちろん、高額講座は誰にでも選べるものではありません。今ならUdemyや書籍、無料のオンライン教材でも十分代替可能だと思います。
3. RかPythonかの選択
当時、プログラミング未経験者にはRが入りやすいと言われていました。
実際にRとPythonで迷いましたが、私は将来性と汎用性を考えてPythonを選びました。
挑戦のハードルは意外と低く感じられ、結果的にPythonを選んで良かったと心から思っています。
4. 学びの方法:講座とUdemy、Kaggle
秋葉原の講座やUdemyで初学者向けコースを徹底的に受講しました。Udemyだけでも60コースほど取り組み、それぞれが役立ちました。
さらに力になったのが Kaggle です。
最初はUIすら分からず、予測結果を提出できない状態でした。そこで「Kaggleスタートブック」で基礎を学び、次に「Kaggleで勝つデータ分析の技術」など関連書籍を合計7冊購入。モデルや手法を一つひとつ吸収しながら挑戦を重ねました。
私は実務に直結することを目的としていたため、画像系コンペは避け、専らテーブルデータ系に挑戦。
その結果、銅メダルを数個獲得し、Kaggle Expert になることができました。
また、Kaggleでの経験を活かして、国内の教育データ分析コンテスト(一般社団法人エビデンス駆動型教育研究協議会主催)にも挑戦し、予測部門で準優勝。
この実績は「教育データに特化したデータサイエンティスト」としての大きな自信につながりました。
最近はNLPやマルチモーダル系が主流で、テーブル系が減ってしまったのは残念ですが、今後はプロンプト分析など実務にも役立つ自然言語系に挑戦していこうと思っています。
5. 実務の現場:売上予測とダッシュボード開発
60歳で計画部門に異動した際、自分から「データドリブン経営をやりましょう」と上司に提案。
社内で誰も経験がない分野だったこともあり、経営データの可視化や売上予測を担当することになりました。
ただし、これは簡単ではありませんでした。
売上予測は毎月の予算会議で使われるため、誤差が大きいと厳しく指摘されます。いくつもモデルを試しましたが、最終的に「従来の人間の経験則をルール化した手法」を自動化するのが最も安定することが分かりました。
この「人間の知見をルールベースで組み込む」アプローチが評価され、実務で成果につながりました。
6. 生成AIという追い風
そして最大の追い風となったのが生成AIの登場です。
コーディングはAIに任せつつ、自分はPythonの基礎知識を持っていたため、AIの提示するコードを理解し修正しながら活用できました。
結果として、以前なら数日かかっていた作業が数十分〜数時間で終わる ようになり、圧倒的な効率化を実感しました。
OpenAIのサム・アルトマンが語った「アプリ開発コストが1500万円から15円になる」という発言も、決して大げさではないと感じます。
7. 振り返ってみて
振り返ると「奇跡」ではなく、準備・学び・環境の変化・AIの登場がうまく重なった結果だったと思います。
59歳からの挑戦でKaggle Expertになり、実務でもデータドリブンな改革に取り組めるようになったことは大きな自信になりました。
これからも生成AIを活用しながら、教育分野や実務に役立つデータサイエンスを追求していきたいと思います。