AI紀行(25年4月)

###<2025/4/20:AI>###############################

SIGNATE(SOTA)の雲画像予測で、ベースラインとしてConvLSTMがChainerで提供されているが、ChainerはPreferred Networkが開発したライブラリィで2020年で開発が終了している。そのためLLMでPytorchへコード変換して実行。但し、LLMがデータ変換を間違えていたため動かすまでに苦労。最終的に動いたので、このConvLSTMをベースに上位を目指そう。

ところで、SIGNATEのSOTAが6月末で終了するらしい。これまでSOTAの様々なコンペに参加して勉強させて頂き大変感謝している。SOTAで獲得したメダルが通常メダルとなるらしい。

###<2025/4/13:統計>###############################

Aの補集合をA^cとすると、AとBの差集合はA\B=A∩B^cとなるらしい。そしてAとBの対称差はAΔB=(A\B)∪(B\A)となるらしい。(A\B)がAのBと重なっていない部分であり、(B\A)がBのAと重なっていない部分と考えると分かり易い。ベン図を書くと分かり易い。AΔB=(A∪B)-(A∩B)でもある。

###<2025/4/11:統計>###############################

フィッシャーという英国の統計学者は100年以上前の偉人であるが、統計について様々な業績を残している。実験計画法におけるフィッシャーの三原則は反復(replication)、無作為化(randomization)、局所管理(local control)である。実験計画の1元配置、2元配置等で分散分析表による因子の主効果や交互作用の解析手法を確立している。またフィッシャーの正確検定では分割表において、適合度カイ二乗検定や尤度比検定のような漸近分布に従わない場合でも条件付分布に基づく条件付検定手法である。分割表((x1,n1-x1),(x2,n2-x2))の値をベースに超幾何分布による仮説検定が可能である。

###<2025/4/7:AI技術>###############################

TransformerモデルはChat-GPT(Generative Pre-trained Transformer)でも使用されているモデルであるが、そのモデルで使用されているAttention機構はなかなか理解するのが難しい。QueryとKeyとValuesがあり、QueryとKeyの内積(類似度)を算出しそれに重みとValuesを乗じて和するようだ。これにより自然言語なら一連の文章の単語間の関係等の特徴量が得られ、時系列データであればデータ間の、画像であれば画像ピクセル間の関係が得られるのだろう。CNN(畳み込みニューラルネットワーク)とは一味異なる特徴量の得方であり面白いところではある。

###<2025/4/1:AI技術>###############################

松尾研究所は、AI研究の第一人者の東京大学の松尾豊教授が技術顧問を務める株式会社である。生成AI関連だけでなく様々なAIソルーションの企業への提供を行っているようだ。自動運転関係等もやっているようだ。3月6日(木)に、松尾研究所主催の”【大阪開催】製造業出身データサイエンティストメンバーと製造業あるある＆キャリアを語る会”へ申し込んだのだが抽選で補欠に回り参加できなかった。リクルートも兼ねていたようで年齢で補欠になったようだ。人手が不足ならば年齢に依らずに人をみて判断してほしいと思う。