税理士事務所での単純作業の中には、教えれば中学生でもできるようなことがあります。
一例を挙げると、電子申告した申告書ファイルとメール詳細をダウンロードし、1つのPDFに結合した上で、タイトルに「第n期_」といった文字列を付け加えて、所定のフォルダに格納するといったことです。
法人税や消費税の申告は月に2、3件しかないので、こうした作業もそれほど苦ではないのですが、1月末が提出期限の法定調書合計表、総括表、償却資産申告書は、数が多くてかなりの苦行です。
やり方さえ教えれば中学生でもできるようなことを税理士が延々とやり続けるのもどうかと思い、ChatGPTの助けを借りて自動化しようと思い立ったのが1月でした。
1月は画像認識が上手くいかず、いったん棚上げして2月に先送りしていました。
複数の工程をまとめて進めようとしたことも良くなかったと思いました。
昔読んだ数学の本に「困難は分割せよ」と書いてあったのを思い出し、まずは画像認識のところだけでも成功させようと考えを改めました。
今日、改めてChatGPTを使ってコードを作ってみたところ、比較的あっさりとChromeでもNTTデータの電子申告の達人でも上手くいくコードができました!
画像認識だけに絞り込んだことも良かったと思いますが、2月1日にリリースされたOpenAI o3-mini-highの性能による所が大きいと思います。
ChatGPTは日進月歩で進化し続けていますね。
NTTデータの電子申告の達人の画面上にある小さな文字列をテンプレート画像として、電子申告の達人をスクリーンショットしてスクリーンショット上の文字列とマッチさせるコードを実行したところ、信頼度が0.999999…と小数第6位まで9が並びました。
コード上では0.8以上であればマッチするように作られていたので、あまりよく分かっていないながらも、これなら作りたいRPAを完成させられるのではないかと思いました。
PowerShellに表示された結果です。
