はじめに

  • 本記事では、UiPath Document Understanding の新しいモデル学習体験「Active Learning」を紹介します。
  • 記事の内容は、個人の見解または確認結果であり、UiPath の公式見解ではありません。
  • 製品仕様や参考画像は 2024年5月30日時点のもので構成しています。
 

新しいモデル学習体験「Active Learning」とは

 

 

従来はカスタムAIモデルを作成するのに
Document Manager でアノテーションして、データセットを AI Center に連携し、MLパッケージを用意したらパイプライン管理でトレーニングして、最後にMLスキルにデプロイ
といったアクションが最低でも必要でした。
データセットの選定や再編集、トレーニング時の設定やスコア確認など
文字にするとたいしたことなさそうな上記のアクションも、実際には案外煩雑な設定作業を多く含んでおり初心者には利用の難しいサービスでした。

 

これが、Active Learning(アクティブラーニング)になると
Document Manager でアノテーションして、パブリッシュ
で済むんです。※トレーニングは裏で自動で走ります。

 

スコアも各フィールドのF1スコアをみるとかではなく、シンプルに分類または抽出のスコアをみるだけでOK

 

Active Learning では、モデルや機械学習の基礎知識がなくても、直感的な操作でAIモデルを作成できます!

 

基本操作 - プロジェクト作成からパブリッシュまで

 
 
「プロジェクトを作成する」>「モダン」を選択します。
(※OCRは最新の「UiPath Extended Language OCR」を指定するのをお勧めします。)
 
 
「構築」画面の「クリックして参照」から学習させたいドキュメントをアップロードします。
 
 
請求書のサンプルドキュメントを210枚ほどアップしてみます。
 
 
アップロード後に、モデルの雛型がある場合は次の様に自動分類されます。
(請求書のサンプルをインポートしたので、「請求書 - 日本」と自分分類されています。)
 
 
画面右側には、分類と抽出に関するレコメンド(メッセージ)が表示されます。
次の例では、分類するにはドキュメントを1つ以上学習させる様にとメッセージがあります。
 
 
自動分類の「クリックして参照」より、領収書のサンプルをインポートしてみます。
 
 

インポート後のアクションですが、選択可能な操作は次の様になっています↓↓

  • 編集アイコンを押下するとDocument Managerが起動し、アノテーション作業をおこなうことができます。
 
  • ↑アイコンを押下すると対象ドキュメントへの追加アップロードができます。
 
  • 三点リーダーからはドキュメントの削除またはDocument Managerの起動ができます。
 
自動分類の↑アイコンからアップロードする場合、モデルの雛型がないと自動分類のセクションにドキュメントが残ります。
この場合、三点リーダー>「移動先」>「新しいドキュメントの種類」より分類先を作成し振り分けます。
 
 
ドキュメントの種類名称に利用できる文字は、アルファベット、数字、アンダースコア、スペースのみです。
 
 
 
複数のドキュメントを一気に移動したい場合、個別レコードの操作(三点リーダー)からではなく、画面上部の「移動先」ボタンからおこないましょう。
 
 
 
類作業が完了したら、対象ドキュメントのアノテーション作業に移ります。
「トレーニング開始前」の文字をクリックすると次の様なダイアログが表示されます。
「注釈」ボタンを押下しアノテーション作業をおこないましょう。
 
 
クラシックのDocument Managerでは、ドキュメントの読み込み~予測で数秒以上かかるのですが、画面中央の描画を除けばモダンは1秒で返ってきます!!(;・∀・)
 
 
さらに、数日前にリリースされた日本語の請求書の最新モデルには口座系のフィールドが初期状態から存在します!!!
 
 
以前の請求書モデル(日本語)では、Payment Address に口座情報をすべて結合した値が入っていました。
このため、手動で「銀行名」「支店名」「口座番号」といったフィールドを追加した上でアノテーション作業をおこなう必要がありました。
 
 
 
アノテーション後にトレーニングは自動で走ります。
 
 
 
アノテーション作業が終わったら、評価画面でスコアやレコメンドを確認します。
今回は基本操作の案内のため、このままパブリッシュに進みます。
 
 
パブリッシュ画面で「プロジェクトのバージョンを作成」ボタンを押下します。
 
 
デプロイ後のモデルの名称(Studioのアクティビティで選択する際に表示される名称)と、デプロイ対象のドキュメントを選択します。
 
 
トレーニングが済んでいるので、パブリッシュもあっと言う間でした!
あとはデプロイ済みの列のトグルを有効にすれば作業完了です!!
 
 

さいごに

いかがでしたでしょうか?
一度体験してしまうとクラシックプロジェクトには戻れなくなりそうですよね。。。
次回は、Active Learning で作成したモデルのStudioでの使い方やスコアの遷移などの参考情報を書きたいとおもいます。
最後までお読みいただきありがとうございます(・ω・)ノ