近年、急速に活用が進む生成AIは、モノづくりを支えるロボットにも大きな変革を起こしている。今回は、ロボットに生成AIを融合させ、新しいロボット活用や、人間とロボットの在り方を探求するデンソーが開発した「生成AIロボット」の全貌を解説する。同社が目指す“ドラえもんの世界”とは何か。

生成AIが「ロボット」を激変させる理由、何が変わるのか?

 ロボットは、単に調達すればその日から自社のオペレーションの中ですぐに活躍してくれるわけではない。当然、自社の業務オペレーションや用途に合わせてロボットにインテグレーション(調整・据え付け)が必要になる。あらかじめロボットに実施させたい動作を定義しておき、その通りに動くようにロボットをティーチングすることで、ようやく業務の中で使えるようになるわけだ。

 また、そうしたティーチングには、ある程度のノウハウや知見が求められることから、ロボットを導入したいと考える企業の多くは、ロボットシステムインテグレーター(ロボットSI)と呼ばれる企業にティーチングを外注することが多い。

 こうした「やってほしい動作を教え込む必要がある」という特徴から、従来型のロボットは、繰り返し業務と相性が良いとされ、たとえば、製造業における加工、塗装、溶接、搬送などの工程において、歴史的にロボットが多く導入されてきた。

 一方で、事前にすべての動作をロボットに学習させておくことは困難であることから、人のニーズに合わせて柔軟に動作を切り替えなければならない作業はロボットの苦手分野とされてきた。そのため、製造業や物流を超えて、一品一様が求められる建設業やサービス業、農業などの分野では一部のロボット導入に留まっていた。

 しかし、そうした状況が生成AIとロボットの融合により変わりつつある。事前に動作をすべてティーチングしなくても、自然言語による指示や、その場の状況判断を基に、柔軟に動作を切り替えることができるようになるのだ。
 

画像

従来のロボットオペレーションと、生成AI融合による変化

(出典:筆者作成)


 これにより、ロボットのティーチングの負荷が最小化されるため、導入企業にノウハウがなくとも、導入しやすくなる。また、今までロボットの導入対象とされてこなかった工程に、ロボットの適用範囲が広がることになる。

 ここからは、ロボットに生成AIを融合させることで、新しいロボット活用や、人間とロボットの在り方を模索するデンソーの取り組みを解説する。

デンソーの生成AIロボット「Generative-AI-Robot」とは

 デンソーが開発した生成AIロボット「Generative-AI-Robot」は、人間との会話の中から実行タスクをロボット自身が判断して動作するロボットだ。事前のティーチング通りに動くロボットとは大きく異なるロボットの在り方なのだ。

 たとえば、Generative-AI-Robotに人が話しかけ、「水・お茶・ペンを取って」や「ベルを組み立てて鳴らして」と指示をすると、その指示に応じてロボットが動作を判断・実行する。また、「甘い飲み物が欲しい」「書けるものが欲しい」といったあいまいな指示であっても、生成AIが実施タスクを判断し・実行することができる。
 

画像

デンソーのGenerative-AI-Robot

(出典:デンソー)


 Generative-AI-Robotは、人の指示をテキストに変換する音声認識AIと、その指示から実行タスクを判断する生成AIの大きく2つの仕組みによって構成されている。

 まず、あいまいなものも含めた人の指示や会話を音声認識AIがテキスト化する。そのテキスト化された人の指示を基に、「スキル」と呼ばれる事前にプログラムされた小さい単位の動作モジュール(例:掴む、組み立てる、渡す)などを組み合わせ、「どのタスクを実施すべきか」を生成AIが判断する仕組みだ。生成AIには、事前にどういったスキルができるロボットなのかなどをプロンプトとして指示をしており、その前提に基づきロボットは動作する。
 

画像

デンソーのGenerative AI Robotの仕組み

(筆者作成)

「生成AI×ロボット」が活躍する分野

 デンソーは、Generative-AI-Robotのような生成AIロボットの登場により、今までロボットの導入対象であった製造業の大量生産ラインから導入シーンは大きく広がり、人が作業をするシーンすべてが導入範囲になっていくと考えている。

 たとえば、製造業においては、製品のニーズやライフサイクルの変化の中で、「試作段階」、「大量生産段階」、「少量生産段階」といった段階を踏むことが一般的だ。

 このうち「大量生産段階」では、従来通り、事前のティーチングが必要なロボットが活用され、高速で同じ作業を繰り返す製造ラインとなるだろう。

 一方、今回のGenerative-AI-Robotが対象とするのは、「試作段階」や「少量生産段階」となる。これらの段階で利用されるロボットには、状況や生産計画に応じてフレキシブルにオペレーションを変えることができる能力が求められる。

 たとえば、そうした領域において使われている従来の協働ロボットは、動作速度が遅いほか、衝突停止機能が付いていることから、ロボットの周りに設置する柵(工場内で働く人間の安全確保のため)の必要のない「安全な産業ロボット」としての使い方が主流であり、本当の意味で人間と作業を協働して取り組むケースはまれであった。

 一方、Generative-AI-Robotはこうした協働ロボットと人の連携の在り方も変えることになり得る。

 加えて、食品製造業、建設業などの人との協働が求められるかつ、フレキシブルな対応が求められるモノづくりの領域や、物流・小売・医療・サービス業、さらには農業をはじめとした1次産業、そして通信がなくとも自律的に復旧し動作する宇宙ロボット、家庭内で人と一緒に調理するロボット、部屋の状況を判断し分担して片付けをしてくれるロボットなど、生成AIとの融合によって今までロボットが導入されてこなかった分野に適用範囲が広がっていくかもしれない。
 

画像

Generative AI Robotの適用業界一例

(出典:筆者作成)


 今までも人とコミュニケーションしながら協働するロボットやソフトウェア開発の取り組みは、AIコンシェルジュなどをはじめ、あらゆる企業によって取り組みがすすめられてきた。ただし、それの多くは、デジタルの「画面上」における“人との協調”の域を超えていないケースがほとんどであった。

 一方、Generative-AI-Robotでは、AIが分析・検討した結果を踏まえ、ロボットが人間と協働しながら動作をすることにより、デジタル空間の枠を越え、現実空間とつながるようになる。

 「生成AIには身体性がない(物理的な実行手段がない)」と言われていたが、デンソーの取り組みは、生成AIの分析・検討結果に、物理的な実行手段・身体性(=ロボット)を付与することになる大きな変化である。

生成AIでロボットの「ティーチング」はどう変わる?

 また、生成AIにより、ロボットの動作をプログラムするティーチングの在り方も大きく変わる。今まではティーチングペンダントと呼ばれる入力・操作装置を使い、専門知識を有するエンジニアがロボットに動作をプログラムしていた。

 一方、同社のGenerative-AI-Robotでは、「つかむ」「わたす」「組み立てる」などの基本スキルは事前にプログラムをする必要があるものの、それらをどう組み合わせて動作するかは、生成AI自身が考えて実施することになる。そのため、動作全体は、生成AIとのコミュニケーションを通じて、生成AIに考えさせながらプログラムしていくことになる。

 たとえば、予想外の動作をした際に、ロボットに対して「なぜそのような動作をしたのか」と聞くと、AI側が「●●と考えるから、XXと動作しました」と回答するとする。それに対して、「じゃあここを修正しようか」と指示を出し、プロンプトに盛り込んでいくことにより、人間の意思を伝えながらロボットを作り上げていく形へと変化してきている。

 これにより、ロボットの導入やインテグレーション自体も民主化していくこととなる。専門のエンジニアや、ロボットSIerと呼ばれるロボットのインテグレーションを行う専門企業がいなくとも、事前のモジュールが定義されていれば、ロボット導入企業自身が、直接ロボットとの対話の中で、ロボット動作のプログラミングや、ロボットの調整ができるようになる世界も想定される。

【事例】カフェ店員「生成AIロボット」の衝撃の働きぶり

 さらには、事前にプログラムした小さな動作単位(スキル)を組み合わせて、生成AI自体が新しいスキルを考えて作り出す可能性も出てくるだろう。デンソーとしては、今後、指示通りに動作してくれるだけではなく、自分なりに考えて工夫をし、人間が想定していなかった新しい方法で課題にアプローチすることができるロボットの在り方を提示していく考えだ。これにより、人間の意図とロボットの工夫により新しいオペレーションが生まれるかもしれない。

 実際に、Generative-AI-Robotがカフェのバリスタ業務を担当したときの事例がある。事前に作り方を教えていない「アメリカン(コーヒーをお湯で割った飲み方)」の注文を受けたが、これに対し、アメリカン=薄いコーヒーという知識を基に、試行錯誤しながらコーヒーをウォーターサーバーの水で割って提供したのだ。

 このアメリカンの例は一例でしかないが、そのほかの領域においても目的の実行にあたって、人間の常識では思いつかない新しい方法をロボットなりに考えて実行していく可能性を持っていると、Generative-AI-Robot推進チームは語る。

 もちろん、大量生産の工場においては、決められたプロセスで正確に実施することが求められ、ロボットが自分なりに考えて新しい方法を提案することは許されないが、別のフィールドにおいては新しい発想・価値として期待される。また、プログラムの動作にエラーがでた際に、ロボット自身が考え直して自身で復旧してやり直すということもできるようになってきている。

 工場においては、そぎ落として余分な動きをなくし限界まで効率化したシンプル・単純化した形でロボットが重要であった。しかし、その他の領域のロボット展開においては可能性を広げていく方向性で生成AI×ロボットを育てていくことが重要だろう。

デンソーが「ロボットが醸し出す雰囲気」を重視する理由

 これまでデンソーは、生産現場におけるたった1秒のカイゼンを生み出すべく、あらゆる開発に取り組んできたが、Generative-AI-Robotはこれまでとはまったく異なる開発アプローチとなっている。

 キーワードは「ヒューマンセントリック(人間中心)」だ。ヒューマンセントリックなロボット作りでは、ロボットと人間の関係性や、人間がロボットに話しかけたり、仕事を依頼しやすい雰囲気・環境をデザインすること、さらにロボット側が人間を理解したり、感情に寄り添ったりできるかが、開発における重要なポイントになる。
 

 つまり、従来のように、ロボットの性能や機能を追求していくだけでなく、Generative-AI-Robotを通じた、人間側の体験や価値、感情や行動の変化をデザインしていくことが求められるのだ。

 たとえば、待機時間がその例だ。これまで、稼働していないロボットは、当然ながらその時間、下を向いている状況があった。一方、人と人のコミュニケーションにおいては、「下を向いている人」に対して話しかけにくさを感じるはずだ。人と協働することを想定する場合、こうした人同士のコミュニケーションにおける当たり前をロボットに取り入れていくことが求められる。

 たとえば、デンソーのGenerative-AI-Robotでは、人間がロボットに話しかけやすいよう、人の目を見て「こんにちは」「今日はどこから来たのですか?」などと話しかけ、人間が話しかけやすくなるキッカケを生むとともに、その後の会話につながる仕掛けづくりも行う。また待機姿勢(ロボットが稼働していない時間)もピッタリと停止しているのではなく、少しだけロボットの身体を揺らすことにより、人間に安心感を与える工夫が盛り込まれている。

 これはゲームのキャラクターが待機時間にも揺れの動作をしていることからヒントを得たという。デンソーとしては、今後ロボットの筐体のデザインも、ムダを排除した機能性の高いデザインから、より人間にとって安心感を与えるものへと変化していくと考えているようだ。

デンソーが目指す「ドラえもんの世界」のようなロボット像

 今後、デンソーは先述の生成AIロボットが実施できる動作単位の「スキル」の拡充・蓄積を図るとともに、既存の「スキル」から新しいスキルを組み合わせて提案する力や、会話や環境認識・状況判断からロボット側に実行内容を考えさせる能力の精度を向上させていく考えだ。 

 また、現在は人の指示を認識する上で、「耳」を通じてロボットが実行内容を認識・検討しているが、今後は生成AIのマルチモーダル化が進む中で、ロボットの「目」としてのセンシング結果を活用することや、生産管理システムなどのシステムからの指示などを踏まえた実行検討・判断ができるよう発展させていく方針だ。

 加えて、ドラえもんの世界のようにロボットと人との境目がなくなる中で、よりロボットが表情を持つことによって、人間が安心感を覚え、インタラクションが加速するヒューマンセントリックな生成AIロボットを追求していく考えだ。

 デンソーは、こうしたGenerative-AI-Robotを通じて今までのロボットの在り方や、人間との関係性の在り方をデザインし、より広い産業や工程にロボットを展開していくソリューション企業になっていくことを目指す。

 これまでデンソーは、産業用ロボットや協働ロボットの展開、FA(Factory Automation)と呼ばれる自動化支援により、あらゆる業界の企業を支援してきたが、Generative-AI-Robotによってその範囲や価値を拡張していくかもしれない。そんなデンソーの今後に注目したい。