計算機科学: 滑空を学習する | Just One of Those Things

Just One of Those Things

Let's call the whole thing off

前回に引き続き、2018年度の42号目のネイチャーのハイライトより。

 

----------------------------------------------------------
計算機科学: 滑空を学習する
Nature 562, 7726
2018年10月11日   

自然界の生み出す複雑な対流の景観の中で上昇温暖気流を探しそれに乗って滑空する鳥の戦略はまだ十分に分かっているわけではないため、これを人工の機体にうまく「教える」ことは困難である。この関連で、特定の環境手掛かりから情報を得た一連の決定の形で効果的な航行戦略を突き止めるのに、強化学習に基づく方法が役立つ可能性がある。今回M Vergassolaたちは、適切な装備を施したグライダーが、野外において自律的に上昇温暖気流を捉えて航行できるようになる強化学習法を報告している。著者たちは、この目的で、グライダーにかかる局所的な鉛直方向の風の加速度とロール方向のトルクを機上で見積もる方法を開発し、これらの加速度とトルクが航行の効果的な手掛かりとしての役割を果たすことを示している。このタイプの航行戦略は、今後の自律滑空機の研究に役立つ可能性がある。

Letter p.236
----------------------------------------------------------
 

 

上昇温暖気流を捉えて自律的に滑空するグライダーです。

 

本論文においては、日本語版の本誌では「計算機科学:野外での強化学習によるグライダー滑空」と取り上げられています。

 

フルテキストを直訳しますと・・・

 

現場での強化学習によるグライダーの急上昇
 

となり、Abstractを直訳しますと・・・

 

高騰している鳥は、獲物を探したり、遠距離を移動したりするため、大気中の上昇する熱プルーム(thermals)に頼ることがよくあります[1,2,3,4]。熱流が絶えず形成されたり、崩壊したり、あるいは風によって運び去られたりすると、対流の風景は険しく数分のタイムスケールで変化します[5,6]。高騰する鳥がこの複雑な風景の中でどのようにしてサーマルを見つけてナビゲートするのかは不明です。強化学習[7]は、環境手がかりに応じて行われる一連の決定として効果的なナビゲーション戦略を特定するための適切なフレームワークを提供します。ここで私達は大気サーマルを自律的にナビゲートするために野外でグライダーを訓練するために強化学習を使用します。私達は2mの翼幅のグライダーにバンクコントローラーの角度とピッチを正確にコントロールするフライトコントローラーを装備し、可能な限り多くの揚力を得ることを目的としてこれらを一定間隔で調節しました。航海戦略は、現場で数日間にわたって集められたグライダーのプールされた経験からもっぱら決定されました。この戦略は、ナビゲーションの手がかりとして役立つ、局所的な垂直方向の風の加速度とグライダーの横方向のトルクを正確に推定するための、搭載された方法に依存しています。我々は、野外実験、数値シミュレーション、および大気乱流によって引き起こされた測定における騒音の推定を通して、我々の学んだ飛行方針の妥当性を確立する。我々の結果は、高騰する鳥のための効果的な機械感覚的手がかりとしての垂直風加速度およびロールワイズトルクの役割を浮き彫りにし、自律型高騰車両の開発に直接適用可能なナビゲーション戦略を提供する。
 

となります。

 

フルテキストは下記です。詳細が必要な方はご購入をお願いいたします。

 

Full Text:Letter p.236

Glider soaring via reinforcement learning in the field

 

 

究極に溜まりに溜まったネイチャー。次回は、「量子物理学: もう1つの種類の電子雑音」を取り上げます。

 

 

ペタしてね