幾何学でロボットや自律走行車の衝突を事前に検知

安全性を強化する新たなAI安全分析手法の可能性をグリッド世界を使って明らかにしました。

複数のエージェントが存在するグリッド世界において、グロモフのリンク条件が失敗につながる二つの状況。ナイトの移動（左）とビショップの２段階の移動（右）

時空とは、3次元の空間（縦、横、高さ）に時間を加えた概念モデルです。これら四つを融合することで、4次元の幾何学的オブジェクトが作られます。研究者たちは近年、このような考え方でAI環境を研究しており、AIの問題点を幾何学的な用語で捉え直すという興味深い取り組みにつながっています。

沖縄科学技術大学院大学（OIST）のビジティング・リサーチャーで、元OIST博士課程学生のトーマス・バーンズ博士と、OISTの元研究員で現在は西安交通リバプール大学で働く数学者ロバート・タン博士は、AIシステムを幾何学的観点から研究し、その特性をより正確に表現したいと考えました。二人は、「幾何学的欠陥」の発生、いわゆる「グロモフのリンク条件（ Gromov’s Link Condition ）」の不履行が、移動するAIエージェント同士の衝突の可能性がある場面と正確に相関することを突き止めました。この研究成果は学術誌『Transactions on Machine Learning Research』に掲載されました。

現実世界のシナリオをグリッド世界でモデル化する

グリッド世界は、正方形のセルを格子状に並べたもので、例えば図1のようにコアラのような単一のエージェントやビーチボールのようなオブジェクトがセルを占有したり、占有しなかったりします。グリッド世界のエージェントは、パズルを解いたり、報酬を追求したりするようにプログラムできます。それらはグリッド内の隣接するマス目間を移動でき、研究者たちはしばしば、グリッド世界内の正確な場所に到達するといった特定の目標を課されたときのエージェントの動きや計画、戦略を研究します。

グリッド世界は、AI研究、特に強化学習の分野で長く研究され、ビデオゲームやチェス・囲碁のようなボードゲームの世界チャンピオンを負かしてきました。グリッド世界は、例えば自動運転車や倉庫ロボットの動きを調整して安全に使えるようにするなど、実世界での応用が期待される、簡易で拡張可能なモデルを提供します。

本研究では、グリッド世界でエージェントとオブジェクトの配置が指定された状態から出発して、許容可能なアクションによって実現されるすべての状態を模索しました。ここでは、移動（Move：エージェントを隣接する空のセルに移動させる）と、押し/引き（Push/Pull：エージェントにオブジェクトを真っすぐ押したり引いたりさせる）の二つのアクションが許可されています。

このプロセスを十分な回数繰り返すと、「状態複合体」を作ることができます。状態複合体は、システムのすべての可能な構成を単一の幾何学的オブジェクトとして表現します。つまり状態空間を、幾何学（オブジェクトの正確な形状に関する）、位相幾何学（曲げたり、伸ばしたり、縮めたりといった変形の元でも保たれる空間の性質）、組合せ論（オブジェクトの数え上げや組み合わせ）の数学的ツールを使って研究できることになります。二人は、ペンと紙を使った数学とこの目的のために開発したコンピューター・プログラムを組み合わせ、この研究で生成された状態複合体の作成と分析を行いました。

エージェントとオブジェクトが一つずつ配置された3x3グリッド世界（右）の状態複合体（左）。状態複合体内の色の濃い点は、右のグリッド世界の状態を表している。状態複合体の辺は対応するアクションに応じて色付けされ、オレンジ色は押し/引き、えび茶色は移動を表している。状態複合体のそれぞれの「花びら」は、エージェントであるコアラがオブジェクトであるボールを円状に動かしたもの。

「これはゲームセンターにあるレトロなゲームのようですが、ドアやボタン、敵など様々なものを追加でき、さらにこれらの複雑なシナリオの幾何学や位相を考えることができます」とバーンズ博士は説明します。「状態複合体を、立方体、正方形、棒などがくっついたレゴのようなもので、それぞれグリッド世界の特定の再構成を表しているようなものだと、直感的にとらえることができます。」

衝突直前の瞬間

二つのエージェントが近づきすぎると、ぶつかる可能性があります。この潜在的な衝突は幾何学的な欠陥を示唆しており、グリッド世界でこの現象が起こるたびに衝突の可能性があることが判明しました。

興味深いことに、基本的に数学者はこのようなオブジェクトに幾何学的欠陥がないことを証明しようとします。そのような欠陥がないことが、そのオブジェクトに望ましい数学的性質を与えられるからです。もし幾何学的な欠陥が一つでもあれば、状態複合体全体がその利点を失うことになります。

「当初は、幾何学的欠陥がないことを示したかったのですが、その後、このような小さな厄介事が山ほど見つかりました。私たちは、もしかしたらそれは厄介事ではなく、何か重要なことと関連しているのかもしれないと考えるようになりました。結果として、実際、その通りだったのです。重要な安全性の情報と関連しているのです」とバーンズ博士は強調します。

二人はまた、チェスで二つのエージェントが、ナイトの移動やビショップの２段階の移動によって分離されるとき、これらの幾何学的欠陥が状態複合体で発生することを証明しました。「これらの欠陥が発生するのは、このような場合だけです。例えば、現実の世界では、ロボット同士が倉庫でぶつかったり、自律走行車が交差点で衝突したりする可能性があります。重要なのは衝突する地点ではなく、衝突する直前の瞬間なのです」

複数のエージェントが存在するグリッド世界において、グロモフのリンク条件が失敗につながる二つの状況。ナイトの移動（左）とビショップの２段階の移動（右）。えび茶色の矢印は許容される動きを示し、青い四角は許容される「ダンス」を示す。グリッド世界におけるダンスは、4マスの形での四つの動きで構成される。エージェントは相手のダンスを中断することもできるし（左）、二つのダンスが対角線上で衝突することもある（右）。

AIへの実用的応用

幾何学的欠陥や幾何学的手法は、既存のAIシステムの理解を深めるのに役立ちます。例えば、エージェント間の衝突を回避するように訓練されたAIシステムで、幾何学的欠陥がどこにあるかを発見することができます。これは、ロボットと人間が頻繁に関わる場面、例えば生活支援ロボットとの共同生活において、衝突をより効率的に予知検出するのに役立つかもしれません。

バーンズ博士は「これらの発見は、複数のエージェントが存在するAIを活用した環境において、安全な制限を模索するための新たな方法を提供します。それらのエージェントはコアラである必要はなく、家事を手伝うロボット、災害地域を探索するロボット、あるいは宅配サービスをする自動運転車かもしれません」と話します。

日付:

2024年2月27日

カテゴリー:

研究関連記事

作者

マール・ナイドゥ

論文情報

タイトル:

Detecting danger in gridworlds using Gromov's Link Condition

ジャーナル:

Transactions on Machine Learning Research