最新ロボットが辿り着いた「視覚」と、あの日の私の見た世界
1. 世界を驚かせた「プロに勝つ卓球ロボット」の秘密
2026年4月、国際科学誌『Nature』に掲載された一つのニュースが、ロボティクスと認知科学的アプローチの境界線を塗り替えました。
https://www.nature.com/articles/s41586-026-10338-5
ソニーAIが開発した卓球ロボット「Ace」が、人間のプロ卓球選手を公式に撃破したのです。(下は実際の映像)
秒速20mを超えるスピードで急峻なカーブを描くピンポン玉。
従来のAIが苦戦したこの「超高速の対話」をAceが制することができた理由は、演算速度の向上だけではありません。
その鍵は、人間の視覚メカニズムを工学的に模した
「イベントベースカメラ(イベントカメラ)」という革新的な視覚システムにありました。
従来のカメラ(フレームベース)が1秒間に数十枚の静止画を撮り、その「絵のパズル」を比較して動きを推論するのに対し、イベントベースカメラは画素ごとに「輝度(明るさ)が変化した瞬間」だけを非同期に送信します。
静止した背景は完全に無視し、動体が生じさせた「パルス(イベント)」のみをマイクロ秒単位で捉えるこのシステムは、データ量を1/10から1/1000にまで劇的に圧縮し、圧倒的なリアルタイム性を実現しました。
▼ 従来のカメラとイベントベースカメラの違い
📷 従来のカメラ(フレームベース)
- 仕組みの比喩: 1秒間に何度も写真を撮り、犯人がどこに移動したか探すパズル
- データの性質: 背景も含めた画面全体の情報を、コマ(フレーム)ごとに送り続ける
- 計算の効率: 動かない背景データも重複して処理するため、負荷が大きく遅延が生じやすい
⚡️ イベントベースカメラ
- 仕組みの比喩: 暗闇の床に敷かれたセンサーが、足跡が光った順番だけで動きを察知する仕組み
- データの性質: 動きや変化があった「差分」のみを、非同期のパルスとしてリアルタイムに送る
- 計算の効率: 変化のない情報は「ゼロ」として扱うため、超高速・低消費電力で反応できる
2. 私たちは「ありのままの世界」を見ていない
この最新ロボットの視力に驚かされる一方で、身体の専門家である私は、ある種の既視感を覚えずにはいられませんでした。
なぜなら、私たち人間の網膜こそが、この「イベントベースカメラ」そのものだからです。
人間の網膜が脳へと送っているデータは、実は映画のような鮮明な映像ではありません。
網膜の視細胞は輝度の変化(エッジや動き)のみをパルスとして送っており、脳に届く情報は驚くほどスカスカで不完全なものです。
ここで一つの疑問が生じます。
網膜が「変化」しか捉えないのであれば、なぜ私たちは静止している景色を見続けられるのでしょうか。
その秘密は「マイクロサッカード(微小躍運動)」と呼ばれる、無意識に行われる眼球の微細な振動にあります。
私たちの目は常にガタガタと震えることで、静止画の中に擬似的な「輝度の変化」を作り出し、景色が消えてしまうのを防いでいるのです。
では、網膜から届く断片的なパルスを、誰が「クッキリとした3次元の世界」へと書き換えているのか。
それが脳の「予測符号化(Predictive Coding)」という機能です。
脳は網膜からのスカスカな情報をヒントに、過去の記憶や遺伝子レベルの認知システムを用いて、欠損したデータをCGのように3D補完しています。
私たちはありのままの世界を見ているのではなく、脳が予測した「都合の良い現実」を毎瞬投影しているに過ぎません。
この「予測」という名のサボりがバグを起こした状態が「錯視」です。
例えば、静止画が動いて見える「周辺ドリフト錯視」や、存在しない輪郭が見える「カニッツァの三角形」などは、脳が「ここには動きがあるはずだ」「輪郭があるに違いない」と現実を捏造した証拠です。
私たちの意識は、脳による高度な画像編集を経た後の「投影された作品」を受け取っているのです。
3. ヴィパッサナー瞑想の果てに、世界から「奥行き」が消えた瞬間
私は長年、ヴィパッサナー瞑想という「物事をありのままに観る」訓練を継続しています。
ある日、極限まで集中が高まった瞑想の果てに、私は脳の認知プログラムが文字通り「一時停止」した瞬間を目撃しました。
数時間に及ぶ静坐を終え、ゆっくりと目を開けた時のことです。
目の前に広がっていたのは、いつもの慣れ親しんだ3次元の世界ではありませんでした。
それは、奥行きが完全に消失した「平面に色を塗っただけの2次元」の世界。
壁も、机も、窓の外の樹木も、すべてがパッチワークのように平坦な色の塊として網膜に貼り付いていました。
太陽の光が射さないステンドグラスのように、世界から内側からの厚みが消え失せていたのです。
臨床現場で数千人の身体を観てきた専門家として、私は異常事態には慣れているつもりでした。
しかし、この時ばかりは専門家としての仮面が剥がれ落ち、本能的に「ビビって」しまいました。
この現象を神経科学の視点で解釈するならば、一つの仮説として説明することができます。
私個人は、この体験が瞑想による深い静止状態によって、マイクロサッカードや予測符号化ネットワークの活動様式に何らかの変化が生じた結果ではないかと考えています。
もちろん、当時の脳活動を計測していたわけではないため断定はできません。
しかし少なくとも主観的な体験としては、脳が普段行っている「これは机である」「これは遠くにある」といった自動的な意味づけや立体補完が一時的に弱まり、通常であれば意識に上がってこない感覚情報が前景化したように感じられました。
言い換えれば、脳内で加工された完成品ではなく、その手前にある「生の感覚データ」に近いものが露出したかのような感覚です。
世界が立体に見えるのは、私たちの身体システムが環境との相互作用を通じて絶えず現実を構築しているからなのかもしれません。
その構築プロセスの一部が一時的に静まったとき、私の目の前には「色のパッチが並んだ平面世界」が現れた――少なくとも私自身は、そのように解釈しています。
世界が立体に見えるのは、私たちの身体システムが環境と「ダンス」を踊り、毎瞬世界を構築しているからに他なりません。
そのダンスを止めた時、世界はただの色のパッチに成り果てる。
それは生命が現実という幻影を作り出す舞台裏を、ほんの一瞬だけ覗き見てしまったような、畏怖を伴う体験でした。
4. ヴァレラが語った「歩くことで、道ができる」
この体験の正体を教えてくれたのは、認知科学の巨人フランシスコ・ヴァレラでした。
ダライ・ラマ14世とも深い親交を持ち、「瞑想する科学者」として知られた彼は、チベット仏教の知恵と神経科学を融合させ、「エナクション(立ち上げ)」という革新的な理論を提唱しました。
ヴァレラは、世界は最初から客観的な立体物としてそこに用意されている(環境実在論)のではないと説きました。
※これは「アフォーダンス」と対立する概念ですが、私はヴァレラが正しいと思っています。
むしろ、生物が自らの身体を通じて環境とダンスを踊るように関わることで、その都度「世界を産み出している」のだと考えたのです。
🧠 ヴァレラの思想の要約
- 世界に「道」は最初から存在しない。
- 私たちが一歩を踏み出す(認知・行為する)ことで、初めて「道」ができる。
- 現実は、私たちの身体システムが能動的に創り出している「投影」である。
この知見は、私が日々の臨床現場でクライアントの身体と向き合う際の、揺るぎない哲学となっています。
例えば、一人の患者さんの「肩の痛み」や「歪んだ姿勢」を診るとき、それは単なる故障したパーツの羅列ではありません。
その方の過去の歩み、生活習慣、精度、そして「どう生きてきたか」という身体の歴史が、今この瞬間に「痛みのある現実」としてエナクション(立ち上げ)されているのです。
回復とは、単に痛みを消すことではありません。
治療家である私とクライアントが対話と手技を通じて新たなダンスを踊り、より自由で、痛みのない「新しい現実」を共に産み出し直していくプロセスなのです。
「歩くことで、道ができる」
固定観念という自動補完プログラムを捨て、目の前の生命が今まさに立ち上げようとしている現実を、まっさらな視点で共に更新していく。
最新のロボット工学と、あの平面の景色が教えてくれたのは、身体を扱うプロフェッショナルとして、常に「未知なる一歩」を共に踏み出す勇気でした。