Skip to main content

フィジカルAIのためのリアルワールドモデル

ロボット、AIエージェント、自律システムに必要なものは、想像だけではなく、物理法則と幾何学に根ざしたワールドモデル

フィジカルAIのためのグラウンドトゥルースを確立

スクリーンの外に広がる経済活動の80%を支えるために - 配送ロボットが都市の街路を安全に走行し、AIエージェントが重要インフラを点検し、現場チームがGPS遮断環境でも活動できるような技術を構築しています。数十億枚の画像、地形、ドローン、衛星データで学習した私たちのモデルは、3つのコア機能を実現します:Reconstruct(再構築)、Localize(位置推定)、Understand(理解)。

Reconstruct (再構築)

スマートフォン、360°カメラ、ドローン、衛星、LiDARから、幾何学的に正確なデジタルツインを構築し、メッシュとガウシアンスプラットとして出力します。業界全体で広く採用されているガウシアンスプラット向けオープンソースフォーマット「SPZ」は、Niantic Spatial が開発。

Localize (位置推定)

Visual Positioning System(VPS)は、空中・地上のキャプチャデバイスを高精度な測位センサーへと変換し、GPSが届かない場所を含むほぼあらゆる環境で、正確な自己位置推定を実現します。5,000万のニューラルネットワークと150兆のパラメータを基盤としています。

Understand (理解)

Niantic Spatialでは空間インテリジェンスを構築しています。それは、物理世界と対話できるAIインターフェース。3D空間上のあらゆる点を理解し、計測し、推論する能力を持つものです。これは、世界をナビゲートするだけのフィジカルAIから、世界を解釈するフィジカルAIへの転換を意味します。見ているものが何か、なぜ重要か、そして次に何をすべきかを理解します。

フィジカルAI 最前線のリサーチ

AIが現実世界で機能するための基盤モデルを構築し、物理オペレーション全体における精度・自動化・リアルタイムでの理解を実現します。

DoubleTake:ジオメトリ誘導による深度推定

ECCV 2024

エッジハードウェア上で13.8秒でオフラインシーン再構築を完了。クラウド依存なし。グラウンドトゥルースの変化に応じて更新される永続的なシーンモデルをサポートし、動的または通信制限環境でのISRワークフローへの応用に適しています。

Learn more

シーン座標再構築プライア

ICCV 2025

確率的・学習済み3Dプライアを適用し、再構築と自己位置推定を強化。シーンの整合性、カメラ姿勢精度、再位置推定やビュー合成などの下流タスクを改善します。

Learn more

現実世界のインテリジェンスを必要とする産業に選ばれています