三社三様の設計思想、どこを見ればいいのか
「フィジカルAI」という言葉が、にわかに政策文書に登場するようになった。高市首相が2026年の年頭会見で引用したことも話題になったが、概念そのものは「デジタルツインにAIを融合させたもの」と整理すると分かりやすい。センサーで現実空間を複製するだけでなく、AIがその現実を理解して自律的にフィードバックを返す仕組みだ。
その社会実装の最前線として、自動運転が挙げられる。市場規模が大きく、技術の成熟度がある程度見通せるからだ。そして今、この領域でTesla・Waymo・NVIDIAが、それぞれ異なる技術哲学で競争している。
単に「どの会社が進んでいるか」を比べることにあまり意味はない。重要なのは、設計思想の違いがなぜ生まれたのか、その違いが規制・市場・安全性にどう絡むのかを理解することだ。ここを押さえると、今後この領域のニュースを見るときの解像度がぐっと上がる。
TeslaのE2Eは何を捨てて何を得たのか
自動運転の開発手法は、大きく「ルールベース」から「E2E(End to End)」へ移行しつつある。ルールベースとは、人間が書いた「If-Then」のルール集で車両を制御する方式だ。「前方の信号が赤ならブレーキを踏む」という単純なルールを大量に記述していく。しかし現実の道路は、そのルールで書き切れないほど複雑で、ルールが増えると互いに矛盾も生まれる。
Teslaがこの限界に正面から向き合ったのが、FSD(Full Self-Driving)バージョン12だ。イーロン・マスク氏は「人間が書いた30万行のC++スパゲティコードを捨て、数百万個のビデオクリップから学習したニューラルネットワークに置き換えた」と公言している。2023年のことだ。
純粋なE2Eへの移行後、2023年8月にはマスク氏自身がFSD BETA v12でシリコンバレーを約45分ドライブする様子をXでライブ配信した。「1回の介入があったが学習量を増やせば直る」「介入がなければ星5つ」と本人が評したこのデモは、E2Eの可能性を強く印象付けた。
その後Teslaは2025年6月からテキサス州オースティン一部地域でロボタクシーの検証を開始。2026年1月からはごく一部の車両で「監視員なし」の無人走行に移行している(後方に追跡車両が伴走しているとも報じられている)。
Teslaの強みは、世界中を走る数百万台の車両から日々膨大な走行データを集められる点だ。E2Eはデータ量がそのまま性能に直結するアーキテクチャであり、この「データフライホイール」は他社が簡単に真似できない。
ただし、純粋なE2Eには構造的な弱点がある。モノリシックな巨大ニューラルネットワークの内部で認識・判断・制御を一括処理するため、「なぜその判断をしたのか」を事前に言語化できない。これがいわゆるブラックボックス問題だ。
WaymoはなぜE2Eを採用しないのか
フェニックス、サンフランシスコ、ロサンゼルスの一部で「完全無人」のタクシーを商用レベルで提供しているWaymoは、2026年6月時点でE2Eアプローチを採用していない。
代わりに採用しているのが「モジュール型ML(機械学習)」だ。システムを「認識」「予測」「計画」「制御」のモジュールに分割し、各モジュールをデータで学習させる。ルールベースの硬直性を克服しながら、各モジュールを個別にテスト・検証できる構造を維持している。
Waymoの共同CEOドミトリ・ドルゴフ氏は、TeslaのようなモノリシックなE2Eについて「導入は非常に簡単だが、安全かつ大規模に完全自動運転を実現するには全く不十分だ」と明言している。
ここからは筆者の見方だが、Waymoのこだわりはただの技術的好みではなく、戦略的な選択でもある。欧州や日本の規制当局が認可判断の際に重視するのは「AIの説明可能性」だ。「なぜそう判断したか」を答えられないシステムは、安全審査の入口にすら立てない可能性がある。
Waymoが完全無人タクシーを商用運行できているのは、技術力だけでなく、この「説明できる安全性」を積み重ねてきたからでもある。規制対応力を設計段階で織り込んだアーキテクチャ、と言い換えることもできる。
なお、WaymoがE2Eを全否定しているわけではない。Googleの「Gemini」を活用したE2Eマルチモーダルモデル「EMMA」を発表しており、次世代ソリューションとして研究を続けている。EMMAの特徴は、車両からの情報を「自然言語」として処理する点だ。「道路脇からボールが転がってきた。子どもが飛び出すかもしれないから回避行動をとる」という推論をAI自身が言語化できる。E2Eの処理能力と、人間が検証できる説明可能性を両立させようという試みだ。
NVIDIAのAlpamayoは何者か
NVIDIAが「Alpamayo」という名称のシステムで本格参戦してきた。VLA(Vision-Language-Action)モデルという仕組みを核とする「自動運転に人間のような思考力を与えるAIプラットフォーム」と説明される。
VLAの三要素を整理すると、Vision(複数カメラ・LiDAR・レーダーで周囲を「見る」)、Language(なぜその判断をしたかを自然言語で説明できる)、Action(具体的な走行軌道を出力する)だ。「見て、考えて、動いて、説明できる」という構造は、TeslaのE2Eが持つブラックボックス問題へのひとつの解答だ。
注目すべきはビジネスモデルだ。AlpamayoはVLAモデル・大規模データセット・シミュレーターをオープンソースで無償提供する。なぜNVIDIAが無償で開放するのか。
これはCUDA戦略の再演に見える。CUDAはGPU向けの並列計算プラットフォームを無償公開することで、開発者がNVIDIA GPUを「使わざるを得ない」生態系を作り上げた。Alpamayoも、ソフトウェアを標準化することでGPU・推論コンピュータ・クラウドトレーニング環境といったハードウェア周辺の販売を引き込む構造を狙っているのではないか、と読める。
展開先もすでに動いている。2026年3月のNVIDIA GTC Keynote 2026では、メルセデス・ベンツCLAへの搭載が最初の量産車向け展開として予定されていることが発表された。BYD、ヒョンデ、日産、ジーリーもパートナーとして加わったことも明らかになっている。
もっとも、CUDAの成功モデルがそのまま通用するかは未知数だ。自動車メーカーは競合他社と同じプラットフォームに乗ることを嫌う傾向があるし、自動車市場特有の安全基準・認証コストもある。「標準を握る」戦略が自動運転市場で機能するかどうかは、今後の数年で見えてくる。
「説明できること」が規制の通貨になる
技術論を離れて、規制の話をしたい。なぜなら、この三社の設計思想の違いは、そのまま規制対応力の違いに直結するからだ。
日本の道路交通法第38条を例にとる。「横断しようとしている歩行者」を保護する義務が規定されているが、「横断しようとしている」の定義は明記されていない。車道に足を踏み出したのか、直前で立ち止まっているだけなのか。この判断は現行法では、ドライバーの主観と警察・司法の積み重ねで形成されてきた。
TeslaのモノリシックE2Eは、このシナリオを「過去の学習データに基づく統計的パターンマッチング」で処理する。結果として適切に減速・停止できたとしても、システム内部には「歩行者保護の義務があるから」という法的な推論は存在しない。事故が起きたとき、「なぜその挙動をとったのか」を人間の言葉で証明できない。
一方、AlpamayoのようなVLAモデルは、歩行者を認識した上で「法律上の義務」を言語的に推論し、停止という行動につなげる設計だ。これは事前・事後の説明・検証を可能にする。規制当局が「なぜ止まれなかったのか」を問い質したとき、答えを出せるかどうかは極めて重大な差異だ。
規制の動向も急ピッチで動いている。2026年4月にオランダ車両局(RDW)がTeslaの「FSD Supervised」の型式認可を発行。その後デンマーク・ベルギーなど5カ国で承認が続いた。Teslaは「2026年夏のEU全域承認」を目標に掲げているが、スウェーデン・フィンランドなど北欧諸国が懸念を示しており、EU全域承認が2027年第1四半期にずれ込む可能性も指摘されている。
そして日本だ。Tesla Japanの代表者は「2026年内のFSD Supervisedリリースを日本で実現したい」とメディアで公言している。OTAアップデートでステアリング・ブレーキ制御などの機能を追加する場合、「特定改造許可・届け出」が必要になる。日本がブラックボックス型のE2Eにどう裁定を下すかは、レベル4以上の無人自動運転に対する日本の規制姿勢を占う試金石になる。
実務的に何を見ておくべきか
ここからは、このニュースをどう読むかの軸を整理したい。
まず、自動運転AIのニュースを見るとき、「E2EかモジュールかかVLAか」という技術分類よりも「説明可能性をどう設計に組み込んでいるか」を確認するのが有効な視点だ。技術の優劣は時間が経てば塗り替わるが、説明可能性への設計思想は規制対応と直接つながるため、事業継続性に関わる。
次に、NVIDIAのオープンソース戦略は「ソフトウェアで標準を作り、ハードウェアを売る」という構造の再演かもしれないが、自動車産業は半導体産業と違い、安全認証・サプライチェーン・OEM間の競争など障壁が多い。パートナー企業のラインアップ(BYD・ヒョンデ・日産・ジーリーなど)が今後どう変化するかが、実際の普及速度を測る指標になる。
そして、テキサス州で2026年5月28日に無人自動運転車両の商業運行に事前認可取得を義務付ける法律が施行されたことは見逃せない。「走りながら法律を作る」フェーズから「法律を守りながら走る」フェーズへの移行が始まっているということだ。このシフトは、データ収集の速度よりも規制対応の速度が競争優位を左右し始めることを意味する。
最後に、ある大手国産メーカーの自動運転開発責任者が「SAEのレベル分け自体、そのうち意味のないものになるだろう」と語っているという話は示唆的だ。国際基準が技術に追いつけなくなっているという現場感覚は、規制当局と開発現場の間に埋まらない溝が生まれていることを示している。その溝をどちらが先に埋めるか——技術側が規制に歩み寄るのか、規制側が技術を追うのかが、今後の論点になる。
三社の設計思想の違いは、突き詰めると「何を最優先するか」という哲学の違いだ。Teslaはデータと学習量、Waymoは説明可能な安全性、NVIDIAはプラットフォームの標準化。それぞれに合理性があり、どれかが単純に正解というわけではない。この三軸を頭に入れておくと、次に自動運転関連のニュースが出たとき、「この会社はどの哲学で動いているのか」がすぐ見えてくる。
参考元: 生成AI×自動運転で注目のTesla・Waymo・NVIDIA 各社が目指す「フィジカルAI」は何が違うのか(@IT)