2026.02.26

フィジカルAIの本格化とAI Defined Manufacturingへの進化

本記事は、JDSCが2026年2月26日に開催したWebinar「フィジカルAIの本格化とAI Defined Manufacturingへの進化」の内容をもとに構成しました。
登壇者はJDSCデータサイエンティストの鈴木徳馬氏と、製造物流チームの兵藤峻氏。モデレーターはJDSCの山中和彦氏が務めました。

フィジカルAIとは何か

これまでAIはデジタル空間の中で進化を遂げてきました。その進化は大きく3段階に整理できます。

第一段階は、状態の認識・予測を行うAIです。工場のラインでカメラを使った良品・不良品の判別や、過去データを用いた需要予測など、特定タスクに特化したモデルがこれにあたります。

第二段階は、ChatGPTに代表される生成AIです。学習済みのデータをもとに、文章・画像・コードといった新しいコンテンツを生み出せるようになりました。

第三段階は、自律的にタスクを遂行するAIエージェントです。「来週の出張を手配して」という指示に対して、フライトやホテルの予約からスケジュール作成まで、複雑な工程を一貫して処理できます。

ただし、これらはすべてデジタル空間の中での出来事でした。フィジカルAIとは、このデジタル空間から飛び出し、物理的な空間に働きかけるAIを指します。デジタル空間で培った高度な知性を、ロボットなどのシステムを通じて現実世界に実装し、周囲を認識しながら自律的に行動する——それがフィジカルAIの本質です。

なぜ今、ロボットが変わるのか

従来のロボットは、あらかじめ定義された環境と動作の中でしか機能しませんでした。物体認識・動作計画・制御の各モデルを個別に構築する必要があり、わずかな条件変化にも対応できませんでした。たとえば、物流倉庫で扱う荷物のサイズが変わっただけで作業が止まるといった事態が起きます。これが、ロボット導入が特定の定型作業に限られてきた最大の要因です。

フィジカルAIを搭載したロボットはこの状況を打破する可能性を秘めています。センサー情報をもとに、一つのモデルで多様なタスクや環境に対応できます。事前にすべてを教え込まずとも、人間のように状況を見て判断し、臨機応変に対応できることで、適応範囲が広がってくると我々は考えています。フィジカルAIが社会に実装されるにあたっては、ハードウェアとAIの双方の開発が重要になってきます。

Physical AIの動向（ハード×AIの両輪／Physical AIが実現する未来）

近年、ハードウェアとAIは相互に連携しながら加速度的に進化しています。ハードウェアにおける急速な進化の代表例がヒューマノイドです。米中の企業がヒューマノイドの開発レベルを急速に向上させており、そのヒューマノイドを実際の工場や倉庫で稼働させることで、AI構築に必要なデータを各社が収集しています。集まったデータをもとに、多くの研究者を擁するスタートアップや大企業が、将来のスタンダードとなり得るAIの開発を進めています。

こうした取り組みの先には、多様なタスクや環境に柔軟に対応できるロボットの登場が期待されており、生産・物流の計画に応じてリソースや工程構成をリアルタイムで動的に変更できる未来の実現も期待されます。

世界の開発動向：米中の熾烈な競争

フィジカルAIは今まさに、アメリカと中国を軸に熾烈な開発競争が繰り広げられています。

アメリカは民間主導で開発が進んでいます。NVIDIAはロボティクス開発向けソフトウェアプラットフォーム「Isaac」の提供やAIチップ製造を通じ、垂直統合的にフィジカルAIインフラを構築しており、約75兆円規模の投資を表明しています。テスラはEV工場の一部をヒューマノイド「Optimus」向けに転換し、EVメーカーからロボットメーカーへの脱皮を進めています。スタートアップのFigure AIやApptronikも1,000億円超の資金を調達し、大手自動車メーカーと連携して現場データを取得しながら、自社モデルの開発を加速させています。

中国は国家主導で産業育成を進めています。2015年の「中国製造2025」でロボット産業を重点分野に位置づけて以降、政府のヒューマノイド調達額は2023年の約1億円から2024年には約45億円へと急増しました。2025年には先端技術特化ファンドを設立し、今後20年間で約20兆円を投資する体制を整えています。

市場予測も強気です。2035年頃から急速に拡大し、2040年には約60兆円規模になるとの見通しが示されています。モルガン・スタンレーは2050年に世界普及台数が10億台近くに達すると予測しています。現在の自動車保有台数が約15億台であることを考えると、その規模感がつかめるでしょう。

市場拡大を支える構造的背景

この市場拡大には、二つの構造的な背景があります。

一つ目は、少子高齢化による労働力不足です。国内の労働需給ギャップは2025年時点で約63万人ですが、2040年には1,100万人に達するとの予測があります。特効薬のない課題だけに、確実に深刻化していきます。本課題に対し、フィジカルAIは「量の補完」（24時間稼働による生産規模の維持）だけでなく「質の補完」（熟練技能の学習・継承）の実現も期待されています。

二つ目は、レジリエンス（強靭性）の強化です。地政学リスクの高まりやサプライチェーン再編の必要性を受け、拠点の立ち上げ、生産の柔軟性、全体最適性という三つの課題が浮上しています。フィジカルAIは、データに基づく判断と即時実行を通じて、これらの課題に応える可能性を持っています。

技術の最前線：ヒューマノイドはどこまで進化したか

ヒューマノイドの進展：Unitree Robotics 2023年→2025年の比較

2023年：https://www.youtube.com/watch?v=GtPs_ygfaEA
2025年：https://www.youtube.com/watch?v=jugwlqDF5wg

技術の進化速度は想定を超えています。中国のUnitree（ユニツリー）が2023年に発表したヒューマノイドは、足踏みしながらの動作が基本で、静止立位や着席からの立ち上がりも十分ではありませんでした。それがわずか2年後の2025年には、ジョウロを持って植木鉢に水をやるという高度なタスクができるようになっています。

これは単純な制御の改善ではありません。ジョウロの形状を認識して把持位置と力を計算し、水を注ぐ際に変化する重心をリアルタイムで制御する——人間が無意識に行うこの一連の動作を、ロボットが模倣できるようになったことを意味します。形状がバラバラな製品の梱包や複雑な異形物の仕分けなど、これまで人間にしかできなかった非定型作業の自動化が、現実味を帯びてきました。

Physical AIモデルの進展：CLIPort→Google→Physical Intelligence→NVIDIAのタイムライン

上記の進化は、AI研究の大きな進展に起因します。「物体の認識から制御までを一つのモデルで行う」という方向性が初めて示されたのは、わずか4年前の2022年のことです。当時の代表的なモデルがCLIPortで、シミュレーション上での言語指示によってテーブル上の物体を操作できることを示し、実際のロボットへの応用デモとしても注目を集めました。ただしこの段階では、大規模言語モデル（LLM）の本格活用にはまだ至っていませんでした。

流れが変わったのが2023年です。LLMの強力な推論能力をロボット制御に活かす研究が増え始め、その代表例がGoogleのRTシリーズです。「テーブルの上をきれいにして」といった抽象的な指示でもロボットが意図を理解し、具体的な動作に変換できる可能性が示されました。またGoogleはこの時期、多くの大学と連携してロボットデータを大規模に収集・公開しており、これがその後の開発加速の大きな起点となりました。

こうした流れを受け、研究の主軸は「実際に動かしたロボットのデータを大量に集めてAIを鍛える」方向へとシフトしていきます。その集大成ともいえるのが、2024年に発表されたPhysical Intelligenceの「π0（パイゼロ）」です。従来のフィジカルAIはロボットの動作がカクカクと不自然になりがちという課題がありましたが、π0は画像生成技術を応用することでこれを克服し、なめらかで器用な動きを実現しました。工場や倉庫でより複雑な作業をこなせるロボットを実現していくという点で、質的な飛躍をもたらしました。

しかし、更なる進化に向けては「データ」という重大な課題があります。大規模言語モデルはWebデータを大量に活用できますが、工場や倉庫でのロボット動作データはほとんど存在しません。NVIDIAは自社のシミュレーション環境「Isaac Sim」を活用し、現実世界では大量収集が難しいロボットのデータを、シミュレーションデータで補強するという戦略をとっています。さらに、AIモデル自体をオープンプラットフォーム化することで、多くの企業が自社データを加えて独自のフィジカルAIモデルを構築できる環境を整えつつあります。このエコシステムの形成によって、開発はここからさらに加速していくと見込まれます。実際、この分野の研究はすでにほぼ毎週のように新たな成果が発表されており、進化のスピードは増す一方です。

フィジカルAIモデルの進展

Physical Intelligence（衣類畳み）／NVIDIA（2体協調）のデモ比較

Physical Intelligence：https://www.physicalintelligence.company/blog/pistar06
NVIDIA：https://github.com/NVIDIA/Isaac-GR00T/tree/main

では、現在のフィジカルAIが実際に何をどこまでできるのか、2つの事例から見ていきます。Physical Intelligenceが2025年11月に公開したデモ映像では、ロボットが衣類を畳み、種類ごとに仕分けて配置するというタスクを連続してこなしています。

注目すべき点は2つです。1つ目は柔軟物の操作。洋服のような形が定まらない物体はシミュレーターで再現しにくく、従来のロボットが苦手としてきた領域です。2つ目は長時間のタスクを継続して実行していることです。AIは予測のわずかなズレが積み重なることで最終的に失敗しやすいという弱点がありますが、このデモではその問題が克服されつつあることが示されています。

NVIDIAのデモで特筆すべきは、2体のヒューマノイドが連動して作業をこなしている点です。将来の製造現場では1台での単独作業ではなく、複数台が協調しながら対象物に応じた役割分担を行う形が主流になると想定されており、NVIDIAの開発がその実現を見据えて進んでいることがわかります。

ロボットの動作がまだゆっくりで精度にも改善の余地があるように見えますが、これは現在進行形の課題であり、今後「データの蓄積」と「AIモデルのアーキテクチャ進化」という2つの軸で加速度的に改善されていくと見られています。実際、AIが「何をすべきか判断する処理」と「実際に動作を実行する処理」を分離することで動作速度を高める研究も進んでおり、実用レベルに耐え得るスピードと精度を実現できる可能性はあると考えています。

安全な現場導入を支えるデジタルツイン

いかに技術が進んでも、稼働中の工場・倉庫にまだ実績の少ないロボットをいきなり投入するリスクは高いです。いきなり試して、ラインが止まったり製品が傷ついたりするリスクは避けなければなりません。この問題を解決するのがデジタルツインです。

現場を精密に仮想再現したデジタルツイン上でシミュレーションを重ね、リスクを抑えながら現実への展開を準備するという手法の実証実験がグローバルで本格化しています。

自動車部品大手のSchaefflerは2025年4月、工場・倉庫のデジタルツイン上で汎用ヒューマノイド群の実証実験を開始すると発表しました。注目すべきは、ロボット単体のテストにとどまらず、「人中心の作業→人機協働→完全自動化」という工場進化の全シナリオをデジタル空間で検証している点です。

物流大手のKIONはCES 2025で、AIとデジタルツインを組み合わせた次世代倉庫ソリューションを発表しました。設計段階からロボット配置を最適化し、最も効率的なレイアウトを仮想空間で確立してから実装するアプローチを提示しています。試行錯誤を現場ではなくデジタル空間で完結させる。これが次世代の倉庫づくりのスタンダードになりつつあります。

フィジカルAIによる段階的な進化

こうした技術進化を踏まえた上で、次に考えるべきテーマが製造・物流現場への本格的な統合です。

従来の製造・物流現場は、2種類の作業が混在する構造になっていました。非定型作業は人が担い経験を通じてノウハウが蓄積される一方、スキルが個人に依存するため退職とともに失われるリスクがありました。定型作業には産業用ロボットが導入されているものの想定外の状況には対応できず、異常発生時は人が対応するのが現状です。結果として、工程全体の管理監督を最終的に人間が担うという構造が固定化されていました。この現状からフィジカルAIが進展していく世界は2つのフェーズで進化していくと考えています。

Physical AI／AIエージェント導入による段階的な進化（1/2 自動化）

第一段階：自動化の進展
フィジカルAIを搭載したヒューマノイドが現場に投入され、従来のロボットでは対応不可能だった非定型作業も自動化されます。多品種少量生産の組み付けやバラ積み荷物の仕分けも、ロボットが担えるようになります。

ここで重要なのは、自動化によってオペレーションが「自己進化するサイクル」を生む点です。ロボットの稼働データが蓄積され、それを学習に活用することでフィジカルAI自体がレベルアップしていきます。人の役割は「作業をする」から「AIを訓練し、工程全体を監督する」へとシフトします。

Physical AI／AIエージェント導入による段階的な進化（2/2 自律化）

第二段階：自律化の実現
自動化の次は自律化です。ロボットが人間の設計したルールに依存せず、周囲の環境変化をリアルタイムに捉えて自ら判断・行動する段階を指します。

たとえば、ある工程がボトルネックになった際、他工程の空きロボットが自律的に応援に回り、全体スループットを最大化します。さらに踏み込めば、固定されたベルトコンベア式のラインではなく、その日の生産計画に応じてロボット自身が最適な工程順序を構成するセル式・ネットワーク式の生産ラインが実現します。生産性と柔軟性の同時最大化、従来は相反するとされてきたこの二つが、両立可能になります。

AI Defined Manufacturing：製造のパラダイム転換

情報基盤と実行レイヤーの連結：Smart Factory から Physical AI × Digital Twin へ

これまでのスマートファクトリーは、IoTやAIを活用した設備稼働の可視化・予防保全・エネルギー管理が主な価値でした。その一方で、ラストワンマイルの作業や熟練技能を要する工程は依然として人に依存しており、自動化自体が難しいものとして諦められてきました。結果として、「見える化・最適化した結果を実行まで確実につなげる」という部分が実現できないままでした。

フィジカルAIとデジタルツインの融合は、この限界を打ち破る可能性を持っています。現場データをデジタルツインに取り込んでシミュレーションを行い、その結果をフィジカルAIが即座に現場へ反映する。そしてその実行結果が再びデータとしてデジタルツインに還元される。このループが回り続けることで、工場の最適な姿が常に動的に描かれ、実行される世界が実現します。

生産パラダイムの転換：AI-Defined Manufacturing と Human-in-the-loop

これはまさに生産のパラダイム転換です。「人が設計・計画し、人が運用する」ことを前提としてきた工場が、AIが設計・計画と運用の両面に関わるAI Defined Manufacturingへと進化していきます。AIがPDCAを自律的に回しながら設計・計画・実行を担い、人は重要な判断と戦略立案に集中するという役割分担になっていきます。

人の役割の変化

AI Defined Manufacturingが実現する中で、人に求められる役割は大きく変わります。「モニタリングするだけ」になるわけではなく、むしろ、AIの進化に合わせて人自身もスキルと役割を変化させていくことが求められます。具体的には、従来の役割がそれぞれ次のように変わっていきます。機械を操作していた人は、ロボットやAIを訓練・教育する役割へ。現場作業を担っていた人は、作業自体をヒューマノイドに委ねつつ、工場全体の設計を担う役割へ。問題が起きてから解決するのではなく、AIと協調しながら問題を未然に防ぐ役割へ。そして現場での判断はAIに委ねながら、より上位の戦略立案を担う役割へとシフトしていきます。

こうした変革は、個人レベルにとどまらず組織全体の基盤整備も必要とする、大規模な取り組みです。実現に向けては、自社ならではの構想を描いた上で実行に移し、その結果をもとに構想をアップデートしていくというイテレーティブなアプローチが重要になります。変革の規模が大きい分、自社だけでやりきることが難しい局面も出てくるでしょう。そのような場面では、先端技術へのアクセスと変革推進の実績を持つ外部パートナーを活用することも、一つの有効な選択肢となります。

おわりに

フィジカルAIはまだ発展途上です。動作速度や精度に課題が残り、データ不足という根本的な問題も解決中にあります。しかし、ハードウェアとAIが相互に作用しながら加速度的に進化している現状を見れば、実用化の波が着実に近づいていることは明らかです。

少子高齢化、地政学リスク、多品種少量生産への対応など、日本の製造業が抱えるこれらの課題は、フィジカルAIが本格普及する時代に、むしろ変革の起爆剤になり得ます。この変化を受け身で待つのではなく、今から構想を描き、技術を掴みにいく姿勢が問われています。

フィジカルAIの導入を検討している企業に対して、JDSCは個別の導入支援にとどまらず、「あるべき姿」から逆算した全体構想の策定から技術の獲得・開発・導入まで、一貫してともに考えるパートナーとしての役割を担います。

フィジカルAIはこれからさらに進化し続ける領域です。その波を待つのではなく、能動的に掴み取っていく姿勢で、JDSCはパートナー企業とともに最先端技術への取り組みを進めています。現場課題の解決から将来構想の議論まで、関心をお持ちの方はぜひお気軽にご相談ください。日本企業の競争力向上と社会実装の推進に、ともに取り組んでいきたいと考えています。

セミナーTOP