ガートナーが展望する2026年のAI――技術の進化と企業に求められる変化 CIOに求められるケイパビリティ
Gartner プロフィール亦賀 忠明ガートナージャパン ディスティングイッシュト バイス プレジデント アナリスト米国でのソフトウェア開発を含む10年以上のエンジニア経験を経て、Gartnerに入社。以降、インフラ、クラウド、先進テクノロジを中心に担当。ここ数年は、AI、産業革命、マインドセットといった領域に注力し、ユーザー企業のCEO、CIOといった経営者はもとより、主要なベンダー、インテグレーターのエグゼクティブに対して、さまざまな戦略的アドバイスを行っている。 AIエージェントとエージェント型AI――混乱を整理する 亦賀氏はまず、エージェント型AIとAIエージェントの混乱を指摘する。2024年には「AIエージェント」が、2025年には「エージェント型AI」がそれぞれ注目されたが、両者は根本的に異なる、と亦賀氏。混乱を受けて、ガートナーは2025年5月、この2つの概念を明確に区別する見解を発表している。 チャットボット、RPA、AIエージェント、エージェント型AIの違い Gartner それによると、生成AIが「想定通りに答えを返すもの」であるのに対し、AIエージェントとエージェント型AIは「タスクを実行するもの」となる。タスクの実行という点ではRPAも同じ類となるが、AIエージェントは「少し気を聞かせて、設定された通りにシンプルなタスクを実行する」と説明する。また、AIエージェントはビルダーを使ってユーザーが作り込まなければならない「手組み細工」だ。そこでは、「簡単にできる」というベンダーの謳い文句と現実のギャップも見られるとする。 これに対し、エージェント型AIは「大いに気を利かせ、自律的に複雑なタスクを実行する」と説明する。「エージェント性と目標指向性を備えた進化系」であり、記憶や計画、ツール活用などの機能を備え、複雑なタスクを自律的に目的指向で遂行することが期待されている。 亦賀氏はこのような市場の混乱を「インターネットの初期」に喩える。「いろいろなものが出てくるが、その中には本物ではないものもある」と述べ、ベンダーが実質的なエージェント機能を組み込まずに既存プロダクトをリブランディングする「エージェントウォッシング」に注意すべきと忠告した。 なお、今見られるAIエージェントの起源は、2022年にリリースされたLangChainなど、数年前からある技術であることにも触れた。「(2022年末のChatGPT公開により)ChatGPTやGeminiなどのマルチモーダルLLMが注目を浴びたことで、このようなAIエージェントへの注目が一旦薄れた」と流れを説明した。 エージェント型AIプロジェクト成否を分けるもの――40%のプロジェクトが中止される そのエージェント型AIの利用について、ガートナーは2028年までに、日々の仕事における意思決定の少なくとも15%は、エージェント型AIによって自律的に行われるとの予想を出している。そこでは、二極化現象も予想される。真の価値を享受する企業が生まれる一方で、2027年末までにエージェント型AIプロジェクトの40%以上が、コスト高騰、ビジネス価値の不明確さ、不十分なリスク・コントロールなどを理由に中止されるというのだ。 「着実に成果を出す組と、過度な期待を含めて振り回されてしまい挫折してしまう組に分かれるだろう」(亦賀氏)。 成否を分けるものは何か。ーー亦賀氏の答えは、「ケイパビリティ」ーーつまり組織と人の能力だ。ケイパビリティが不足している場合、CIOや情報システム部長はベンダーに丸投げすることになるが、このアプローチでは「大体が失敗する」と警告した。 失敗の原因は、しっかりとした理解も何もないままベンダーに提案を求め、真のエージェント機能を持つのか見極めることなくPOCを進めるから。期待した成果が得られずに終了となる。そして、このサイクルを繰り返している企業が多いと亦賀氏は指摘する。「日本企業はRAG(Retrieval-Augmented Generation:検索拡張生成)の段階で、すでに精度の問題で苦戦している」と亦賀氏。「こうした状況にある企業では、次のステップとされるエージェントの実際の導入は極めて不安定で不確かなものになる」と指摘する。 2026年の注目技術――マルチエージェントとワールドモデル 2025年のAIエージェントとエージェント型AIの混乱から、2026年はどのように進展するのか。 ガートナージャパンが発表した2026年の戦略的テクノロジートレンドには、「マルチエージェント・システム」が入っている。マルチエージェント・システムとは個別、または共通の複雑な目標達成のために相互作用するAIエージェントの集合体、とガートナーは説明している。 このマルチエージェントは、現在の手組み細工的なアプローチから、より純粋なAI技術への進化を支える技術だ。「複数のエージェントが協調動作しながら、人間に代わって仕事をしてくれる」と亦賀氏は展望する。 この実現に向けて重要なのが、A2A(Agent-to-Agent)とMCP(Model Context Protocol)だ。 A2Aは、エージェント同士が連携するための会話のルールを定めるプロトコルで、2025年4月にGoogle Cloudが発表した。MCPは2024年11月にAnthropicが提案したもので、AIエージェントと外部のツールやデータと連携を可能にするプロトコルだ。亦賀氏は、「タスクの実行のために、”脳”としてのエージェントがMCPにより外部サービスを呼び出して文脈を作ることで、”手足”をもつことができる」と説明する。 マルチエージェントは、単一ベンダー内でも、複数ベンダー間でも構築可能だ。すでに、複数ベンダーのエージェントを管理することも可能になっている。 ただし、完全自動化に移るわけではない「ヒューマン・イン・ザ・ループは原則」と亦賀氏は強調する。例えば、飛行機を操縦する機長は原則として自動操縦で順調に飛行しているかを管理し、何かあれば自ら操縦する。人とAIエージェントの関係も同じようになるとみる。 エージェント側の進化と並行して、モデル側でも重要な技術革新が起きている。亦賀氏が注目するのがワールドモデルだ。 ワールドモデルは、マルチモーダルLLMとは異なる重要な特性を持つ。現実世界の物理的な因果推論ができるAI技術で、予測の精度が向上する。従来の生成AIが「かもしれない」という確率的な推測で答えるのに対し、ワールドモデルは観測データから物理的な性質や因果構造を暗黙的に学習し、より物理法則に整合する予測を行う。例えば物体の落下を尋ねた場合、LLMは学習データに基づく推測で「たぶん何秒」と答えるが、ワールドモデルは学習した世界のダイナミクスに基づき、落下の軌跡や着地までの時間を現実に近い形で推定できる。これは単なる統計的補完ではなく、物理的因果関係を反映した予測である。ワールドモデルは、AIが現実世界の物理法則やダイナミクスを捉えて未来の状態を予測するためのモデルとして研究が進んでおり、動画生成においても、物体の動きや重力、衝突などの物理的制約を理解することで、より自然で正確な映像生成を実現している。 ワールドモデル:世界を内部に再構成し、理解・予測・行動に繋げる知能 Gartner すでにGoogleの「Genie」やOpenAIの「Sora」など画像・動画生成系のモデルで利用されており、これらが生成する映像は、単なる視覚的なリアリティだけでなく、物理的に正しい動きを再現している。 「ワールドモデルは実にインパクトが大きな技術」と亦賀氏はその潜在性を表現した。この技術は、製造業のあり方を根本から変える可能性を秘めている。 ワールドモデルの応用、AIネイティブ企業の台頭 ワールドモデルの応用範囲は、EV、工場、ヒューマノイドなど多岐にわたる。デジタルツイン環境において、リアルなデータを捉えた最適化が可能になり、物理的な推論に基づく結果をフィードバックループで物理世界に反映していく。 例えばヒューマノイドに応用すると、多数の機体をネットワークで接続し、各機体の状態や動作データをリアルタイムでデジタルツイン環境に集約できる。ワールドモデルと分散強化学習を用いてデータから最適な動作を学習し、それを各機体に継続的にフィードバックすることで、ロボットは現場にいながら動作性能を改善していく。従来のように、機体を回収してオフラインで学習・調整する必要はなく、ネットワーク接続とAIにより運用中に最適化を行うことができる。 「この技術を製造業に応用すれば、AIデファインド マニュファクチュアリングが実現する」と亦賀氏。 インダストリAI、完全自動化の図 Gartner 中国企業は、この領域で既に大きく前進している。BYD や Xiaomi などは、AIを事業構造の中心に据えた “AIネイティブ企業” であり、本来の事業に加えて IT企業的な性質を併せ持つ。例えば、バッテリー企業として出発した BYD は、単なるEV製造にとどまらず、製造プロセスやサプライチェーン全体をデジタル前提で最適化している。また、Tesla はその先駆的存在として、モビリティを含むデジタル・インフラ企業へと進化しており、世界規模での学習と最適化を可能にしている。好むと好まざるとにかかわらず、こうした産業構造の変化を直視する必要がある。…

