AIエージェント時代のデータ戦略 ―先行者利益獲得のための「AI-Readyデータ」整備とは?IDCアナリストが提言
「考える」から「実行する」へ―推論能力の飛躍的向上 鈴木氏はまず、企業のAI活用が新たな段階に入ったと指摘する。「2024年は生成AIが話題の中心でしたが、2025年になると、それは使えて当たり前。AIエージェントまでやってみたいという企業が非常に増えています」。 変化の背景にあるのが、AIモデルの推論能力の飛躍的な向上だ。中でも注目すべきは「Tool Use」(Function Calling)と呼ばれる技術の安定性向上だ。 「従来のプログラムでは、呼び出す条件やロジックを人間が事前に設計する必要がありました。しかし今のAIは、意味を判断して『これは外部モジュールに聞いた方がいい』と自主的に判断し、外部モジュールを呼びに行く。ここが大きく変わりました」と鈴木氏は説明する。 例えば、『顧客の購入金額が1万円以上』といった条件を設定するとそれに合致した場合のみ在庫確認システムを呼び出すのが従来のやり方とすれば、現在は問い合わせ内容や文脈から『この案件には在庫状況の確認が必要』とAIが判断し、適切なタイミングで外部システムにアクセスする、といったことが可能だ。 加えて、RAG(検索拡張生成)の進化も重要だ。推論の過程で検索を繰り返す手法やSelf-Correcting RAG(自己修正機能を持つRAG)など、多様な応用技術が登場し、AIコーディング能力の向上とも相まって、AIエージェントの実用性が格段に高まった。 具体的な成果も出ている。2025年7月には、Google DeepMindのAlphaGeometryが「記号演繹モジュール」を利用し、国際数学オリンピアードで金メダルに相当する成績を達成した。同じく7月には、Moonshot AIが開発した「Kimi K2 Thinking」が、200~300回の連続したツール呼び出しを安定して実行する能力を実証している。 従来は、多段階推論・行動において、初期方針と矛盾する行動を取る、途中の目標・制約を保持できない、過去の決定を忘れたかのように振る舞うという問題の克服が難しく、「30回の壁をどう超えるかが業界共通の課題でしたが、コンテキストウィンドウの拡張によってこの問題が解決されました」と説明する。 エージェンティックワークフローによる業務自動化が実用段階に入った今、企業には新たな課題が突きつけられている。それがデータ基盤の整備だ。 AIエージェントは、推論の過程で何度も外部データを参照しながら動作する。2024年まで主流だったRAGは入力時に一度だけデータを参照する仕組みだったが、2025年のAIエージェントは推論の実行フェーズで繰り返しデータにアクセスする。つまり、参照するデータの品質が、そのままAIエージェントの判断精度に直結するのだ。 スケーリング則の限界と「2026年問題」 AIの進化を語る上で欠かせないのが、2017年のTransformer論文以降の開発競争の歴史だ。2020年にはスケーリング則が発見され、「データ量×パラメータ数×計算リソース」を増やせば精度が向上することが明らかになった。2022年のChatGPT公開後は、LLMへの期待が一気に高まったが、技術的な競争の軸は、それより少し早く変化を迎えていた。同年発表のDeepMindによる「Chinchilla」論文が、単なるパラメータ増加競争に疑問を呈するものであったためである。 「Chinchillaの論文は、計算リソースが限られた条件下では、モデルのパラメータ数を増やすよりも、パラメータ数とデータ量のバランスを最適化する方が精度が高くなることを示しました。多くのLLMは過剰にパラメータを増やし、相対的にデータが不足する『Under-training』状態だった。この論文によって、業界の開発の方向性が変わりました」と鈴木氏は振り返る。 さらに深刻なのが、学習データの枯渇問題だ。「インターネット上の高品質な未学習テキストデータが枯渇しつつある」という指摘があり、データの枯渇が懸念される「2026年問題」として業界で議論されている。全世界のWebデータを一通り学習し終えた今、新たな高品質データの確保が困難になっているのだ。 「量は少なくても高品質なデータは、量は多くても低品質なデータの学習結果を遥かに凌ぐ。Metaの『Llama 3』開発でも、データ量を増やすよりも品質を上げた方が精度が向上したという結果が論文で示されています」と鈴木氏は説明する。 AI開発のテーマは、モデルの大きさからデータの品質へと完全にシフトした。鈴木氏は次のように強調する。「AI革命、いわばゴールドラッシュの競争は、AIモデル、つまりスコップよりも、データ品質、すなわち金脈の品位で決まる」。 5割の企業がデータ整備の壁に直面 では、日本企業の現状はどうか。IDC Japanが2025年3月に実施した調査によると、組織固有情報の整備状況について、第1・第2段階(AIで利用するには整備が必要)と回答した企業が約5割を占めた。 業界別に見ると興味深い傾向がある。「一般的には、金融業界がフィンテックで非常に先行しているという印象がありますが、実際のデータを見ると必ずしもそうでもない。むしろ流通業界がデジタルマーケティングを多く手掛けてきた経験から、段階別の構成比として少し先に進んでいる面もあります」と鈴木氏は分析する。 srcset=”https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?quality=50&strip=all 2160w, https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?resize=300%2C168&quality=50&strip=all 300w, https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?resize=768%2C432&quality=50&strip=all 768w, https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?resize=1024%2C576&quality=50&strip=all 1024w, https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?resize=1536%2C864&quality=50&strip=all 1536w, https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?resize=2048%2C1152&quality=50&strip=all 2048w, https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?resize=1240%2C697&quality=50&strip=all 1240w, https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?resize=150%2C84&quality=50&strip=all 150w, https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?resize=854%2C480&quality=50&strip=all 854w, https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?resize=640%2C360&quality=50&strip=all 640w, https://b2b-contenthub.com/wp-content/uploads/2026/01/スライド1.png?resize=444%2C250&quality=50&strip=all 444w” width=”1024″ height=”576″ sizes=”auto, (max-width: 1024px)…

