知覚は受け取るのではなく“当てにいく”──予測符号化の直感
人は外界をそのまま写し取っている、という感覚で日々を過ごしている。目の前の机は机だし、信号は赤だし、相手の声は相手の声に聞こえる。けれど認知科学や神経科学の一部の流れでは、知覚を「入力を受け取る装置」ではなく「入力を当てにいく装置」として捉える。世界は情報量が多すぎるので、脳は受動的に処理するよりも、先に予測を立てて、外から来た情報で誤差を修正するほうが効率が良い。これが予測符号化(predictive coding)と呼ばれる考え方の核にある直感だ。
予測符号化の話が魅力的なのは、知覚の不思議を“説明の形”に持っていけるからだ。たとえば錯視は、外界の刺激が同じでも、見え方が変わる現象だ。もし知覚が単なる入力の写しなら、錯視は起きにくいはずだが、実際には頻繁に起きる。予測が強すぎると、脳は入力を予測に引っ張って解釈し、現実とずれた“見え”を作る。逆に、予測が弱いと、ノイズを拾いすぎて安定した知覚が崩れる。つまり、知覚は予測と誤差修正のバランスで成り立っている、という見立てになる。
この枠組みで言う「予測」は、単に未来の出来事を言い当てる占いのようなものではない。もっと日常的で、身体に密着している。たとえば会話では、相手が何を言いそうかを予測しているから、ノイズがあっても意味を補完できる。歩行では、足を出したら地面があるはずだと予測しているから、身体は滑らかに動ける。もし毎回、足を出してから地面を確認していたら、まともに歩けない。予測があるからこそ、私たちは世界を“連続した一つの場”として経験できる。
ここで世界モデルという言葉に接続すると、脳内の予測の土台にあるのは「世界はだいたいこう動く」という内部表現だ。物は落ちる、硬いものはぶつかれば跳ね返る、人は視線の先を気にする、言葉には文法がある。こうした規則性をまとめたものが、脳にとっての世界モデルのように働く。もちろん、脳が「世界モデル」というラベルのファイルを保存しているわけではない。しかし、予測を立てるための内部構造がある、という意味では世界モデル的だと言える。
ただし、ここで重要な注意点がある。予測符号化が魅力的な説明だからといって、「脳は世界を正しく理解している」には直結しない。むしろ逆で、予測は知覚を歪める可能性も含んでいる。人は信じたいものを見たり、慣れたパターンに当てはめたりする。世界モデルが強いほど、現実がそれに合わないときに、誤差を無視する方向へ行くことがある。世界モデルは賢さの源であると同時に、偏りの源にもなる。この両義性こそが、脳を世界モデルとして語るときのリアリティだ。
学習・記憶・行動が一本の線でつながる──“内部世界”が意思決定を作る
脳が世界モデルを持つかどうかを考えるとき、知覚だけでなく行動や学習まで一緒に見ると、話がぐっと面白くなる。なぜなら、世界モデルがあるというのは「未来を予測できる」だけでなく、「未来を変える手段を選べる」ことを含むからだ。予測は行動のためにある。行動がなければ、予測は単なる空想で終わる。
行動を選ぶという視点から見ると、脳は常に反事実を扱っているように見える。反事実とは「もしこうしたらどうなるか」という仮の未来だ。ドアを押すか引くか迷うとき、私たちは頭の中で一瞬試している。道を渡るか待つか判断するとき、車の速度と自分の歩行速度の関係を、厳密な数式ではなく感覚でシミュレーションしている。こうした内部シミュレーションは、世界モデルがあると考えると自然に説明できる。世界の動き方を内部に持っているから、行動の結果を事前に見積もれる。
学習もこの枠組みに入る。世界モデルがあるなら、学習とは世界モデルの更新だ。予測が外れたとき、脳は誤差を感じ、次から外れにくいように内部表現を調整する。これは単純な連合学習としても説明できるが、世界モデルという観点では「状態を推定し、遷移を学ぶ」プロセスとして捉えられる。ここでの状態は、外から見える刺激だけではない。相手の意図、場の空気、自分の体調といった、直接観測しづらい要因も含まれる。人間が社会的に賢いのは、見えない状態を推定し、それを使って未来を読むからだという見方もできる。
記憶もまた、世界モデルと結びつく。私たちは過去の出来事を、ビデオのようにそのまま保存しているわけではない。記憶はしばしば再構成され、文脈に合わせて変形する。それを欠陥と見るか、機能と見るかで評価は分かれるが、世界モデルの観点では機能に見えてくる。つまり、記憶は単なる保存ではなく、「次の予測に役立つ形での圧縮」なのかもしれない。細部の忠実さよりも、因果の骨格を残すほうが、次の行動選択に役立つ場面は多い。
ここまでの話はAIにも似ている。AIの世界モデルも、観測を潜在状態に圧縮し、次の状態を予測し、目的に沿って行動を計画する。脳とAIの違いは、脳があまりにも多様な目的を同時に持っている点だ。食べる、逃げる、仲良くする、学ぶ、休む。しかも身体は疲れるし、感情は揺れる。だから脳の世界モデルは、単一のタスクに最適化された工学モデルよりも、曖昧で柔軟なものにならざるを得ない。ここが人間らしさの源であり、同時に、人間が非合理にも見える理由にもなる。
さらに、脳には身体性がある。世界モデルは脳内だけで完結せず、体の制約や感覚と密接に結びつく。空間を理解するとき、私たちは視覚だけでなく、姿勢や触覚の感覚を統合している。行動は世界を変え、その結果が再び感覚として戻ってくる。このループを回し続けることで、世界モデルは鍛えられる。だから「脳は世界モデルを持つか」という問いは、実は「脳と身体のシステムは世界モデル的に働くか」と言い換えたほうが正確かもしれない。
世界モデルが壊れるときに見えるもの──AIの弱点を理解する鏡
世界モデルを賢さの鍵として語るなら、同じくらい大事なのは「世界モデルが壊れると何が起きるか」だ。壊れると言っても、物理的に破損するわけではない。予測が偏る、更新が止まる、誤差の扱いが歪む。こうした状態が起きると、人の振る舞いは驚くほど変わる。そしてそれは、AIが見せる弱点と不気味なくらい似た形を取ることがある。
たとえば、思い込みが強い状態を考える。人は一度「こうに違いない」と信じると、その信念に合う情報だけを取り込み、合わない情報を無視したり軽く見たりしやすい。これは世界モデルの更新が偏る状態と見なせる。予測誤差を素直に受け取ってモデルを修正するのではなく、誤差を「例外」として処理してしまう。結果として世界モデルは頑固になり、外界とのズレが大きくなる。それでも本人の中では整合が取れているので、ますます確信が強まる。これは、人間が時に陰謀論や誤信念にはまる仕組みの一部としても語られるし、日常の小さな誤解にも当てはまる。
別の例として、強いストレスや疲労の状態では、長期の見通しが立てづらくなることがある。未来を想像する余裕がなくなり、目先の反応に寄る。世界モデルで言えば、予測の地平が短くなり、内部シミュレーションが粗くなる状態だ。これは合理性の低下に見えるが、危機状況では短期反応が生存に有利なこともある。つまり、世界モデルの“性能”は状況と目的に依存する。人間の世界モデルは、常に最適ではなく、環境に合わせてモードを切り替えるように働く。
そして、ここがAIとの比較で面白いところだが、AIもまた「もっともらしいが外界に合わない」出力をすることがある。言語モデルのハルシネーションは分かりやすい例で、内部の整合性に従って文章を生成するが、現実の事実や因果と一致しないことがある。これを「嘘をついた」と道徳的に捉えるより、「世界モデルの拘束が弱い場所で、もっともらしさが勝った」と構造的に捉えるほうが理解が進む。人間が思い込みで現実をねじ曲げて解釈するのと、似た形が見えるからだ。
さらに、分布外で壊れるというAIの弱点も、人間の世界モデルと重ねて理解できる。人は未知の文化や未経験の状況に出会うと、既存の枠組みで解釈しようとして誤解することがある。異文化コミュニケーションで起きるすれ違いは、世界モデルの不一致と言える。AIが学習データにない状況で誤るのも同様で、既存のパターンで埋めようとしてしまう。違いは、人間は経験の中で世界モデルを更新し続けるのに対し、AIは更新の仕組みを明示的に設計しないと固定化しやすい点だ。ここに、将来のAIに求められる方向性が見える。世界モデルを持つなら、世界モデルを更新し続ける仕組みが必要になる。
結局、「脳は世界モデルを持っているのか」という問いに対して、答えは一言ではない。脳が工学的な意味で明示的な世界モデルを実装していると断言するのは難しい。一方で、予測を軸に知覚・学習・行動がつながり、内部表現が未来の見積もりに使われているという意味では、脳は世界モデル的に働いていると言える。そして何より重要なのは、世界モデルは正しさだけで測れないということだ。予測は知覚を助けるが、同時に偏りも生む。更新は学習を生むが、同時に思い込みも生む。この両義性を受け入れたとき、世界モデルは単なるAIの流行語ではなく、「知能とは何か」を考えるための強力なレンズになる。脳を理解するために世界モデルを使い、世界モデルを実装するために脳から学ぶ。その往復運動こそが、生成AI時代の“予測する心”を現実のものにしていく。
Read More from This Article: 脳は世界モデルを持っているのか。認知科学から見た“予測する心”のリアリティ
Source: News

