今頃聞けないLLMの「温度」の話を徹底解説

温度とは何か?——AIの「性格」を決める魔法のつまみ LLMが文章を生成するプロセスは、次に続く単語を無数の候補の中から一つずつ選んでいく、連続した予測作業です。このとき、AIは各候補単語に対して「次に来る単語として、どれくらいふさわしいか」を点数化します。これを「スコア」と呼びましょう。 例えば、「今日の天気は」という文の次には、「晴れ」「雨」「曇り」といった単語が候補に挙がります。LLMは内部の知識から、「晴れ」のスコアが最も高く、次いで「曇り」、「雨」と続く、というように序列をつけます。 ここで登場するのが「温度」です。LLMは、このスコアをそのまま使うのではなく、最終的に「softmax」という関数を通して「確率」に変換します。この変換プロセスの直前に、各単語のスコアを温度の値で割り算するという一手間が加えられます。この単純な割り算こそが、AIの性格を劇的に変えるのです。 温度が低い場合(例:0.2):スコアを小さな値で割るため、元々スコアが高かった単語と低かった単語の差が、さらに大きく開くことになります。先ほどの例で言えば、1位の「晴れ」のスコアが突出して高くなり、その確率が90%以上にまで跳ね上がる一方、2位以下の単語の確率は限りなく0に近づきます。結果として、LLMはほぼ間違いなく「晴れ」という単語を選びます。これは、最も「勝ち筋」と判断した選択肢に強く依存する、堅実で保守的な振る舞いと言えます。 温度が高い場合(例:1.0):スコアを比較的大きな値で割るため、スコア上位の単語と下位の単語の差が縮まります。1位の「晴れ」の確率が少し下がり、その分2位の「曇り」や3位の「雨」、さらには少し意外な「最高」といった単語が選ばれる可能性も出てきます。これは、多様な選択肢に目を向け、時には意外な一手を打つ、柔軟で創造的な振る舞いです。 つまり、「温度」とは、LLMが持つ知識や理解そのものを変えるスイッチではありません。同じ知識を元にしながら、それをどのような性格(キャラクター)で表現するかを調整するためのダイヤルなのです。料理に例えるなら、レシピ(知識)は同じでも、「火加減(温度)」を変えることで、しっかり焼き上げるか、ふんわりと仕上げるかをコントロールするようなものだとイメージすると分かりやすいでしょう。 ユーザー体験は温度で決まる——「堅実さ」と「ひらめき」のトレードオフ この「温度」というダイヤル調整は、ユーザーが直接触れるサービスの体験(UX)に絶大な影響を与えます。システムの要件に応じて、どちらの方向性を優先するかを明確にすることが、設計の第一歩となります。 低温度がもたらす「安心感」と「一貫性」 温度を低く設定すると、LLMの応答は安定し、表現も落ち着いたものになります。同じ入力に対しては、ほぼ同じ出力が返ってくるため、ユーザーは予測可能な対話を行えます。これは、特に以下のような業務領域で大きな価値を発揮します。 FAQチャットボット: 顧客からの問い合わせに対し、常に規定通りの正確な情報を提供する必要がある。 設定情報の自動生成: JSONやSQLなど、厳密な構文が求められるコードを生成する。 社内規程に基づいた案内: コンプライアンス上、逸脱した解釈や表現が許されない情報の提示。 これらの用途では、誤解や誤情報のリスクを最小限に抑えることが最優先されます。創造性よりも、信頼性と一貫性が求められる場面では、低温度の設定が基本方針となります。 高温度がもたらす「柔軟性」と「創造性」 一方、温度を高く設定すると、LLMの応答は人間らしい柔らかさを持ち、表現の幅が大きく広がります。同じ質問をしても、その時々で異なる言い回しや視点を提供してくれるため、対話が単調になりません。 アイデア出しの壁打ち: 新しい企画や広告のキャッチコピーについて、多様な切り口の提案が欲しい。 文章の校正・リライト: 硬い表現の文章を、より自然で分かりやすい表現に言い換える。 パーソナルアシスタント: ユーザーとの雑談や対話の中で、親しみやすさや驚きを提供する。 ただし、高温度の設定は諸刃の剣です。表現が豊かになる一方で、事実に基づかない情報(ハルシネーション)を生成したり、文脈から逸脱した応答をしたりするリスクも高まります。企業利用においては、この「ひらめき」のメリットと、「正確性の低下」というデメリットを天秤にかけ、どのレベルのリスクまで許容できるかを慎重に判断する必要があります。 「温度0」でも答えがブレる?——システム開発者が知るべき再現性の罠 理論上、温度を0に設定すれば、スコアの割り算は行われず、常に最高スコアの単語が100%の確率で選ばれるはずです。したがって、同じ入力(プロンプト)に対しては、必ず同じ出力が得られると期待されます。 しかし、実際の運用環境では、温度を0にしても応答がわずかに揺らぐことがあります。これは、多くの開発者を悩ませる「再現性の罠」であり、その原因はLLMの推論サーバ内部の計算方法にあります。 コンピュータが扱う小数(浮動小数点数)の計算は、足し算の順番が変わると、ごくわずかな「丸め誤差」が生じる特性を持っています。一方、LLMの推論サーバは、処理効率を高めるために、複数のリクエストをまとめて(バッチ処理で)計算します。その時々のサーバの負荷状況によって、このバッチサイズ(一度に処理するリクエスト数)は変動します。 バッチサイズが変わると、内部の計算、特に複数の値を合計するような処理(例えばRMSNormや行列積など)の順序が微妙に変化することがあります。この順序の変化が、前述の丸め誤差を生み、最終的な各単語のスコアに、ごくごく僅かな差となって現れるのです。 普段なら無視できるほどの小さな差ですが、もし複数の単語のスコアが非常に僅差で競い合っている場面では、この誤差が順位の逆転を引き起こす可能性があります。一度違う単語へ分岐してしまえば、その後の文章生成は全く異なるものになります。これが、温度0でも応答が固定されない現象の正体です。 では、どうすれば完全な再現性を確保できるのか? システムの要件として、入力と出力の一致が厳密に求められる場合は、以下の対策を講じる必要があります。 バッチ不変な実装の採用: バッチサイズが変わっても計算順序が変動しないように設計された推論用の実装(ライブラリやカーネル)を選択します。 環境の完全固定: モデル、推論エンジン、各種ライブラリ、GPUドライバなど、実行環境のバージョンをすべて固定します。 乱数シードの固定: 乱数を用いる処理が含まれる場合に備え、シード値を固定します。 これらの対策を徹底することで、初めて「同一入力に対して、同一出力を保証できる」と言い切れるようになります。 合わせ技で応答を磨く——top-p, top-k, ペナルティとの賢い付き合い方 実務では、「温度」単体で応答を制御することは稀で、他のサンプリング関連パラメータと組み合わせて使うのが一般的です。代表的なものに「top-p」と「top-k」、そして各種「ペナルティ」があります。これらの役割を理解し、適切に使い分けることが、応答品質を磨き上げる鍵となります。 top-k: 単純明快で、スコアが上位「k個」の単語だけを次の候補とします。例えば k=5 なら、どんなに確率分布がなだらかでも、候補は5つに絞り込まれます。 top-p: 確率が高い順に単語を足し上げていき、その合計確率が「p」に達した時点で候補を打ち切ります。例えば p=0.9 の場合、上位の数単語で確率の9割を占めるような分布(低温度時など)では候補が少なくなり、逆に確率が分散している分布(高温度時など)ではより多くの単語が候補に含まれます。文脈に応じて候補数を動的に変える、賢い手法です。 ペナルティ…

How to harmonize virtualization and containerization

Large enterprises often struggle to integrate two beneficial technologies: virtualization for server infrastructure and containerization for application infrastructure. The reason is the differing needs of operational technology (OT) and information technology (IT) teams. These teams tend to see virtualization and containerization in terms of their own needs. That makes it difficult to mesh the two…

AI in healthcare: Why CRM alone isn’t enough

When I began leading digital health programs over a decade ago, CRM was the shiny object. We believed that by implementing a unified platform, we could orchestrate seamless patient engagement, automate case management and bring intelligence into interactions that were otherwise siloed and manual. But over the years and through multiple large-scale deployments across Fortune…

Policy drive puts Indian enterprise software on a collision course with global giants

Amid rising trade tensions and restrictions on cross-border tech talent, New Delhi is signaling a shift toward homegrown enterprise software. IT Minister Ashwini Vaishnaw recently highlighted Zoho as a viable alternative to Microsoft’s productivity tools, underscoring efforts to promote local vendors in a market long dominated by global players. Multinationals such as Microsoft, Oracle, and…

What makes Korean Air’s IT fly

Korean Air CIO and managing VP Heejung Choi is quick to address a common misconception that the airline’s IT division is too conservative and lags behind tech trends, making it vulnerable to competition. But its partners and employees tell a different story, that the carrier effectively leverages current tech to create new value and strengthen…

シリコンバレーに激震! H-1Bビザ新手数料10万ドルが招くかもしれないIT人材の大変動とは?

今回のH-1Bビザ制度における変更点とは?

今回のH-1Bビザ制度における最も重要な変更点は、2025年9月21日以降に行われる「新規申請」に対してのみ、10万ドルという高額な手数料が課されるという点です。この金額は、多くのITエンジニアの初年度年収の半分以上に相当する可能性があり、企業にとっては採用コストの大幅な増加を意味します。国土安全保障省と国務省が連携して施行するこの新制度は、既存のビザ保有者が更新する際には適用されないと明記されており、制度変更による直接的な影響を受けるのは、これから米国でのキャリアを目指す世界中の優秀な人材とその採用を検討する企業です。

そもそもH-1Bビザは、米国の大学院を卒業した人材向けの2万件を含む、年間合計8万5千件という厳格な上限枠が設けられており、毎年、世界中から応募が殺到する人気の制度です。2026年度分のビザ発給枠もすでに上限に達したと発表されており、ビザ取得の競争率の高さは依然として変わりありません。しかし、これまでの「抽選」という運の要素が強かった門戸に、新たに「10万ドル」という巨大な経済的障壁がそびえ立つことになりました。この「コストの壁」は、ビザの申請資格を持つ候補者の中から、企業が誰を実際に採用するかという意思決定のプロセスに、これまでとは全く異なる力学をもたらします。制度の法的根拠や適用範囲を巡っては、早くも複数のIT企業や移民支援団体から訴訟の動きが報じられており、この政策の先行きは依然として不透明なままです。この法的な争いが続く間も、企業は採用計画を進めなければならず、現場は大きな不確実性の中に置かれています。

採用現場のリアル―凍結、見直し、そして海外シフトへの連鎖

政策発表のインパクトは、即座にテック企業の採用現場を直撃しました。これまで当たり前のように回っていた採用のサイクル、すなわち有望な候補者への内定通知、労働条件申請(LCA)の準備、社内での予算承認、そして渡航手続きといった一連のプロセスが、突如として停止、あるいは棚上げされる事態が多発しています。10万ドルという新たなコストは、採用プロセスの入り口に巨大なボトルネックを生み出し、企業は個々の採用案件ごとに、その費用対効果(ROI)をゼロから見直さざるを得なくなりました。

特に、変化の激しいシリコンバレーでは、この混乱に対応するための迅速な意思決定が下され始めています。例えば、これまで一人の高度なスキルを持つエンジニアに任せていた役割を複数の職務に分割し、米国内の人材で代替できる部分とそうでない部分を切り分ける動きや、そもそも米国内での採用を断念し、カナダやインド、メキシコといった国外拠点での採用に切り替えるという判断が加速しています。

この混乱が、特にスタートアップにとって著しく不利に働くという指摘は根強いものがあります。潤沢なキャッシュを持たない設立間もない企業にとって、優秀な外国人エンジニアを一人採用するために10万ドルを支払うというハードルは、あまりにも高すぎます。これは単に一人のエンジニアを採用できるか否かの問題に留まりません。革新的なアイデアを事業化する初期段階において、世界中から最高の才能を集められるかどうかが企業の成長を左右するため、今回の措置はスタートアップのエコシステムそのものを揺るがしかねないのです。対照的に、豊富な資金力を持つ巨大テック企業は、この費用を比較的容易に負担できるため、結果として優秀な人材が大手企業に集中しやすくなり、市場の健全な競争環境を歪めてしまうのではないかという懸念の声が高まっています。

企業の地理戦略―インドとメキシコへ向かう「二極化」の潮流

米国のIT企業が開発・運用機能を世界中に分散させる動きは以前から存在していましたが、今回のH-1Bビザ問題は、その流れを「二極化」という形でさらに明確かつ加速させています。その一つ目の極が、インドにおける高度開発拠点の強化です。かつてインドは、主にコスト削減を目的としたコールセンターやデータ入力といったバックオフィス業務の委託先と見なされていました。しかし、現在ではその位置づけが劇的に変化しています。例えば、大手コンサルティング企業のアクセンチュアは、インドのアンドラ・プラデシュ州に新たな巨大キャンパスを建設し、約1万2千人もの大規模な雇用を創出する計画を発表しました。これは、製品開発の根幹やAI関連の最先端研究といった、企業の競争力を左右する中核機能そのものがインドへ重心を移しつつあることを象徴しています。

そして、もう一つの極が、メキシコを中心とした「ニアショア化」の進展です。ニアショアとは、地理的に近い国に業務を委託することを指し、メキシコは米国にとって理想的なパートナーとなりつつあります。米国と時差がほとんどないため、リアルタイムでの共同作業が容易であり、物理的な移動時間やコストも低く抑えられます。近年、クラウド事業者による大規模なデータセンターへの投資や、SaaS企業の運用拠点設立がメキシコで相次いで発表されています。さらに、USMCA(米国・メキシコ・カナダ協定)による安定した供給網や、メキシコ政府による積極的な投資誘致策も追い風となり、米国の巨大市場に近接しながら開発・運用を行うための最適解として、メキシコの戦略的な重要性が急速に高まっているのです。

「受け皿国家」の熾烈な競争―好機を逃さない世界各国の戦略

一国が門戸を狭めれば、それは他国にとって才能を獲得する絶好の機会となります。米国のH-1Bビザ手数料の高騰は、まさに世界中の国々にとって「逆張りの好機」となりました。中でも英国は、いち早く高技能人材の呼び込みを国家戦略として掲げ、ビザ手続きの簡素化や費用の減免といった具体的な対抗策を打ち出す方針を表明しています。米国の10万ドルという高額手数料との違いを明確にアピールすることで、ロンドンが誇るテックおよび金融エコシステムの国際的な競争力を維持・強化しようという狙いが透けて見えます。

カナダは、2023年に米国のH-1Bビザ保有者を対象とした特別なオープンワークパーミット制度を期間限定で創設し、申請が短期間で上限に達するほどの絶大な人気を博しました。この制度自体はすでに終了していますが、「米国に留まることが困難になった高技能人材を即座に吸収する」という成功モデルを世界に示した意味は非常に大きいと言えます。この経験は、将来的に同様の追加策を講じる際の強力な土台となるでしょう。

中東では、アラブ首長国連邦(UAE)が提供する「ゴールデンビザ」が、優れた研究者や起業家、高度専門職人材に対して長期在留資格を与え、ドバイを中心に世界中からIT人材を引き寄せる強力な磁石として機能しています。アジアに目を向ければ、シンガポールが「Tech.Pass」や5年間の就労許可(EP)といった制度を整備し、企業の幹部クラスやトップレベルの技術者を明確なターゲットとして呼び込んでいます。これにより、多くグローバル企業がアジアの地域統括本部(HQ)や研究開発(R&D)拠点をシンガポールに集積させる流れが加速しています。これらの国々は、米国の政策変更を静観するのではなく、自国の経済成長に繋げるための戦略的な一手として、積極的に行動を起こしているのです。

「頭脳流出」は現実となるか―米国の教育・起業エコシステムへの長期的影響

H-1Bビザは長年にわたり、世界中の若者にとって、米国の大学院で学び、卒業後の実務研修(OPT)を経てキャリアを築くというアメリカンドリームへの重要なステップとして機能してきました。しかし、新規採用における10万ドルの経済的負担は、この夢の実現を著しく困難にします。企業が米国内での初回雇用に慎重になれば、米国の大学で学位を取得した留学生が、卒業後にそのまま米国内で就職できる可能性は著しく低下します。その結果、学びの場としては米国の質の高い教育を求めつつも、キャリアをスタートさせる場所としては、より門戸の開かれた英国、カナダ、シンガポール、あるいは中東の国々を選ぶという、「教育と就労の地理的な分離」が進行する可能性があります。近年のH-1Bビザ承認件数を見ると、全体の数は増加傾向にありますが、その内訳は更新が大部分を占めており、新規に流入する人材のハードルが年々高まっていることがデータからも示唆されています。

この変化が、米国のスタートアップ生態系に与える影響も決して看過できません。シリコンバレーの成功物語を振り返れば、その多くが移民によって創業された企業であったことは歴史的な事実です。移民がもたらす多様な視点やハングリー精神こそが、米国のイノベーションのダイナミズムを支えてきました。新規採用のコスト増が未来の起業家候補となる若き才能の流入を阻害するならば、それは将来的に米国の起業家パイプラインそのものを細らせ、活力を奪うことに繋がりかねません。現に、この問題はIT業界に限定されたものではなく、米国内の医療界からも、医師や研究者の人材不足がさらに深刻化するとの懸念が表明されるなど、H-1Bビザに依存してきた多くの専門分野で広範な影響が表面化し始めています。世界中の「高技能人材」が、働く場所として米国を選好しなくなれば、かつてシリコンバレーに一極集中していた技術、資本、そしてアイデアが、その周辺で静かに再配置されていくかもしれません。


Read More from This Article: シリコンバレーに激震! H-1Bビザ新手数料10万ドルが招くかもしれないIT人材の大変動とは?
Source: News