구글 제미나이 CLI, 제드 코드 에디터와 통합··· AI 기반 개발 지원 강화

구글 제미나이 CLI AI 에이전트가 제드 코드 에디터에 통합되어 제미나이 모델을 러스트 기반 환경에서 직접 활용할 수 있게 됐다. 구글은 이를 통해 빠르고 반응성이 뛰어난 AI 경험을 제공한다고 설명했다. 이번 통합은 지난 27일 발표됐다. 이는 제드와 구글의 파트너십을 통해 제미나이 CLI를 초기 참고용 구현 사례로 활용하기 위한 목적이다. 제드는 또한 코드 에디터 간 통신을 표준화하는…

‘RTX GPU로 성능 강화’··· 에이수스, 비즈니스용 베어본 ‘NUC 15 퍼포먼스’ 출시

에이수스 NUC 15 퍼포먼스는 최신 인텔 코어 울트라 9/7 프로세서(시리즈 2)와 최신 엔비디아 지포스 RTX 5070/5060 노트북 GPU를 탑재한 베어본 미니 PC로, 3L의 콤팩트한 크기로 제작됐다. 에이수스는 해당 모델이 이전 세대 대비 최대 18% 향상된 AI 성능과 효율성, 최대 2배 향상된 그래픽 성능을 제공해 생산성을 위한 원활한 멀티태스킹 환경을 지원한다고 밝혔다. 사용자는 엔비디아 DLSS 4를…

“정보 복잡성 해결이 AI 성공의 핵심” 오픈텍스트·포네몬 조사 결과

이번 설문은 북미, 유럽, 아시아 등 6개국의 최고정보책임자(CIO), 최고정보보안책임자(CISO), IT 및 보안 리더 총 1,896명을 대상으로 진행됐다. 조사 결과, 응답자의 73%는 “정보 복잡성을 줄이는 것이 AI 도입 성공의 핵심 과제”라고 응답했으며, 특히 비정형 데이터(44%)가 정보 복잡성의 주요 원인으로 지목됐다. 주요 조사 결과는 다음과 같다. 전체 응답자의 57%는 AI 도입이 조직의 최우선 과제라고 답했으며, 54%는 AI…

AI가 경기 흐름 읽고 승률 계산하고… US 오픈 관람 경험의 진화

IBM과 미국 테니스 협회(USTA)가 2025년 US 오픈 웹사이트(USOpen.org) 및 US 오픈 앱에서 새롭게 선보이는 AI 기반 디지털 경험을 발표했다. IBM과 USTA가 공동 개발한 기능은 전 세계 수백만 테니스 팬에게 2주간의 그랜드 슬램 기간 동안 실시간 맞춤형 콘텐츠를 제공하며 팬들의 몰입도를 높이도록 설계됐다. 새로운 기능의 핵심은 매치 챗(Match Chat)이라는 인터랙티브 AI 어시스턴트다. 팬은 254개 단식 경기…

Redefining the edge: Setting new standards for AI infrastructure

The rapid advancement of AI is transforming industries. Today’s businesses need decision-making speed, operational resilience, and personalized experiences to maintain a competitive advantage. They also need to meet changing consumer and enterprise expectations for acceptable performance. Proximity-based AI infrastructure at the edge is essential for meeting these rising standards. The AI landscape is evolving, from…

Easing the pressure on the electrical grid with AI

It’s said that the U.S. electrical grid—a nationwide labyrinth of interconnected power plants, transmission lines, substations, and more—is the largest machine in the world. If that’s the case, this machine is starting to sputter. After decades of flat electricity demand, this infrastructure-heavy ecosystem has begun an era of dramatic complexity: AI-driven data centers are proliferating…

gpt-ossの何がすごいのか

gpt-ossの最大の特徴は、OpenAIがGPT-2以来、実に数年ぶりに公開した本格的なオープンウェイトモデルであるという点です。総パラメータ数約1170億の高性能モデル「gpt-oss-120b」と、約210億の軽量モデル「gpt-oss-20b」の2種類が、Apache 2.0ライセンスのもとで公開されました。これにより、企業はモデルの重みを自社のサーバーやクラウド環境に自由に配備し、独自のデータでファインチューニングを施すことが可能になります。これは、これまでAPI経由での利用が主だった高性能LLMの世界において、データ主権とカスタマイズの自由度を劇的に高めるものです。

性能と制御を両立する「Harmony」と「推論努力」

性能面では、gpt-ossは思考の連鎖を促す「チェーン・オブ・ソート(CoT)」や、外部ツールとの連携、構造化されたデータ出力といった複雑なタスクに最適化されています。特に注目すべきは「推論努力(reasoning effort)」という新しい概念の導入です。開発者はプロンプトで「low」「medium」「high」の3段階から推論の深さを指定でき、応答速度と品質のトレードオフを動的に調整できます。これにより、簡単な応答は素早く、複雑な分析は時間をかけて高品質に、といった柔軟な運用が実現します。

この高度な制御を可能にしているのが、「Harmony」と名付けられた独自のメッセージフォーマットです。Harmonyは、システム、開発者、ユーザー、アシスタントといった役割を明確に定義し、特にアシスタントの応答を「分析(analysis)」「解説(commentary)」「最終回答(final)」のチャンネルに分けることで、思考プロセスと結論を分離します。ユーザーには最終回答だけを見せつつ、内部では複雑な推論が展開されるという、洗練された対話設計が可能です。このフォーマットを正しく扱うためのレンダラもPythonとRustで提供されており、安定した実装を支援します。

革新的なアーキテクチャと導入のしやすさ

アーキテクチャにも革新が見られます。gpt-ossは、複数の専門家(エキスパート)ネットワークを組み合わせるMixture-of-Experts(MoE)構造と、効率的な注意機構であるGrouped Multi‑Query Attention(G-MQA)を採用することで、巨大なモデルでありながら計算効率を高めています。また、MXFP4という形式で量子化された重みが配布されるため、120bモデルでも80GBクラスのGPU、20bモデルに至っては16GBメモリのマシンでの実行が想定されており、導入のハードルを大きく下げています。

広がるエコシステム:自由な配備オプション

この自由度の高さは、広範なエコシステムの迅速な対応にもつながりました。vLLM、Ollama、llama.cppといった主要な推論エンジンや、Hugging Face、Azure、AWSなどのクラウドプラットフォームが早々に対応を表明し、開発者は使い慣れたツールチェーンの上でgpt-ossを動かすことができます。これは、特定のプラットフォームに縛られることなく、自社の要件に最適な配備オプションを選択できることを意味します。

もちろん、オープンになれば安全対策は難しくなります。APIモデルのような提供者側の動的な安全対策が効きにくいため、導入する企業側で入力フィルタリングや出力の監査、権限管理といったガバナンス体制を構築することが不可欠です。OpenAIもこの点を重視しており、モデルカードで詳細な安全性評価を公開するとともに、コミュニティと連携してリスクを発見・共有するコンテストを開催するなど、エコシステム全体で安全性を高める取り組みを進めています。

AI活用の主導権を開発者の手に

結論として、gpt-ossのすごさとは、単なる性能の高さだけではありません。それは、APIというブラックボックスの向こう側にあったAIの心臓部を開発者の手に解放し、品質、コスト、そしてデータガバナンスのすべてを自社の裁量で最適化する自由を与えた点にあります。Harmonyフォーマットを使いこなし、推論努力を適切に設定し、そして何より責任ある安全対策を講じることで、企業は自社のビジネスに完全に統合された、真に「自分たちのAI」を構築できるのです。gpt-ossは、AI活用の主導権をユーザーに取り戻す、新たな時代の幕開けを告げる存在と言えるでしょう。


Read More from This Article: gpt-ossの何がすごいのか
Source: News

The end of dashboards? GenAI and agentic workflows transform business intelligence

I recently attended a series of marketing-centric webinars hosted by industry-leading enterprise data cloud vendors, all proclaiming that the business intelligence (BI) dashboard is unofficially dead and that Generative AI-based cloud data platform interfaces would provide a renaissance, if not a clear path to redemption for the future of business intelligence. Further, some recent architectural…

Gen AI descends into disillusionment

The excitement over generative AI in the enterprise has passed its peak, and better use cases and more accurate results may be needed to renew the enthusiasm, experts say, as the technology slides deeper into the Gartner Hype Cycle’s dreaded trough of disillusionment. Although gen AI still has major potential for the enterprise, some expectations…