GPT-5.4는 GPT-5.3-코덱스의 코딩 성능을 통합하면서 스프레드시트, 프레젠테이션, 문서 등 전문 업무 환경에서 다양한 도구와 소프트웨어를 활용하는 방식도 개선했다. 오픈AI는 이를 통해 복잡한 실제 업무를 보다 정확하고 효율적으로 수행하고, 사용자가 원하는 결과에 도달하기까지 필요한 반복 작업도 줄일 수 있을 것으로 전망했다.
오픈AI는 성능 측면에서도 GPT-5.4는 주요 벤치마크에서 개선된 결과를 보였다고 주장했다. 예를 들어 AI 에이전트가 실제 지식 기반 업무를 수행하는 능력을 평가하는 GDPval 벤치마크에서 GPT-5.4는 전체 업무 과제 중 83%에서 산업 전문가와 동등하거나 그 이상의 수준의 결과를 보였다.
오픈AI는 GPT-5.4 개발 과정에서 특히 스프레드시트, 프레젠테이션, 문서 생성 및 편집 능력을 강화했다. 투자은행의 주니어 애널리스트가 수행할 수 있는 수준의 스프레드시트 모델링 작업을 평가한 내부 벤치마크에서 GPT-5.4는 평균 87.5%의 점수를 기록해 GPT-5.2의 68.4%보다 높은 성과를 보였다는 것이 오픈AI의 설명이다. 프레젠테이션 제작에서도 디자인 완성도와 시각적 다양성, 이미지 생성 활용도와 함께 모델의 사실 정확성에서도 변화가 관찰됐다.
또한 GPT-5.4는 오픈AI가 공개한 범용 모델 가운데 컴퓨터 사용(computer-use) 능력을 기본적으로 지원하는 첫 모델이다. 코덱스와 API 환경에서는 AI 에이전트가 실제 컴퓨터 환경에서 소프트웨어를 조작하고 여러 애플리케이션을 넘나들며 작업 흐름을 수행할 수 있다. GPT-5.4는 최대 100만 토큰(1M tokens)의 컨텍스트를 지원해 장시간 작업을 계획하고 실행하며 검증하는 에이전트 시스템 구축에도 활용될 수 있다. 이러한 기능은 웹 브라우징, 데스크톱 환경 조작, 멀티모달 이해 등 다양한 벤치마크에서도 확인됐다.
챗GPT에서 제공되는 GPT-5.4(‘GPT-5.4 Thinking’ 모델 선택 시 사용 가능)는 새로운 작업 방식을 도입했다. 모델이 답변을 생성하기 전에 작업 계획을 먼저 제시해 사용자가 응답 생성 과정에서 방향을 조정할 수 있도록 한다. 이를 통해 추가 대화를 반복하지 않고도 원하는 결과에 보다 빠르게 도달할 수 있다. 또한 웹 기반 심층 조사 기능이 강화되어 여러 출처의 정보를 종합해야 하는 질문에서도 보다 일관된 답변을 제공할 수 있다.
GPT-5.4는 대규모 도구 환경에서도 효율적으로 작동하도록 도구 검색(tool search) 기능을 도입했다. 이를 통해 에이전트는 다양한 도구와 커넥터가 연결된 환경에서 필요한 도구를 더 정확하게 찾고 활용할 수 있으며, 토큰 사용량과 응답 지연도 줄일 수 있다.
또한 GPT-5.4는 GPT-5.2 대비 문제 해결에 필요한 토큰 수를 줄여 동일한 작업을 보다 효율적으로 수행할 수 있도록 설계됐다.
오픈AI는 GPT-5.4가 기업과 전문가들이 복잡한 업무를 수행하는 과정에서 AI 에이전트를 활용한 새로운 업무 방식의 확산에 기여할 것으로 보고 있다.
jihyun.lee@foundryco.com
Read More from This Article: 오픈AI, 업무 환경 대응 AI 모델 GPT-5.4 발표…스프레드시트·문서 작업 강화
Source: News

