오픈AI, 인터넷 검색과 추론 결합한 AI 에이전트 ‘딥 리서치’ 출시

“딥 리서치(Deep Research)는 금융, 과학, 정책, 엔지니어링과 같은 분야에서 집중적인 지식 작업을 수행하며 철저하고 정확하며 신뢰할 수 있는 연구가 필요한 사람들을 위한 도구다. 특히 수많은 웹사이트를 검색해야 하는 직관적이지 않은 틈새 정보를 찾는 데 효과적이다.”

오픈AI가 ▶︎방대한 온라인 정보를 검색하고 ▶︎추론을 사용하여 검색한 정보를 분석 및 종합한 후 ▶︎이러한 과정을 반복하며 다단계 연구를 수행하는, 한 단계 더 진화한 인공지능 에이전트인 ‘딥 리서치(Deep research in ChatGPT)’를 출시했다. 현재는 챗GPT 프로 사용자만 사용할 수 있고, 추후에 챗GPT 플러스 및 팀 사용자에게도 제공될 예정이다.

딥 리서치에 대해 오픈AI는 ‘사용자를 대신해 독립적으로 작업을 수행할 수 있는 차세대 에이전트’라고 소개한다. 사용자가 프롬프트를 통해 원하는 작업 주제나 내용을 요청하면, 이에 필요한 온라인 소스를 검색하고, 이를 분석하고 종합하는 과정을 거친 후, 최종적으로 종합적인 보고서를 작성한다.

이러한 보고서를 작성하려면 기존에는 검색 엔진에서 필요한 키워드를 입력해 자료를 찾고, 이를 일일이 확인하며 필요한 부분을 발췌하고 정리하며, 이를 근거로 종합적인 분석과 판단을 내리는 과정을 몇 단계나 반복한 후에, 최종적인 보고서를 작성하는 과정이 일반적이었다. 하지만 딥 리서치는 이러한 패러다임을 단번에 바꾼다는 설명이다.

이제는 연구자가 연구 주제, 목표, 방향 등을 설정하고 딥 리서치를 통해 보고서를 작성한 후, 최종적인 확인과 검증만 거치면 된다. 관련 분야의 전문가가 몇 시간 또는 며칠 걸일 방대한 작업을 단 몇 분만에 완료할 수 있게 된 것이다.

OpenAI

오픈 AI는 딥 리서치 출시 소식을 알리면서 립 리서치가 생성한 샘플 자료와 다양한 벤치마크 테스트 자료를 공개했다. 딥 리서치가 다단계 연구와 심층 분석을 통해 생성한 최종 결과를 GOT-4o와 비교한 결과를 보면, 단순한 자료 나열이 아닌 실력 있는 연구자가 전문적인 경험을 바탕으로 작성한 보고서에 더욱 가깝다.

전문가 수준에서 광범위한 주제에 걸쳐 AI를 테스트하는 HLE(Humanity’s Last Exam)에서는 26.6%라는 높은 정확도를 보였다. 동일한 테스트에서 GPT-4o는 3.3%, 클로드 3.5 소네트(Claude 3.5 Sonnet)가 3.8%, 제미나이 싱킹(Gemini Thinking)은 6.2%, 오픈AI o1의 경우 9.1%, 오픈AI o3-mini(high)는 13.0%의 정확도를 보였다.

오픈AI는 딥 리서치를 구축한 이유에 대해 “딥 리서치는 웹 전반에서 인사이트를 독립적으로 발견하고, 추론하고, 통합한다. 이를 위해 최초의 추론 모델인 OpenAI o1과 동일한 강화 학습 방법을 사용해 브라우저와 파이썬(Python) 도구 사용이 필요한 실제 작업에 대해 학습을 거쳤다”라고 밝혔다.

그러면서 “o1은 코딩, 수학 및 기타 기술 영역에서 인상적인 능력을 보여주지만, 실제 과제에서는 다양한 온라인 소스에서 광범위한 컨텍스트와 정보 수집을 요구한다. 심층 연구는 추론 능력을 바탕으로 이러한 격차를 해소하여, 사람들이 업무와 일상생활에서 직면하는 다양한 유형의 문제를 해결할 수 있도록 한다”라고 전했다.

오픈AI에 따르면 딥 리서치는 다양한 영역에 걸친 하드 브라우징과 추론 작업에 대해 엔드투엔드(end-to-end) 강화 학습을 통해 훈련되었고, 이러한 과정을 통해 원하는 데이터를 찾기 위한 다단계 계획과 실행, 역추적과 실시간 정보에 반응하는 방법을 학습했다. 또한, 사용자 업로드 파일 분석, 파이썬을 활용한 그래프 생성, 이러한 그래프와 이미지 첨부, 출처에서 문구나 구절의 인용이 가능하다.

물론 아직까지 완벽하다고는 할 수 없다. 오픈AI는 “내부 평가에 따르면 기존 챗GPT 모델에 비해 현저히 낮은 비율이지만, 응답에서 사실을 착각하거나 잘못된 추론을 할 수 있다. 권위 있는 정보와 루머를 구별하는 데 어려움을 겪을 수 있으며, 현재 신뢰도 보정에서 취약한 모습을 보여 불확실성을 정확하게 전달하지 못하는 경우가 많다. 출시 초기에는 보고서와 인용에 사소한 서식 오류가 있을 수 있으며, 작업을 시작하는 데 시간이 오래 걸릴 수 있다. 이러한 모든 문제는 사용 시간이 늘어남에 따라 빠르게 개선될 것으로 예상된다”라고 밝혔다.

딥 리서치는 챗GPT를 통해 제공되기 때문에, 챗GPT 메뉴에서 ‘딥 러서치’ 선택하면 된다. 우선은 한 달에 최대 100개의 쿼리를 처리할 수 있는 챗GPT 프로 사용자에게만 최적화된 버전을 제공한다. 일단은 웹브라우저를 통한 사용만 가능하고 2월 달 안으로 모바일 및 데스크톱 앱 버전도 출시할 예정이다.
[email protected]

Read More from This Article: 오픈AI, 인터넷 검색과 추론 결합한 AI 에이전트 ‘딥 리서치’ 출시
Source: News

오픈AI, 인터넷 검색과 추론 결합한 AI 에이전트 ‘딥 리서치’ 출시

Related posts