노바 액트를 사용하면 웹 브라우저에서 사람이 직접 클릭하고 입력하는 작업들을 자동으로 수행할 수 있는 프로그램 즉 AI 에이전트를 만들 수 있다. 가령 회사 내부 시스템에 휴가나 부재 신청을 자동으로 제출하거나 구글 캘린더나 아웃룩과 같은 일정 관리 도구에 부재 기간을 자동으로 표시하거나 이메일 시스템에 부재중 자동 응답 메시지를 설정을 AI에 맡길 수 있다. AI가 사람 대신 컴퓨터를 클릭하고 스크롤 다운할 수 있는 셈이다.
아마존은 노바 액트를 공개하면서, 아마존이 생각하는 AI 에이전트 방향성을 공유했다. 대규모 언어 모델(LLM)이 등장한 이후, ‘AI 에이전트’는 주로 자연어로 응답하거나 검색 기반 생성(RAG)을 통해 지식 데이터베이스를 활용하는 시스템을 의미했지만 아마존은 에이전트를 사용자를 대신해 다양한 디지털 및 물리적 환경에서 작업을 완료하고 행동할 수 있는 시스템으로 재정의했다.
현재 노바 액트는 개발 초기 단계이지만, 아마존은 이를 바탕으로 결혼식 준비나 복잡한 IT 작업 등 다단계의 복합적인 과제를 수행할 수 있는 고도화된 에이전트를 개발하겠다고 설명했다. 아마존은 “일부 사용 사례는 현 에이전트 기술로도 이미 가능하지만, 높은 수준의 목표에 따라 동작하는 다단계 에이전트는 여전히 지속적인 인간 감독이 필요한 상황”이라고 밝혔다.
노바 액트 SDK는 복잡한 업무를 보다 작은 명령어로 나눠 처리할 수 있도록 지원한다. 예를 들어, 검색, 클릭, 텍스트 입력 등의 기본 명령어를 조합하고, ‘보험 추가는 하지 말 것’ 같은 세부 지침도 설정할 수 있다. 오픈소스 웹 자동화 프레임워크 플레이라이트(Playwright)를 통한 브라우저 직접 제어, API 호출, 파이썬 코드 연동 등도 가능하다. 아마존에 따르면, 노바 액트는 날짜 선택, 드롭다운 메뉴, 팝업과 같이 다른 모델이 실패하기 쉬운 기능에서 90% 이상의 정확도를 목표로 하고 있다. 노바 액트 SDK는 공식 홈페이지에서 지원될 예정이다.
현재 AI 업계는 노바 액트와 같이 웹 브라우저 상에서 다양한 작업을 자동으로 수행하는 기술을 앞다투어 내놓고 있다. 대표적으로 앤트로픽의 ‘컴퓨터 유즈’와 오픈AI의 ‘오퍼레이터’가 있다.
[email protected]
Read More from This Article: 웹 AI 에이전트 경쟁 가열··· 오픈AI·앤트로픽에 맞서는 아마존 ‘노바 액트’ 출시
Source: News