용도, 속도, 비용 등 작업 내용과 특성에 맞춰 다수의 모델로 선보이는 아마존 노바는 비즈니스 환경에서 시간을 단축하고 비용을 줄일 수 있는 인텔리전스 기능과 콘텐츠 생성을 제공하는 것을 목적으로 개발됐다. 아마존 베드록을 통해서만 이용할 수 있다.
아마존 노바는 텍스트와 시각 인텔리전스를 위한 언더스탠딩 모델(Understanding model) 4가지와 크리에이티브 콘텐츠 생성 모델(Creative content generation model) 2가지로 구성되어 있다. 언더스탠딩 모델 중 노바 마이크로, 노바 라이트, 노바 프로는 이번에 선보였고 노바 프리미어는 2025년 초에 선보일 예정이다.
지원하는 언어는 200개 이상이지만 영어, 독일어, 스페인어, 프랑스어, 이탈리아어, 일본어, 한국어, 아랍어, 간체 중국어, 러시아어, 힌디어, 포르투갈어, 네덜란드어, 터키어, 히브리어에 최적화되어 있다고 아마존은 밝혔다. 이번에 출시한 세 가지 노바 모델의 최대 출력 토큰은 5,000개로, 입력은 멀티모달이 가능하지만 출력은 텍스트만 가능하다.
노바 마이크로는 텍스트 전용 모델로 노바 제품군 중에서 가장 낮은 지연 응답 시간을 제공한다. 텍스트 요약, 번역, 콘텐츠 분류, 대화형 채팅, 브레인스토밍, 간단한 수학적 추론 및 코딩 작업에 적합하다. 컨텍스트 창은 최대 12만 8,000(128k) 토큰 길이(tokens in length)를 지원하며, 미세 조정을 통한 사용자 정의를 통해 정확도를 높일 수 있다.
노바 라이트는 빠르면서 저렴한 멀티모달 모델이 필요할 때 활용할 수 있다. 텍스트, 이미지, 비디오 입력을 지원하고, 한 번에 여러 이미지나 최대 30분 분량의 동영상을 분석할 수 있다. 컨텍스트 창은 최대 30만(300k) 토큰을 지원하며, 실시간 고객 상호작용 분석, 문서 분석, 시각적 질의응답 등을 처리할 때 활용할 수 있다.
노바 프로는 광범위한 작업에서 최적의 비용으로 정확성과 속도로 작업을 수행할 수 있도록 초점을 맞춘 고성능 멀티모달 모델이다. 노바 라이트와 마찬가지로 입력 토큰은 최대 30만(300k)을 지원하고, 1만 5,000줄의 코드가 있는 코드 베이스를 처리할 수 있다.
노바 마이크로 모델은 외부 문서를 지원하지 않지만 라이트와 프로 모델은 pdf, pdf, csv, doc, docx, xls, xlsx, html, txt, md 형식의 문서를 지원한다. 복잡한 추론 과제를 수행할 수 있는 가장 강력한 멀티모달 모델인 노바 프리미어는 현재 학습 과정에 있으며, 아마존 노바는 우선 미국 동부(버지니아 북부) 리전(Region)부터 서비스를 제공하게 된다.
크리에이티브 콘텐츠 생성 모델은 노바 캔버스(Canvas)와 노바 릴(Reel)로 구성된다. 노바 캔버스는 스튜디오 품질의 이미지를 생성할 수 있는 이미지 생성 모델로, 인페인팅, 아웃페인팅, 배경 제거 등의 편집 기능을 제공한다. 릴은 프롬프트와 이미지로 미디어, 광고, 엔터테인먼트를 위한 전문가 수준의 짧은 비디오를 제작할 수 있는 비디오 생성 모델이다.
아마존 인공지능 부문 로히트 프라사드 수석 부사장은 “아마존 내부에 약 1,000개의 생성형 AI 애플리케이션이 가동 중이다. 우리는 애플리케이션 빌더들이 여전히 어떤 문제를 겪고 있는지 파악할 수 있었다. 이번 아마존 모델은 내부 및 외부 빌더의 이러한 과제를 해결하고 강력한 인텔리전스와 콘텐츠 생성을 제공하는 동시에 지연 시간, 비용 효율성, 사용자 지정, 정보 기반, 에이전트 기능에서 의미 있는 진전을 이루기 위해 고안됐다”라고 밝혔다.
앤디 재시 아마존 CEO는 3일 라스베이거스에서 진행한 ‘AWS 리인벤트(re:Invent)’ 2024 기조연설에서 “아마존 노바는 업계 최고 비용 대비 성능을 자랑한다. 최대 75% 저렴하게 최고의 성능을 누릴 수 있다”라고 말했다.
[email protected]
Read More from This Article: AWS, 차세대 파운데이션 모델 ‘아마존 노바’ 발표 “최대 75% 저렴하게 이용”
Source: News