“문자 입력만으로 비디오를 생성할 수 있을 뿐만 아니라, 기존의 정지 이미지를 가져와서 비디오를 생성하고, 이미지의 내용을 정확하고 세세한 부분까지 주의 깊게 애니메이션으로 만들 수 있다. 또한 기존 비디오를 가져와서 확장하거나 누락된 프레임을 채울 수도 있다. 소라(Sora)는 실제 세계를 이해하고 시뮬레이션할 수 있는 모델의 기반이 되며, 이 기능은 AGI(Artificial General Intelligence)를 달성하는 데 중요한 이정표가 될 것이라고 믿는다.”
오픈AI(OpenAI)가 비디오 생성형 AI 모델인 소라 터보(Sora Turbo)를 출시했다. 2024년 2월에 선보였던 소라보다 빠른 성능을 제공하며, 챗GPT 유료 버전인 챗GPT 플러스(ChatGPT Plus)와 프로(Pro) 버전 사용자만 사용할 수 있다. 소라 터보는 소라닷컴을 통해 제공되는 독립형 서비스로, 텍스트, 이미지, 동영상을 입력 소스로 선택한 후, 최대 1080p의 해상도로 최대 20초 길이의 동영상을 생성할 수 있다.
이미 챗GPT 유료 버전인 플러스나 프로 모델을 구독하고 있다면 추가 비용 없이 소라 터보를 사용할 수 있다. 하지만 구독 모델에 따라 사용 제한이 있다. 한 달에 20달러를 지불하는 챗GPT 플러스 사용자는 480p 해상도로 한 달에 최대 50개의 비디오 또는 720p 행상도로 이 보다 적은 비디오를 생성할 수 있다. 한 달 사용료가 200달러인 챗GPT 프로 사용자는 최대 1080p 해상도의 비디오를 10배 더 많이 생성할 수 있다. 아울러 다양한 유형의 사용자를 위한 맞춤형 가격제가 내년 초에 선보일 예정이다.
다만, 출시 시점을 기준으로 18세 이상의 성인만 사용할 수 있고, 영국, 스위스, 유럽 연합을 제외한 국가나 지역에서만 사용 가능하다. 또한, 딥페이크 등의 악의적이고 유해한 영상의 생성과 확산을 차단하기 위해 고급 감지 도구를 사용한 필터링과 모니터링을 실시한다. 아울러 유사성/얼굴(likeness/face-uploads) 사용 제한, 허용되지 않는 콘텐츠 차단 등의 안전장치를 마련했다. 이를 위해 내부와 외부의 레트림을 통해 위험 요소 제거와 안전한 서비스를 위한 평가와 개선 작업을 진행했다고 오픈AI는 설명했다.
오픈AI는 “유사성은 현재 초기 테스터 소수에게만 파일럿 기능으로 제공된다. 유사성과 딥페이크의 도용에 대한 우려를 해소하기 위해, 우리는 사람들이 등장하는 업로드에 대해 특히 엄격한 검토 기준을 설정했으며, 누드가 포함된 콘텐츠는 계속 차단하고 있다. 이 기능을 사용할 수 있는 사용자는 허용되는 것과 허용되지 않는 것을 포함하여 정책에 대한 제품 내 알림도 볼 수 있다. 우리는 오용 패턴을 적극적으로 모니터링하고, 발견되면 콘텐츠를 제거하고, 적절한 조치를 취하고, 이러한 초기 학습을 활용하여 안전에 대한 접근 방식을 반복한다”라고 밝혔다.
이번에 출시한 소라 터보는 사용자가 쉽고 빠르게 동영상을 제작할 수 있도록 새로운 인터페이스를 개발했다. 스토리 도구 형태로 된 인터페이스를 통해 각각의 프레임에 대한 입력을 사용자가 지정할 수 있도록 한 것이다. 이를 활용하면 동영상 제작이나 편집에 대한 지식이나 경험이 없는 사람도, 텍스트 입력으로 완전히 새로운 비디오를 만들거나, 기존의 이미지나 동영상을 가져와 리믹스(Remix), 블렌딩(Blending), 확장(Extending)된 비디오를 제작할 수 있다.
화면 비율도 와이드, 수직, 정사각형 중에서 선택해, 상상하는 장면을 비디오 제작할 수 있다. 동영상을 생성하는 AI 모델은 소라 이전에도 다양한 모델이 선보이고 서비스 중이다. 하지만 소라는 단순한 비디오 생성에 머물지 않고, 자유자재로 변형, 확대, 교체, 제거할 수 있는 것이 특징이다. 단순히 재미삼아 해보는 수준을 넘어, 실제로 생각하는 장면을 비디오로 만들어 활용할 수 있다는 의미다.
이미 생성한 장면에서 텍스트 입력으로 원하는 장면을 변경하는 리믹스(Remix) 기능을 활용하면 머릿속에서 상상하는 장면을 실제로 보면서 현실에 맞게 수정할 수 있다. 예를 들어 “도서관으로 들어가는 큰 문을 열어줘. 문을 프랑스 스타일로 교체해. 도서관을 우주선으로 바꿔줘. 우주선을 제거하고 정글을 추가해줘”라고 입력하면, 텍스트 입력에 따라 생성한 장면을 계속 변경하면서 확장할 수 있다.
동영상 프레임에서 일정 부문만 선택한 후 이를 기반으로 앞뒤로 동영상을 확장하는 리컷(Re-Cut), 동영상에서 가장 마음에 드는 영상을 매끄럽게 반복되는 비디오로 만드는 루프(Loop), 서로 다른 두 개의 동영상 장면을 혼합해 하나의 비디오로 만들어 주는 블렌드(Blend), 필름 누아르(film noir)나 골판지처럼 특별한 스타일이나 질감을 설정할 수 있는 스타일 설정(Style preset)을 지원한다.
[email protected]
Read More from This Article: 오픈AI, 진일보한 동영상 생성형 AI 모델 ‘소라 터보’ 정식 출시
Source: News