학술지 네이처를 통해 공개된 MS 뮤즈는 ‘WHAM(World and Human Action Model)’을 핵심 기술로 활용한다. MS가 직접 개발한 WHAM은 게임의 시각적 요소와 동작을 모두 만들어낼 수 있다. 개발자는 이를 통해 게임 속 캐릭터와 배경, 효과를 생성할 수 있고, 플레이어가 컨트롤러나 키보드를 조작할 때 캐릭터가 보여줄 반응과 움직임까지 설계할 수 있다.
이번 모델은 MS 리서치 산하에 있는 게임 인텔리전스팀 그리고 티처블 AI 익스피리언스(Tai X) 팀이 X박스 게임 스튜디오에 속한 닌자 시어리와 협력하여 개발했다. MS 연구진은 2022년 말 챗GPT 출시 이후 영감을 얻어 AI 환경에 맞는 게임 기술 연구에 착수했다고 전했다. 특히 텍스트 기반 생성 모델의 성공을 게임 분야에 적용하는 방안을 연구했으며, 그 결과물이 뮤즈라고 설명했다.
MS는 “게임 개발자가 뮤즈로새로운 게임 개발 초기 단계부터 아이디어를 신속하게 테스트하고 검증할 수 있을 것”이라며 “AI 기반의 새로운 게임 경험 창출이 가능해져 게임 디자인의 혁신을 이끌 수 있을 것”으로 기대했다.
뮤즈는 X박스 게임 중 하나인 ‘블리딩 엣지’에서 실제 사용자들이 게임을 진행하며 만들어낸 데이터를 기반으로 학습됐다. 10억 개 이상의 이미지와 컨트롤러 동작 데이터가 사용되었는데, 이는 게임을 7년 동안 쉬지 않고 플레이했을 때 얻을 수 있는 분량에 해당한다. 또한 이 모델은 300×180 픽셀 해상도의 비주얼을 생성할 수 있으며, H100 GPU 클러스터를 활용한 대규모 학습을 통해 개발되었다.
MS에 따르면, 뮤즈로 만든 게임 결과물은 일관성, 다양성, 지속성을 갖출 수 있다. 가령 MS의 뮤즈 AI는 게임의 물리 법칙을 지키면서도 적을 피하거나 전투를 하는 방식, 목적지까지 가는 경로 등 다양한 상황을 만들어낼 수 있는 것으로 나타났다. 특히 개발자가 캐릭터의 점프력이나 이동 속도 같은 요소를 수정하면, AI가 이를 이해하고 게임의 모든 장면에 자연스럽게 반영하는 것이 특징이다.
MS는 뮤즈의 모델 가중치와 샘플 데이터를 오픈소스로 공개하고, WHAM 데몬스트레이터(Demonstrator)의 실행 파일도 제공할 예정이다. WHAM 데몬스트레이터는 WHAM 모델과 상호작용할 수 있는 시각적 인터페이스를 제공하는 개념 프로토타입으로, 다양한 방식으로 모델을 프롬프트할 수 있다. 개발자는 MS의 개발 플랫폼 애저(Azure) AI 파운드리에서 모델의 가중치, 샘플 데이터, WHAM 데몬스트레이터를 활용하여 학습하고 실험해 볼 수 있다.
[email protected]
Read More from This Article: MS, 게임 개발용 AI 모델 ‘뮤즈’ 공개··· 7년치 게임 데이터로 학습
Source: News