마이크로소프트(Microsoft, 이하 MS)가 윈도우11(Windows 11)을 생성형 AI 중심 운영체제로 전환하기 위한 기술 기반을 구축하고 있다.
MS는 24일 인터넷 연결 없이도 윈도우에서 생성형 AI 에이전트를 실행할 수 있는 핵심 AI 기술을 발표했다. 윈도우 11에 내장되는 생성형 AI 모델인 ‘뮤’다.
MS는 블로그를 통해 소규모 언어모델 뮤가 윈도우 운영체제 내에서 자연어 쿼리에 응답하도록 설계됐다고 밝혔다. 윈도우 응용과학 부문 부사장이자 수석 엔지니어인 비벡 프라디프는 뮤가 코파일럿 PC에 탑재된 신경망처리장치(NPU)를 활용한다고 설명했다.
현재 인텔, AMD, 퀄컴 등 3곳이 윈도우11을 사전 탑재한 코파일럿 PC에 NPU를 공급하고 있다.
MS에 따르면 뮤는 이미 코파일럿+ PC 사용자에게 제공되는 윈도우11 프리뷰 버전에서 설정 메뉴 쿼리를 처리하는 에이전트를 구동하고 있다. 해당 기능은 6월 13일 배포된 프리뷰 버전(빌드 26200.5651)에 적용됐다.
프라디프는 “이 모델은 쿼리의 맥락을 더 잘 이해하고 해석하며, 로컬 환경에서 고성능으로 효율적으로 작동하도록 설계됐다”라고 말했다.
프라디프는 “이 모델은 쿼리의 맥락을 더 잘 이해하며, 로컬 환경에서도 고성능으로 효율적으로 작동하도록 설계됐다”고 밝혔다.
또한 MS는 윈도우11과 마이크로소프트365(M365)의 핵심 기능에 생성형 AI를 빠르게 통합하고 있다. 지난달에는 개발자가 소프트웨어 애플리케이션에 AI 기능을 쉽게 적용할 수 있도록 지원하는 새로운 개발자 스택 ‘윈도우 ML 2.0’을 공개했다. 이와 함께 M365의 각 기능과 애플리케이션에 특화된 전용 AI 모델도 개발 중이다.
3억 3,000만 개의 파라미터를 가진 뮤 모델은 AI 연산 사이클을 줄여 윈도우11 PC에서 로컬로 실행될 수 있도록 설계됐다. 하드웨어와 배터리 성능에 제한이 있는 노트북 환경에서는 일반적으로 AI 처리를 위해 클라우드 서비스를 필요로 한다.
프라디프는 “이를 위해 모델 아키텍처와 파라미터 구조를 하드웨어의 병렬 처리 성능과 메모리 한계에 맞게 조정했다”라고 설명했다.
MS에 따르면 뮤 모델은 쿼리를 더 잘 이해해 고품질의 응답을 생성할 수 있다. MS는 시스템 설정과 관련해 모호한 사용자 쿼리에도 응답할 수 있도록 설정 메뉴 전용 커스텀 뮤 모델을 별도로 튜닝했다. 예를 들어 주 모니터인지 보조 모니터인지 명시하지 않은 상태에서도 밝기를 조절해달라는 쿼리를 처리할 수 있다.
뮤는 인코더-디코더 구조를 기반으로 대규모 쿼리를 압축된 정보 표현으로 변환한 후, 해당 표현을 바탕으로 응답을 생성한다. 이는 모든 텍스트를 기반으로 응답을 생성하는 디코더 기반의 대규모 언어 모델(LLM)과는 다르다.
프라디프는 “입력 토큰과 출력 토큰을 분리함으로써 뮤의 단일 인코딩은 연산과 메모리 사용량을 대폭 줄였다”라고 말했다.
MS는 뮤의 인코더–디코더 구조가 디코더 전용 모델 ‘Phi-3.5’보다 훨씬 빠르다고 설명했다. 프라디프는 “비슷하게 튜닝된 ‘Phi-3.5-mini’와 비교했을 때, 뮤는 크기가 10분의 1에 불과하지만 성능은 거의 유사한 수준이었다”라고 분석했다.
이 같은 성능 향상은 디바이스 내에서 실시간 애플리케이션을 구현하는 데 있어 핵심적인 요소다. 프라디프는 “윈도우의 방대한 설정 항목을 관리하는 일 자체가 쉽지 않았으며, 특히 기능 간 중복을 해결하는 것이 과제였다”라고 설명했다.
뮤 모델의 응답 속도는 500밀리초 이하였다. 프라디프는 “수백 개에 달하는 설정 항목을 빠르고 신뢰성 있게 처리할 수 있는 에이전트 구현 목표에 부합했다”라고 말했다.
한편 MS는 오픈AI의 챗GPT와 이미지·영상·텍스트를 생성할 수 있는 자사 최신 ‘Phi 4’ 모델 등 다양한 생성형 AI 기술을 보유하고 있다.
dl-ciokorea@foundryco.com
Read More from This Article: 마이크로소프트, 윈도우11 내장 생성형 AI 모델 ‘뮤’ 공개
Source: News