샤오미는 MIT 라이선스 기반으로 미모(MiMo)-V2.5와 미모-V2.5-Pro를 공개하고 오픈소스 형태로 27일 배포했다. 개발자는 해당 모델을 활용해 코딩과 업무 자동화 등 장시간 작업을 수행하는 AI 에이전트를 보다 낮은 비용으로 구축할 수 있을 것으로 보인다.
두 모델은 모두 100만 토큰 규모의 컨텍스트 윈도를 지원한다. 미모-V2.5-Pro는 복잡한 에이전트 및 코딩 작업에 최적화됐으며, 미모-V2.5는 텍스트, 이미지, 영상, 오디오를 모두 처리할 수 있는 네이티브 옴니모달 모델이다.
이번 공개는 에이전트형 AI 워크로드가 기업 AI 예산에 새로운 부담으로 작용하는 상황에서 이뤄졌다. 해당 시스템은 작업 계획 수립, 도구 호출, 코드 작성, 오류 복구 과정에서 대량의 토큰을 소모하기 때문에, 개발자들에게 비용 관리와 배포 통제의 중요성이 더욱 커지고 있다.
샤오미는 MIT 라이선스를 통해 추가 승인 없이 상용 배포, 지속적인 학습, 파인튜닝이 가능하도록 했다고 밝혔다. 글로벌 시장조사업체 카던스 인터내셔널(Kadence International)의 수석 부사장 툴리카 실은 “기업이 제한 없이 모델을 수정하고 배포하며 상용화할 수 있다는 점에서 현재 AI 시장에서는 보기 드문 구조”라고 설명했다.
성능 측면에서도 경쟁력을 강조했다. 샤오미는 블로그를 통해 “ClawEval 벤치마크에서 미모-V2.5-Pro는 약 7만 토큰만 사용해 64%의 통과율을 기록했다”며 “이는 유사한 성능 수준의 클로드 오퍼스 4.6, 제미나이 3.1 프로, GPT-5.4 대비 약 40~60% 적은 토큰 사용량”이라고 밝혔다.
두 모델은 MoE 구조를 적용해 연산 비용을 효율적으로 관리한다. 3,100억 파라미터 규모의 미모-V2.5는 요청당 150억 파라미터만 활성화하며, 1조 200억 파라미터 규모의 Pro 버전은 420억 파라미터만 사용한다. 또한 Pro 모델의 하이브리드 어텐션 설계는 장문 컨텍스트 작업 시 KV 캐시 저장량을 최대 7배 가까이 줄일 수 있다는 설명이다.
샤오미는 장기 작업 성능을 입증하기 위한 사례도 공개했다. 미모-V2.5-Pro는 러스트 기반 SysY 컴파일러를 4.3시간 동안 672회의 도구 호출을 통해 완성했으며, 233개의 숨겨진 테스트를 모두 통과했다. 또한 11.5시간 동안 1,868회의 도구 호출을 수행해 8,192줄 규모의 데스크톱 영상 편집기를 생성했다고 밝혔다.
미모, 기업 AI 선택지 될까
샤오미의 미모-V2.5 모델이 에이전트형 코딩 및 자동화 워크로드에서 폐쇄형 프론티어 모델을 넘어 기업 개발자들 사이에서 채택될 수 있을지는 성능, 비용, 리스크에 대한 평가 방식에 달려 있다.
시장조사업체 옴디아의 수석 애널리스트 리안 지에 수는 “샤오미의 미모-V2.5와 파생 모델을 평가할 때 기업 개발자들은 총소유비용(TCO)을 중심으로 봐야 한다”며 “TCO는 토큰 효율성, 작업 성공당 비용, 그리고 독점 모델에 수반되는 라이선스 비용이 없다는 점으로 구성된다”고 설명했다. 이어 “폐쇄형 프론티어 모델은 일반적인 작업이나 가장 까다로운 극단적 사례에서는 여전히 우위를 점할 수 있지만, 대량 처리 중심의 에이전트 작업에서는 오픈 가중치 모델이 더 뛰어난 성과를 보인다”고 덧붙였다.
컨설팅 기업 파리크 컨설팅(Pareekh Consulting)의 CEO 파리크 자인은 “기업은 미모-V2.5를 클로드나 GPT의 대체재로 보기보다, 고토큰 워크로드를 위한 비용 효율적인 에이전트 모델로 평가해야 한다”고 밝혔다. 그는 “핵심 벤치마크 지표는 단순한 정확도가 아니라 ‘작업 성공당 토큰 수’”라며 “프론티어 모델은 복잡한 코딩 벤치마크에서 높은 성공률을 보이지만, 그만큼 막대한 추론 비용이 수반된다”고 설명했다. 이어 “미모-V2.5는 토큰 효율성을 중심으로 설계돼 훨씬 적은 입력·출력 토큰으로 유사한 결과를 도출한다”고 강조했다.
자인은 이러한 특성이 반복적인 코딩, 품질검증(QA), 마이그레이션, 문서화, 테스트, 자동화 작업에서 미모와 같은 모델을 ‘경제적 핵심 엔진’으로 활용할 수 있게 한다고 분석했다. 다만 가장 난도가 높은 작업에서는 여전히 폐쇄형 프론티어 모델이 품질 기준의 상한선을 유지할 것이라고 덧붙였다.
가트너의 수석 책임 애널리스트 애시시 배너지는 “미모와 같은 모델은 장기 작업 에이전트 분야에서 기업 AI 경제 구조를 실질적으로 변화시킬 수 있다”고 평가했다. 그는 “작업 규모가 수백만 토큰으로 확대되면 종량제 기반의 독점 API는 편의성이 아니라 반복 비용 부담으로 작용하게 된다”며 “반면 미모는 MIT 라이선스, 오픈 가중치, 100만 토큰 컨텍스트, 비교적 낮은 가격을 기반으로 프라이빗 클라우드나 자체 구축 환경에서도 전략적으로 충분한 경쟁력을 갖는다”고 설명했다.
다만 이는 기업들이 독점 API를 완전히 포기한다는 의미는 아니다. 배너지는 “기업들은 높은 정확도가 요구되거나 운영 부담을 최소화해야 하는 경우에는 계속해서 독점 API를 활용할 것”이라며 “대규모로 반복 가능한 에이전트 워크플로는 비용 예측 가능성, 데이터 통제, 커스터마이징이 중요한 오픈 모델로 이동하게 될 것”이라고 내다봤다. 이어 “결국 장기·대규모 에이전트형 AI 시장은 하이브리드 구조로 발전하며, 미모와 같은 오픈 모델이 API 의존도를 낮추는 역할을 하게 될 것”이라고 덧붙였다.
한편 수 애널리스트는 “중국에서 개발된 모델이라는 점이 규제가 엄격한 서구권 기업에서는 우려 요소로 작용할 수 있어 도입 과정에서 장애물이 될 가능성도 있다”라고 지적했다.
dl-ciokorea@foundryco.com
Read More from This Article: 샤오미, MIT 라이선스 ‘미모 V2.5’ 공개···장시간 실행 AI 에이전트 시장 겨냥
Source: News

