과학기술정보통신부(이하 과기정통부)는 지난 15일 ‘독자 AI 파운데이션 모델’ 프로젝트 1차 단계 평가 결과를 발표하고, LG AI 연구원·SK텔레콤·업스테이지 등 3개 정예팀을 2차 단계 진출 대상으로 선정했다고 밝혔다.
이번 프로젝트에는 네이버클라우드, 업스테이지, SK텔레콤, NC AI, LG AI 연구원 등 5개 정예팀이 참여했다. 과기정통부는 5개 팀이 개발한 AI 파운데이션 모델이 모두 미국 비영리 AI 연구기관 에폭 AI(Epoch AI)의 ‘주목할 만한 AI 모델’에 등재되는 성과를 거뒀다고 밝혔다.
그러나 정부의 판단 기준은 단순 성능을 넘어 ‘독자성’에 맞춰졌다. 과기정통부는 앞서 독자 AI 파운데이션 모델이 “해외 모델을 미세 조정한 파생형이 아닌, 설계부터 사전학습까지 전 과정을 자체 수행한 국산 모델”이어야 한다고 규정한 바 있다. 이는 AI 기술 주권 확보와 통제 역량을 강화하기 위한 조치다.
해당 기준에 따라 분석한 결과, 네이버클라우드의 AI 모델은 독자성 요건을 충족하지 못해 2차 단계 진출 대상에서 제외됐다. 옴니모달 AI 개발 과정에서 현재 오픈소스로 활용 가능한 중국 알리바바의 큐웬(Qwen) 모델의 기술을 사용한 것이 평가에 영향을 미친 것으로 알려졌다. 네이버 클라우드가 해당 기술의 비중이 낮다는 내용의 소명서를 제출했지만, 정부는 이미 평가가 진행되는 단계에서 제출됐기에 결과에는 반영되지 않았다고 밝혔다.
앞서 업스테이지도 자체 개발한 대규모 언어 모델 ‘솔라-100B(Solar-100B)’를 두고 중국 모델을 기반으로 한 미세 조정 모델이 아니냐는 의혹이 제기된 바 있다. 이에 업스테이지는 해당 주장에 대해 즉각 반박하고, 기술적 구조와 학습 과정 전반을 공개하는 설명회를 진행하며 사실이 아님을 해명했다. 이를 통해 모델의 독자적 설계 및 학습 과정이 확인되면서 논란은 일단락됐다.
독자성 판단 외에도 과기정통부는 AI 모델의 기술적 완성도와 활용 가능성을 종합적으로 평가했다. 1차 단계평가는 ▲벤치마크 평가(40점) ▲전문가 평가(35점) ▲사용자 평가(25점)로 구성됐으며, 성능 수치나 모델 규모를 넘어 설계 구조와 학습 과정, 실제 운용 환경에서의 효율성까지 함께 검토했다. 먼저 벤치마크 평가는 수학·지식·추론·지시 수행 등 기본 추론 능력과 함께 장문 이해, 신뢰성·안전성 지표를 포함해 국내외 주요 AI 모델과의 상대적 성능을 비교하는 방식으로 진행됐다.
전문가 평가는 각 팀이 제출한 기술 문서와 학습 로그를 바탕으로 모델 아키텍처 구성과 사전학습 전략, 데이터 활용 방식을 중심으로 이뤄졌으며, 사용자 평가는 실제 사용 환경에서의 응답 일관성, 추론 비용 효율성, 산업 적용 가능성 등을 살펴보는 데 초점을 맞췄다.
이 같은 기준으로 진행한 종합 평가 결과, NC AI 컨소시엄은 2차 단계 진출 명단에 이름을 올리지 못했다. 게임, 제조, 국방 등 특정 산업에 최적화된 ‘버티컬 AI 모델’ 구현 성과를 내세웠지만, 정부가 지향하는 모델 관점에서는 평가 기준을 통과하지 못한 것으로 나타났다.
평가에서는 LG AI 연구원이 자체 개발한 ‘K-엑사원’이 종합 벤치마크(33.6점), 전문가(31.6점), 사용자 평가(25점)에서 모두 최고점을 기록했다. 업스테이지와 SK텔레콤 역시 대규모 모델 개발 역량과 산업 적용 가능성을 인정받아 2차 단계 진출을 확정했다.
과기정통부는 향후 지속 가능한 AI 생태계 구축을 위해 정예팀 1곳을 추가로 선정해, 2026년 상반기까지 총 4개 팀 경쟁 체제를 운영할 계획이라고 전했다. 최종 선정은 2곳이며, 올해 말까지 평가가 진행될 예정이다. 다만 네이버클라우드와 NC AI 컨소시엄은 추가 선발 재도전을 고려하지 않겠다는 입장을 밝혔다.
yuseong.kim@foundryco.com
Read More from This Article: ‘국가대표 AI’ 1차 평가서 네이버·NC 탈락···“재도전 계획 없다”
Source: News

