소규모 언어 모델(SLM)은 IT 리더가 기존 범용 LLM보다 적은 운영 비용으로 특정 비즈니스에 특화된 AI 애플리케이션을 개발할 기회를 제공하고 있다.
가트너(Gartner)는 최근 보고서에서, 2027년까지 특정 맥락에 맞게 설계된 소규모 모델의 사용량이 대규모 모델보다 최소 3배 이상 많아질 것으로 예상했다. 또한 가트너는 LLM이 특정 비즈니스 맥락이 요구되는 업무에서 응답 정확도가 떨어진다는 점도 지적했다.
해당 보고서 작성에 참여한 가트너 분석가 수밋 아가왈은 “비즈니스 워크플로우에서 다양한 작업과 더 높은 정확성이 요구되면서 특정 기능이나 도메인 데이터에 맞게 미세 조정된 특화 모델로의 전환이 가속화되고 있다. 소규모, 업무별 모델은 더 빠른 응답을 제공하고, 연산 자원 소모도 적어 운영 및 유지보수 비용을 줄일 수 있다”라고 분석했다.
인도 위프로(Wipro)의 기술 담당자인 매게쉬 카스투리 박사는 LLM이 SLM보다 오류가 더 많다고 생각하지는 않지만, LLM의 환각(hallucination) 현상은 우려할 만하다고 언급했다. 카스투리는 “은행이나 에너지 등 특정 산업 분야의 솔루션에는 SLM이 민첩성, 비용 효율성, 빠른 프로토타입 및 개발, 조직 데이터의 보안과 프라이버시 측면에서 더 적절할 수 있다”라고 설명했다.
오픈AI(OpenAI), 제미나이(Gemini), 클로드(Claude), 그록(Grok) 등 기능이 다양한 범용 LLM이 주목받고 있지만, 메타(Meta)의 라마 3.1(Llama 3.1), 마이크로소프트(Microsoft)의 파이(Phi), 구글(Google)의 젬마(Gemma) SLM 등 소규모 모델도 특정 업무를 위한 비용 효율적 대안으로 점점 더 많이 등장하고 있다.
예를 들어 구글은 최근 출시한 젬마3 SLM이 엔비디아(Nvidia) GPU 한 대만으로 구동 가능하다고 밝혔다.
SLM에 주목하는 기업들
에이버리 데니슨(Avery Dennison)의 CIO 니콜라스 콜리스토는 SLM에 대한 관심이 높아진 이유 중 하나로 에이전틱 AI(agentic AI)의 부상을 꼽았다.
콜리스토는 “CIO와 CAIO는 생성형 AI와 에이전틱 AI 애플리케이션에 적합한 파운데이션 모델을 선택하기 위해 복잡한 의사 결정 과정을 거쳐야 한다. 단순히 성능 지표만이 아니라, 비용, 보안, 설명 가능성, 확장성, 그리고 가치 실현까지 균형을 맞춰야 한다. 업계의 흐름은 대규모 범용 모델에서 소규모 특화 모델로 이동 중이며, 이는 산업별 요구를 더 잘 충족시키는 동시에 리스크와 비용도 줄일 수 있다”라고 진단했다.
가트너는 SLM이 민감한 비즈니스 데이터에 대한 통제력을 강화하는 동시에 특정 영역에서 운영 비용을 낮추고 성능을 개선한다고 주장했다. 고객 서비스 자동화, 시장 동향 분석, 제품 혁신, 감정 분석 등 특정 목적에 맞춘 AI 활용은 프라이버시와 저작권 보호 측면에서도 이점을 제공한다고 가트너는 언급했다.
하코다(Hakkoda)의 최고혁신책임자 패트릭 뷰엘은 “이 주장에 전적으로 동의한다”라며, “방화벽 뒤에서 작동하는 오픈소스 소규모 언어 모델은 보안, 거버넌스, 비용 문제를 상당 부분 해결할 수 있다”라고 설명했다.
구글 파트너이자 전문 버티컬 AI 솔루션을 개발 및 배포하는 인텔라젠(Intelagen)의 설립자이자 전 CIO인 톰 리처는 가트너 보고서가 현장의 흐름과 일치한다고 말했다.
그는 “범용 LLM도 역할이 분명하지만, 특정 비즈니스 문제에는 더 작고 미세 조정된 모델이 특히 규제가 엄격한 산업에서 효율성과 성과 모두에서 더 나은 결과를 제공한다”라고 설명했다. 이어 그는 “SLM으로의 전환을 이끄는 주요 요인은 LLM의 환각 리스크다. 범용 LLM이 특정하거나 복잡한 비즈니스 맥락에서 부정확하거나 말이 안 되는 정보를 생성하는 경향이 걸림돌이 되고 있다”라고 말했다.
리처는 “정확성과 신뢰가 중요한 기업용 애플리케이션에서는 이런 리스크 때문에 범용 LLM에만 의존하기가 현실적으로 어렵다. 보다 특화된 접근이 더 신중하고 신뢰할 수 있다. 특히 의료 분야처럼 환각 문제가 치명적일 수 있는 환경에서는 더 그렇다”라고 덧붙였다.
계속 변화하는 미래
지난해 가을 마이크로소프트는 파이 SLM 포트폴리오를 활용한 적응형 AI 모델을 발표했다. 이를 통해 산업별 역량을 확장하고, 기업이 맞춤형 요구 사항을 더 정확하고 효과적으로 해결할 수 있도록 지원하겠다고 밝혔다. 또한 마이크로소프트는 바이엘(Bayer), 로크웰 오토메이션(Rockwell Automation), 지멘스 디지털 인더스트리 소프트웨어(Siemens Digital Industries Software) 등과 협력해, 산업별 데이터로 사전 학습된 미세 조정 모델을 개발 중이라고 전했다.
마이크로소프트 CEO 사티아 나델라는 최근 도쿄에서 열린 시연회에서 한 대형 항공사가 개발한 SLM을 높이 평가했다. 그는 “마이크로소프트의 파이 SLM 덕분에 일본항공 승무원들이 서류 작업에 쓰는 시간이 줄고, 승객과 더 많은 시간을 보낼 수 있게 됐다”라고 링크드인에 게시했다.
마이크로소프트는 오르카(Orca)와 오르카 2(Orca 2) 모델이 SLM의 후속 학습에 합성 데이터를 활용해 특화된 작업에서 더 나은 성능을 발휘할 수 있다고 밝혔다.
구글의 젬마 3는 제미나이 2.0을 기반으로 한 경량 오픈 모델 모음으로, 휴대폰, 노트북, 워크스테이션 등 다양한 기기에서 빠르게 실행되도록 설계됐다. 구글은 “젬마 SLM 모델은 광범위한 일반화 대신 비즈니스 영역별 인텔리전스를 활용하며, 헬스케어, 법률, 금융 등 산업에 맞게 조정되어 LLM보다 더 뛰어난 성과를 보인다”라고 공식 입장을 전했다.
가트너는 기업이 검색 증강 생성(RAG)이나 기타 미세 조정 기술을 활용해 LLM을 특정 업무에 맞게 커스터마이즈하고 특화 모델을 만들 수 있다고 설명했다. 코그니전트(Cognizant) AI 및 분석 글로벌 총괄 나빈 샤르마는 2년 내 SLM이 LLM을 앞지를 것이라는 가트너의 전망이 거버넌스 및 규제 준수를 강화하면서 AI를 더욱 업무별로 특화하려는 업계 전반의 흐름을 보여준다고 언급했다.
샤르마는 “조직이 AI를 더 효과적으로 확장하려 할수록, 소규모이면서 업무별로 특화된 모델이 더 빠르고 효율적이며 실제 비즈니스 업무에 통합하기도 쉽다는 점이 입증되고 있다. AI 모델은 작을수록 더 똑똑할 수 있지만, 미래는 양자택일의 문제가 아니다. 대규모 모델이 기반을 제공하고, 소규모 특화 모델이 구체적 비즈니스 요구를 충족시키는 조합이 될 가능성이 높다”라고 진단했다.
또한 샤르마는 SLM 개발이 활발해진다고 해서 대규모 파운데이션 모델이 사라지는 것은 아니라고 말했다. 그는 “오히려 그 역할이 더 전략적으로 바뀌고 있다. 이제 대규모 모델은 최종 산출물이 아니라, 특정 용도에 맞게 팀이 구축·적응·미세 조정할 수 있는 핵심 역량을 제공하는 시작점이 되고 있다. 지금까지 대규모 모델을 범용 도구로 썼다면, 앞으로는 효율적인 AI 시스템의 핵심 인프라로 활용해 비즈니스에 더 잘 기여하도록 할 가능성이 높다”라고 설명했다.
[email protected]
Read More from This Article: ‘비용 낮추고 활용도 높인다’··· IT 리더가 소규모 언어 모델에 주목하는 이유
Source: News