미스트랄이 기업 고객의 수요 증가에 맞춰 지역 언어와 방언을 이해하는 대규모 언어 모델(LLM)을 제공하는 데 주력하고 있다고 밝혔다. 블로그 게시물에서 미스트랄은 “AI를 보편화하려면 모든 문화와 언어를 다뤄야 한다. AI가 전 세계적으로 확산됨에 따라 많은 고객들이 단순히 유창한 수준을 넘어 지역 방언에 능통한 모델을 강하게 요청하고 있다”라고 설명했다.
미스트랄은 더 큰 규모의 LLM이 일반적으로 여러 언어에 능숙하지만, 특정 언어의 단어 사용을 이해하지 못하거나 문화적 배경에 대한 이해가 부족해 지역 언어의 사용 사례를 처리하는 데 실패하는 경우가 많다고 언급했다.
주요 사용 사례에는 대화형 지원, 특정 분야의 전문 지식, 문화적 콘텐츠 제작 등이 있을 수 있다. 미스트랄은 지역 언어로 맞춤 학습된 LLM이 이런 사용 사례를 처리하는 데 도움이 될 수 있다고 보고 있다. 맞춤 학습을 통해 LLM이 정확성과 진정성을 제공하기 위한 고유한 복잡성과 통찰력을 파악할 수 있기 때문이다.
미스트랄의 첫 번째 맞춤형 지역 언어 LLM
미스트랄이 신규 출시한 모델인 ‘사바’는 240억 개의 매개변수를 가진 맞춤형 지역 언어 중심 모델이다. 미스트랄은 사바가 중동과 남아시아 전역에서 “세심하게 선별된 데이터셋”으로 학습됐다고 밝혔다.
특히 사바는 아랍어와 타밀어와 같은 많은 인도 계열 언어, 특히 남인도 계열 언어의 사용 사례를 지원할 수 있다. 미스트랄은 다국어를 지원한다는 장점으로 사바의 채택률이 높아질 것으로 기대하고 있다.
미스트랄은 사바가 크기 면에서 자사의 미스트랄 스몰3(Mistral Small 3) 모델과 유사하며, 대부분의 LLM보다 사용 비용이 상대적으로 저렴하다고 주장했다. 또한 사바가 상대적으로 가벼운 모델이기 때문에 단일 GPU 시스템에 배포할 수 있어 다양한 사용 사례에 더 적응력이 높다고 설명했다. 미스트랄은 사바가 매우 특정한 지역 적응을 훈련하는 강력한 기반으로 사용할 수 있다고 덧붙였다.
사바의 LLM 배포 옵션에는 API와 온프레미스 로컬 배포가 있다. 미스트랄은 로컬 배포 옵션이 금융, 은행, 의료와 같이 규제가 더 엄격한 산업에서 유용할 수 있다고 언급했다. 아랍어 MMLU, 아랍어 TyDiQAGoldP, 아랍어 알고파(Alghafa), 아랍어 헬라스웨그(Hellaswag)와 같은 벤치마크 테스트에서 사바는 미스트랄 스몰3, 큐웬(Qwen) 2.5 32B, 라마(Llama) 3.1 70B, G42의 자이스 70B보다 높은 성능을 보였다.
미스트랄에 따르면 사바는 또한 아랍어 MMLU 인스트럭트, 아랍어 MT-Bench Dev, 아랍어 중심 FLORES-101과 같은 벤치마킹 테스트에서 라마 3.3 70B 인스트럭트, 코히어(Cohere) 커맨드-r-08-2024 32B, 자이스 70B 챗, GPT-4o-mini보다 성능이 우수했다.
미스트랄이 지역 언어 LLM에 주력하는 이유는?
분석가들은 미스트랄이 지역 언어 LLM 출시에 집중하는 전략이 회사의 전체 수익을 확대하는 데 도움이 될 수 있다고 말했다.
포레스터의 수석 분석가인 찰리 다이는 “사바와 같은 지역 LLM에 대한 시장이 성장하고 있다. 특히 문화적, 언어적으로 맞춤화된 솔루션이 필요한 기업들을 위한 시장이다. 금융, 의료, 정부와 같은 분야에서 현지화된 AI에의 수요로 인해 시장이 상당할 수 있으며, 기업들이 고객 참여와 운영 효율성을 향상시키려 함에 따라 잠재적으로 수십억 달러에 이를 수 있다”라고 분석했다.
다이는 “지역 시장에 맞춰 미세 조정된 LLM은 특정 언어적, 문화적, 규제적 요구를 해결해 로컬 기업을 위한 AI 솔루션을 더욱 관련성 있고 효과적으로 만든다. 이러한 차별화는 서비스가 부족한 시장에서 채택을 촉진하고 수익 성장을 도모할 수 있다”라고 말했다.
미스트랄은 지역 언어 LLM 외에도 기업에 심층적이고 독점적인 맥락를 제공하기 위해 전략적 고객용 모델 학습을 시작했다고 밝혔다. 회사는 블로그 게시물에서 “이런 (맞춤형) 모델은 각 고객에게 독점적이고 비공개로 유지된다”라고 설명했다.
그러나 분석가들은 미스트랄이 확장을 위해 지역 언어 모델 전략을 사용하려는 유일한 모델 개발사는 아니라고 말했다.
이에 따르면 중국의 BAAI는 2022년에 아랍어 언어 모델(ALM)을 오픈소스로 공개했다. 이어 2023년에는 알리바바 클라우드의 DAMO가 아랍어, 스페인어, 독일어 등 11개 언어를 포함하는 폴리LM(PolyLM)을 오픈소스로 공개했다.
에버레스트 그룹의 실무 이사인 수실 메논은 “중동에서 언어별 LLM이 성장하고 있음을 관찰해 왔다. G42와 같은 스타트업이 최초의 아랍어 LLM 중 하나를 출시한 바 있다”라고 언급했다.
메논은 사우디 데이터 및 AI 당국(SDAIA)이 지난해 IBM 클라우드에서 ALLaM이라는 LLM을 출시한 것과 같이 중동의 지역 공공 부문 조직들이 아랍어 LLM을 만들려고 시도해 왔다고 언급하면서, 사바의 존재가 이 지역의 모델 제공업체들 간의 경쟁을 더욱 촉진할 수 있다고 말했다.
미스트랄은 남아시아, 특히 인도에서도 경쟁에 직면해 있다. 이곳에서는 여러 스타트업이 라마 2를 사용해 힌디어용 오픈하티(OpenHathi-Hi-v0.1), 타밀 라마(Tamil Llama), 텔레구 라마(Telegu Llama), 오디아(odia_llama2_7B_v1), 베트남어용 비나라마(VinaLLaMA) 같은 지역 언어 모델을 만들었다.
그러나 다이는 미스트랄의 모델 발표가 시작 단계라고 언급했다. 그는 “고품질의 현지화된 솔루션을 제공하는 모델 개발사만이 서비스가 부족한 지역에서 충성도와 시장 점유율을 얻을 것”이라고 설명하면서, 모델을 중심으로 한 지역 비즈니스 운영도 성공의 또 다른 핵심이라고 덧붙였다.
[email protected]
Read More from This Article: 미스트랄, 아랍·중동 언어 모델 ‘사바’ 출시··· 전문가들 “지역 LLM 시장 성장세”
Source: News