Skip to content
Tiatra, LLCTiatra, LLC
Tiatra, LLC
Information Technology Solutions for Washington, DC Government Agencies
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact
 
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact

미스트랄, 아랍·중동 언어 모델 ‘사바’ 출시··· 전문가들 “지역 LLM 시장 성장세”

미스트랄이 기업 고객의 수요 증가에 맞춰 지역 언어와 방언을 이해하는 대규모 언어 모델(LLM)을 제공하는 데 주력하고 있다고 밝혔다. 블로그 게시물에서 미스트랄은 “AI를 보편화하려면 모든 문화와 언어를 다뤄야 한다. AI가 전 세계적으로 확산됨에 따라 많은 고객들이 단순히 유창한 수준을 넘어 지역 방언에 능통한 모델을 강하게 요청하고 있다”라고 설명했다.

미스트랄은 더 큰 규모의 LLM이 일반적으로 여러 언어에 능숙하지만, 특정 언어의 단어 사용을 이해하지 못하거나 문화적 배경에 대한 이해가 부족해 지역 언어의 사용 사례를 처리하는 데 실패하는 경우가 많다고 언급했다.

주요 사용 사례에는 대화형 지원, 특정 분야의 전문 지식, 문화적 콘텐츠 제작 등이 있을 수 있다. 미스트랄은 지역 언어로 맞춤 학습된 LLM이 이런 사용 사례를 처리하는 데 도움이 될 수 있다고 보고 있다. 맞춤 학습을 통해 LLM이 정확성과 진정성을 제공하기 위한 고유한 복잡성과 통찰력을 파악할 수 있기 때문이다.

미스트랄의 첫 번째 맞춤형 지역 언어 LLM

미스트랄이 신규 출시한 모델인 ‘사바’는 240억 개의 매개변수를 가진 맞춤형 지역 언어 중심 모델이다. 미스트랄은 사바가 중동과 남아시아 전역에서 “세심하게 선별된 데이터셋”으로 학습됐다고 밝혔다.

특히 사바는 아랍어와 타밀어와 같은 많은 인도 계열 언어, 특히 남인도 계열 언어의 사용 사례를 지원할 수 있다. 미스트랄은 다국어를 지원한다는 장점으로 사바의 채택률이 높아질 것으로 기대하고 있다.

미스트랄은 사바가 크기 면에서 자사의 미스트랄 스몰3(Mistral Small 3) 모델과 유사하며, 대부분의 LLM보다 사용 비용이 상대적으로 저렴하다고 주장했다. 또한 사바가 상대적으로 가벼운 모델이기 때문에 단일 GPU 시스템에 배포할 수 있어 다양한 사용 사례에 더 적응력이 높다고 설명했다. 미스트랄은 사바가 매우 특정한 지역 적응을 훈련하는 강력한 기반으로 사용할 수 있다고 덧붙였다.

사바의 LLM 배포 옵션에는 API와 온프레미스 로컬 배포가 있다. 미스트랄은 로컬 배포 옵션이 금융, 은행, 의료와 같이 규제가 더 엄격한 산업에서 유용할 수 있다고 언급했다. 아랍어 MMLU, 아랍어 TyDiQAGoldP, 아랍어 알고파(Alghafa), 아랍어 헬라스웨그(Hellaswag)와 같은 벤치마크 테스트에서 사바는 미스트랄 스몰3, 큐웬(Qwen) 2.5 32B, 라마(Llama) 3.1 70B, G42의 자이스 70B보다 높은 성능을 보였다.

미스트랄에 따르면 사바는 또한 아랍어 MMLU 인스트럭트, 아랍어 MT-Bench Dev, 아랍어 중심 FLORES-101과 같은 벤치마킹 테스트에서 라마 3.3 70B 인스트럭트, 코히어(Cohere) 커맨드-r-08-2024 32B, 자이스 70B 챗, GPT-4o-mini보다 성능이 우수했다.

미스트랄이 지역 언어 LLM에 주력하는 이유는?

분석가들은 미스트랄이 지역 언어 LLM 출시에 집중하는 전략이 회사의 전체 수익을 확대하는 데 도움이 될 수 있다고 말했다.

포레스터의 수석 분석가인 찰리 다이는 “사바와 같은 지역 LLM에 대한 시장이 성장하고 있다. 특히 문화적, 언어적으로 맞춤화된 솔루션이 필요한 기업들을 위한 시장이다. 금융, 의료, 정부와 같은 분야에서 현지화된 AI에의 수요로 인해 시장이 상당할 수 있으며, 기업들이 고객 참여와 운영 효율성을 향상시키려 함에 따라 잠재적으로 수십억 달러에 이를 수 있다”라고 분석했다.

다이는 “지역 시장에 맞춰 미세 조정된 LLM은 특정 언어적, 문화적, 규제적 요구를 해결해 로컬 기업을 위한 AI 솔루션을 더욱 관련성 있고 효과적으로 만든다. 이러한 차별화는 서비스가 부족한 시장에서 채택을 촉진하고 수익 성장을 도모할 수 있다”라고 말했다.

미스트랄은 지역 언어 LLM 외에도 기업에 심층적이고 독점적인 맥락를 제공하기 위해 전략적 고객용 모델 학습을 시작했다고 밝혔다. 회사는 블로그 게시물에서 “이런 (맞춤형) 모델은 각 고객에게 독점적이고 비공개로 유지된다”라고 설명했다.

그러나 분석가들은 미스트랄이 확장을 위해 지역 언어 모델 전략을 사용하려는 유일한 모델 개발사는 아니라고 말했다.

이에 따르면 중국의 BAAI는 2022년에 아랍어 언어 모델(ALM)을 오픈소스로 공개했다. 이어 2023년에는 알리바바 클라우드의 DAMO가 아랍어, 스페인어, 독일어 등 11개 언어를 포함하는 폴리LM(PolyLM)을 오픈소스로 공개했다.

에버레스트 그룹의 실무 이사인 수실 메논은 “중동에서 언어별 LLM이 성장하고 있음을 관찰해 왔다. G42와 같은 스타트업이 최초의 아랍어 LLM 중 하나를 출시한 바 있다”라고 언급했다.

메논은 사우디 데이터 및 AI 당국(SDAIA)이 지난해 IBM 클라우드에서 ALLaM이라는 LLM을 출시한 것과 같이 중동의 지역 공공 부문 조직들이 아랍어 LLM을 만들려고 시도해 왔다고 언급하면서, 사바의 존재가 이 지역의 모델 제공업체들 간의 경쟁을 더욱 촉진할 수 있다고 말했다.

미스트랄은 남아시아, 특히 인도에서도 경쟁에 직면해 있다. 이곳에서는 여러 스타트업이 라마 2를 사용해 힌디어용 오픈하티(OpenHathi-Hi-v0.1), 타밀 라마(Tamil Llama), 텔레구 라마(Telegu Llama), 오디아(odia_llama2_7B_v1), 베트남어용 비나라마(VinaLLaMA) 같은 지역 언어 모델을 만들었다.

그러나 다이는 미스트랄의 모델 발표가 시작 단계라고 언급했다. 그는 “고품질의 현지화된 솔루션을 제공하는 모델 개발사만이 서비스가 부족한 지역에서 충성도와 시장 점유율을 얻을 것”이라고 설명하면서, 모델을 중심으로 한 지역 비즈니스 운영도 성공의 또 다른 핵심이라고 덧붙였다.
[email protected]


Read More from This Article: 미스트랄, 아랍·중동 언어 모델 ‘사바’ 출시··· 전문가들 “지역 LLM 시장 성장세”
Source: News

Category: NewsFebruary 19, 2025
Tags: art

Post navigation

PreviousPrevious post:SAP, APAC 총괄 회장에 사이먼 데이비스 임명NextNext post:IBM, AI 활용 도시 개발 프로젝트 공개 “전세계적 도시화는 도전이자 기회”

Related posts

Start small, think big: Scaling AI with confidence
May 9, 2025
CDO and CAIO roles might have a built-in expiration date
May 9, 2025
What CIOs can do to convert AI hype into tangible business outcomes
May 9, 2025
IT Procurement Trends Every CIO Should Watch in 2025
May 9, 2025
‘서둘러 짠 코드가 빚으로 돌아올 때’··· 기술 부채 해결 팁 6가지
May 9, 2025
2025 CIO 현황 보고서 발표··· “CIO, 전략적 AI 조율가로 부상”
May 9, 2025
Recent Posts
  • Start small, think big: Scaling AI with confidence
  • CDO and CAIO roles might have a built-in expiration date
  • What CIOs can do to convert AI hype into tangible business outcomes
  • IT Procurement Trends Every CIO Should Watch in 2025
  • ‘서둘러 짠 코드가 빚으로 돌아올 때’··· 기술 부채 해결 팁 6가지
Recent Comments
    Archives
    • May 2025
    • April 2025
    • March 2025
    • February 2025
    • January 2025
    • December 2024
    • November 2024
    • October 2024
    • September 2024
    • August 2024
    • July 2024
    • June 2024
    • May 2024
    • April 2024
    • March 2024
    • February 2024
    • January 2024
    • December 2023
    • November 2023
    • October 2023
    • September 2023
    • August 2023
    • July 2023
    • June 2023
    • May 2023
    • April 2023
    • March 2023
    • February 2023
    • January 2023
    • December 2022
    • November 2022
    • October 2022
    • September 2022
    • August 2022
    • July 2022
    • June 2022
    • May 2022
    • April 2022
    • March 2022
    • February 2022
    • January 2022
    • December 2021
    • November 2021
    • October 2021
    • September 2021
    • August 2021
    • July 2021
    • June 2021
    • May 2021
    • April 2021
    • March 2021
    • February 2021
    • January 2021
    • December 2020
    • November 2020
    • October 2020
    • September 2020
    • August 2020
    • July 2020
    • June 2020
    • May 2020
    • April 2020
    • January 2020
    • December 2019
    • November 2019
    • October 2019
    • September 2019
    • August 2019
    • July 2019
    • June 2019
    • May 2019
    • April 2019
    • March 2019
    • February 2019
    • January 2019
    • December 2018
    • November 2018
    • October 2018
    • September 2018
    • August 2018
    • July 2018
    • June 2018
    • May 2018
    • April 2018
    • March 2018
    • February 2018
    • January 2018
    • December 2017
    • November 2017
    • October 2017
    • September 2017
    • August 2017
    • July 2017
    • June 2017
    • May 2017
    • April 2017
    • March 2017
    • February 2017
    • January 2017
    Categories
    • News
    Meta
    • Log in
    • Entries feed
    • Comments feed
    • WordPress.org
    Tiatra LLC.

    Tiatra, LLC, based in the Washington, DC metropolitan area, proudly serves federal government agencies, organizations that work with the government and other commercial businesses and organizations. Tiatra specializes in a broad range of information technology (IT) development and management services incorporating solid engineering, attention to client needs, and meeting or exceeding any security parameters required. Our small yet innovative company is structured with a full complement of the necessary technical experts, working with hands-on management, to provide a high level of service and competitive pricing for your systems and engineering requirements.

    Find us on:

    FacebookTwitterLinkedin

    Submitclear

    Tiatra, LLC
    Copyright 2016. All rights reserved.