IBM이 연례 테크익스체인지(TechXchange) 행사에서 신규 AI 모델 제품군인 그래니트(Granite) 3.0을 발표했다.
IBM에 따르면 그래니트 모델은 오픈소스 AI에 대한 의지를 바탕으로 아파치 2.0 라이선스 하에 공개됐다. 특정 모델에 대한 비종속성은 물론, 성능 및 비용 효율성 측면에 있어 기업 고객과 커뮤니티에 독보적인 가치를 제공할 것으로 예상된다.
이번에 발표된 IBM의 그래니트 3.0 제품군은 다음과 같다.
- 범용/언어 모델: 그래니트 3.0 8B 인스트럭트(Instruct), 그래니트 3.0 2B 인스트럭트, 그래니트 3.0 8B 베이스(Base), 그래니트 3.0 2B 베이스
- 안전 장치 및 안전성 모델: 그래니트 가디언(Guardian) 3.0 8B, 그래니트 가디언 3.0 2B
- 혼합 전문가 모델: 그래니트 3.0 3B-A800M 인스트럭트, 그래니트 3.0 1B-A400M 인스트럭트, 그래니트 3.0 3B-A800M 베이스, 그래니트 3.0 1B-A400M 베이스
새로운 그래니트 3.0 8B 및 2B 언어 모델은 기업 AI에 최적화된 ‘주력’ 모델로 설계돼, RAG(Retrieval Augmented Generation: 검색 증강 생성), 분류, 요약, 엔터티 추출 및 도구 사용과 같은 다양한 작업에서 고성능을 발휘한다. 이 모델들은 소형이면서도 매우 유연해 기업 데이터를 기반으로 세밀하게 조정할 수 있으며, 다양한 비즈니스 환경과 워크플로우에 손쉽게 통합되도록 설계됐다.
IBM에 따르면 대부분의 대규모 언어 모델(LLM)은 공개 데이터를 기반으로 훈련되며, 기업의 데이터를 활용하는 경우는 아직 많지 않다. IBM은 지난 5월 레드햇(RedHat)과 함께 선보인 정렬 튜닝 기법 인스트럭트랩(InstructLab)을 통해 소형 그래니트 모델과 기업 데이터를 결합하면 더 큰 모델의 성능을 훨씬 낮은 비용으로 구현할 수 있을 것으로 보고 있다(여러 초기 개념 증명 프로젝트에서 대형 모델에 비해 비용이 3배에서 23배까지 절감된 것으로 나타남).
IBM은 그래니트 3.0의 출시가 AI 제품에서 투명성, 안전성, 신뢰성을 더욱 강화하겠다는 의지를 보여준다고 설명했다. 그래니트 3.0 기술 보고서와 사용 가이드는 이 모델들을 훈련하는 데 사용된 데이터 세트, 필터링, 정제 및 큐레이션 과정에 대한 상세 정보와 주요 학술 및 기업 벤치마크에서의 성능 결과를 제공한다.
특히, IBM은 왓슨x.ai (watsonx.ai)에서 제공되는 모든 그래니트 모델에 대해 지적 재산권 보장 프로그램을 제공해 기업 고객들이 믿고 자신들의 데이터를 모델과 결합해 사용할 수 있도록 지원한다.
IBM은 이번 출시의 일환으로 그래니트 가디언(Granite Guardian) 모델도 새롭게 선보였다. 이 모델은 애플리케이션 개발자가 사용자 명령어와 거대 언어 모델(LLM)의 답변에서 발생할 수 있는 다양한 위험 요소를 감지해 안전 장치를 구현할 수 있도록 지원한다. 그래니트 가디언 3.0 8B와 2B 모델은 현재 시장에서 가장 포괄적인 위험 및 피해 탐지 기능을 제공한다.
이 모델은 사회적 편견, 증오, 유해성, 욕설, 폭력, 보안 우회(jailbreaking) 등의 위험 요소를 감지할 뿐만 아니라, 정보의 신뢰성, 맥락의 적합성, 답변의 관련성과 같이 RAG(검색 증강 생성)작업에 특화된 고유한 검증 기능도 갖추고 있다. 19개 이상의 안전성 및 RAG 벤치마크에 대한 광범위한 테스트에서 그래니트 가디언 3.0 8B 모델은 메타(Meta)의 라마 가드(Llama Guard) 모델보다 유해성 감지 분야에서 평균적으로 높은 정확도를 기록했으며, 환각 감지(hallucination detection) 분야에서도 위첵(WeCheck) 및 미니첵(MiniCheck) 같은 전문 감지 모델과 비슷한 성능을 보였다.
그래니트 가디언 모델은 그래니트 언어 모델에서 파생됐지만, 타사의 어떤 AI 모델과도 함께 안전 장치를 구현하는 데 사용할 수 있다.
한편, 기업용 AI를 위한 다양한 기술을 발전시키고 있는IBM은 왓슨x 오케스트레이트(watsonx Orchestrate)와 같이 로우코드 도구와 자동화를 통해 기업들이 자체 AI 어시스턴트를 쉽게 개발할 수 있도록 돕는 기술부터, 고객 서비스, 인사, 영업, 마케팅 등 특정 업무와 영역에 특화시켜 사전 구축된 어시스턴트에 이르기까지 다양한 AI 어시스턴트 기술 포트폴리오를 지속적으로 발전시키고 있다. 전 세계의 많은 조직들이 왓슨x 어시스턴트(watsonx Assistant)를 활용해 고객이나 직원의 질문에 답변하고, 레거시 IT 애플리케이션을 현대화하며, 학생들이 직업 경로를 탐색하도록 돕거나 주택 구매자를 위한 디지털 융자 지원을 제공하는 등 AI 어시스턴트를 구축했다.
이를 위해 IBM은 오늘 그래니트 코드 모델을 기반으로 C, C++, Go, 자바(Java), 파이썬(Python) 등 다양한 프로그래밍 언어에 대한 범용 코딩 지원과 엔터프라이즈 자바(Java) 애플리케이션을 위한 고급 애플리케이션 현대화 기능을 제공하는 차세대 왓슨x 코드 어시스턴트(watsonx Code Assistant) 도 올해 4분기에 출시할 예정이라고 발표했다.
그래니트 3.0 모델은 아파치 2.0 라이선스 하에 허깅페이스(HuggingFace)에서 다운로드할 수 있다. 그래니트 3.0 8B 및 2B 언어 모델의 인스트럭트 버전과 그래니트 가디언 3.0 8B 및 2B 모델은 IBM 왓슨x 플랫폼에서 상업적으로 사용가능하다. 일부 그래니트 3.0 모델은 엔비디아의 NIM 마이크로서비스 및 허깅페이스와 통합된 구글 클라우드의 버텍스 AI 모델 가든(Vertex AI Model Garden)을 통해서도 제공된다.
또한, IBM은 전 세계 기업들에 더 많은 선택지를 제공하기 위해 AWS, 도커(Docker), 도모(Domo), 퀄컴 테크놀러지스(Qualcomm Technologies, Inc.)의 퀄컴 AI 허브(Qualcomm® AI Hub), 세일즈포스(Salesforce), SAP 등 생태계 파트너들과 다양한 그래니트 모델을 이들 파트너 솔루션에 통합하거나 플랫폼에서 사용할 수 있도록 협력하고 있다.
그래니트와 IBM의 기업용 AI 전략에 대해 더 자세한 정보는 여기에서 확인할 수 있다.
[email protected]
Read More from This Article: IBM, 새로운 AI 모델 ‘그래니트 3.0’ 발표
Source: News