IBM에 따르면 스파이어 엑셀러레이터는 핵심 업무의 보안과 복원력을 최우선으로 고려해 설계됐으며, 생성형 및 에이전트 기반 AI 업무를 지원하는 빠른 추론 기능을 제공한다. 오는 12월부터는 파워11(Power11) 서버용 제품도 제공될 예정이다.
스파이어 엑셀러레이터는 IBM 리서치 AI 하드웨어 센터의 혁신 기술과 IBM 인프라 사업부의 개발 역량을 바탕으로 개발됐다. 시제품으로 개발된 이후 IBM 요크타운 하이츠 연구소의 클러스터 구축과 올버니대학교 산하 ‘신흥 인공지능 시스템 센터’와의 협업을 통해 빠른 반복 개발 과정을 거쳤다. 이후 완성도를 높여 IBM Z, 리눅스원, 파워 시스템에 적용 가능한 기업용 제품으로 선보일 수 있게 됐다.
현재 스파이어 엑셀러레이터는 32개의 개별 가속 코어와 256억 개의 트랜지스터를 탑재한 상용 SoC(system-on-a-chip) 형태가 됐다. 5나노미터 공정 기술을 기반으로 제작된 각 제품은 75와트(W) PCIe 카드에 장착되며, IBM Z 및 리눅스원 시스템에는 최대 48개, IBM 파워 시스템에는 최대 16개까지 클러스터 구성이 가능하다.
IBM 인프라 사업부 최고운영책임자(COO)이자 시스템즈 사업부 총괄 배리 베이커는 “스파이어 엑셀러레이터를 통해 IBM 시스템은 생성형 및 에이전트 기반 AI를 포함한 다중 모델 AI를 지원할 수 있는 역량을 갖추게 됐다. 고객이 AI 기반 핵심 업무를 보안성과 복원력, 효율성을 저해하지 않고 확장할 수 있도록 돕는 동시에, 기업 데이터의 가치를 효과적으로 끌어낼 수 있도록 지원한다”라고 말했다.
IBM 반도체 및 하이브리드 클라우드 부문 부사장 무케시 카레는 “IBM은 2019년 AI 리서치 하드웨어 센터를 설립해, 생성형 AI와 대규모 언어 모델(LLM)이 본격적으로 확산되기 이전부터 AI의 연산 수요 증가에 대응해 왔다. 최근 고도화된 AI 역량에 대한 수요가 높아지는 가운데, 해당 센터에서 개발된 첫 번째 칩이 상용화 단계에 진입했다”라고 설명했다.
IBM은 기존 고객이 스파이어 엑셀러레이터를 통해 IBM Z, 리눅스원, 파워 시스템 상에서 데이터를 안전하게 유지하면서도 AI를 대규모로 적용할 수 있다고 밝혔다. 특히 IBM Z 및 리눅스원 시스템에서는 텔럼 II(Telum II) 프로세서와 함께 사용돼 보안, 저지연, 높은 거래 처리 성능을 제공한다는 설명이다. 기업은 고도화된 사기 탐지, 유통 자동화 등 예측 기반 업무에 다중 AI 모델을 적용할 수 있다.
IBM 파워 기반 서버에서는 AI 서비스 카탈로그를 통해 기업 업무 흐름에 맞춘 종합적인 AI 활용이 가능하다. 기업은 해당 서비스를 한 번의 클릭으로 설치할 수 있다. 128개 토큰 길이의 프롬프트 입력을 지원하며, 이를 통해 시간당 800만 건 이상의 대규모 문서를 지식 베이스에 통합할 수 있다.
dl-ciokorea@foundryco.com
Read More from This Article: IBM, AI 가속기 ‘스파이어 엑셀러레이터’ 출시
Source: News

