HPE HPC 및 AI 인프라 솔루션 부문 수석 부사장 겸 총괄 트리시 댐크로거는 “AI 서비스 제공기업과 대기업 모델 개발자들은 확장성, 최상의 성능, 빠른 구축 속도를 제공해야 한다는 엄청난 압박을 받고 있다. 직접 수랭 방식(DLC)을 통해 세계 3대 최고속 시스템을 구축한 HPE는 서비스 전문성을 바탕으로 고객에게 토큰 당 학습 비용을 낮추고 동급 최고의 성능을 제공한다”라고 설명했다.
HPE에 따르면 엔비디아 GB200 NVL72는 하나의 메모리 공간에서 1조 개 이상의 파라미터로 구성된 초대규모 AI 모델을 처리할 수 있도록 설계된 그래픽 처리 장치(GPU) 기술과 공유 메모리(shared-memory) 및 저지연 아키텍처를 갖추고 있다. 또한 엔비디아의 중앙 처리 장치(CPU), GPU, 컴퓨트 및 스위치 트레이, 네트워킹, 소프트웨어를 통합해, 엔비디아 소프트웨어 애플리케이션과 함께 생성형 AI 모델 학습 및 추론과 같은 병렬화 가능한 워크로드를 처리할 수 있는 성능을 제공한다.
엔비디아 엔터프라이즈 플랫폼 부문 부사장 밥 페트는 “엔지니어, 과학자, 연구원들은 증가하는 전력과 컴퓨팅 요구사항을 따라잡기 위해 최첨단 수랭 기술이 필요하다. HPE와 엔비디아 간의 지속적인 협업을 바탕으로, HPE의 첫 번째 엔비디아 GB200 NVL72 출하는 서비스 제공기업들과 대기업들이 대규모 AI 클러스터를 효율적으로 구축하고 배포하며 확장할 수 있도록 도울 것”이라고 말했다.
HPE는 전력 요구사항 및 데이터센터 집적도의 증가에 따라, 50년 간 쌓아온 수랭 전문 지식을 바탕으로 고객이 복잡한 수랭 환경에 대해 신속한 구축과 광범위한 인프라 지원 시스템을 제공할 수 있도록 지원한다고 언급했다. 이런 경험을 바탕으로 HPE는 세계에서 가장 에너지 효율적인 슈퍼컴퓨터를 선정하는 그린500(Green500) 리스트의 상위 15개 슈퍼컴퓨터 중 8대를 제공할 수 있었다는 설명이다.
HPE 기반 엔비디아 GB200 NVL72 특징
• 고속 엔비디아 NV링크(NVIDIA NVLink)을 통해 상호 연결된 72개의 엔비디아 블랙웰 GPU 및 36개의 엔비디아 그레이스(NVIDIA Grace) CPU
• 최대 13.5 TB에 달하는 HBM3e 메모리 및 초당 576 TB 대역폭 지원
• HPE의 DLC 기술 적용
또한 HPE는 전문가 현장 지원, 맞춤형 서비스 및 지속 가능성 서비스 등 역량을 바탕으로 대규모 맞춤형 AI 클러스터를 지원하며, 글로벌 규모에서 AI 솔루션을 제공한다고 밝혔다. HPC에 따르면 AI 맞춤형 지원 서비스는 고객의 요구사항에 맞게 최적화되어 있으며, 전담 원격 엔지니어를 통한 적극적인 지원으로 사고 관리 기능을 강화하고, 신속한 설치와 빠른 가치 실현 시간을 얻도록 지원한다. 제공되는 서비스는 다음과 같다.
• 현장 엔지니어링 리소스: 고객의 IT 팀과 긴밀히 협력하여 최적의 시스템 성능과 가용성을 보장하는 숙련된 현장 엔지니어의 종합적인 지원
• 성능 및 벤치마킹 서비스: 시스템 전체 수명 기간 동안 솔루션을 미세 조정하는 업계 선도적인 전문가 팀
• 지속가능성 서비스: 에너지 및 배출 보고, 지속가능성 워크숍, 자원 모니터링을 통해 환경에 미치는 영향 최소화
[email protected]
Read More from This Article: HPE, 엔비디아 블랙웰 기반 첫 번째 솔루션 출시
Source: News