AWS가 머신러닝(ML)용 엘라스틱 컴퓨트 클라우드(EC2) 용량 예약 서비스 일부에 대한 요금 구조를 조정했다. 요금이 약 15% 인상된 이번 조치는 대규모 ML 워크로드를 계획하는 기업에 영향을 미칠 수 있다.
아마존 용량 블록(Amazon Capacity Blocks)은 기업이 향후 특정 시점부터 가속 컴퓨팅 자원에 접근할 수 있는 권한을 사전에 확보하도록 하는 예약 서비스다. AWS는 기업이 1개부터 64개 인스턴스 규모의 클러스터를 최대 6개월까지 예약해 다양한 ML 워크로드를 실행할 수 있도록 지원한다. 이는 GPU 기준 최대 512개, 트레이니엄(Trainium) 칩 기준으로는 최대 1,024개에 해당한다. 다만 EC2 용량 블록 예약은 최대 8주 전까지만 사전 예약이 가능하다.
한편 AWS는 지난해 6월 P4와 P5 인스턴스를 포함한 엔비디아 GPU 가속 EC2 인스턴스의 요금을 최대 45% 인하한 바 있다. 불과 몇 달 전까지 GPU 인스턴스 전반의 요금을 낮추는 전략을 취했던 만큼, 이번 조정은 일반 인스턴스가 아닌 보장형 예약 서비스에만 별도의 가격 정책을 적용한다는 취지로 해석된다.
P5 계열 예약 서비스 전반에서 요금 상승
이번 요금 조정은 고성능 GPU를 추후에 확정적으로 사용할 수 있는 EC2 용량 예약 서비스 전반에 적용된다. 해당 서비스에는 최신 엔비디아 블랙웰 GPU를 탑재한 EC2 P6 인스턴스, 엔비디아 H100 및 H200 텐서 코어 GPU 기반의 P5 인스턴스, 엔비디아 A100 텐서 코어 GPU로 구동되는 P4 인스턴스가 포함된다.
미국 동부(오하이오) 리전에서 엔비디아 H200 가속기 8개를 장착한 p5e.48xlarge 인스턴스의 경우, 유효 시간당 요금이 각 34.608달러에서 39.799달러로 인상됐다.
같은 리전의 p5en.48xlarge 인스턴스 역시 36.184달러에서 41.612달러로 가격이 올랐다. 이 요금은 유럽의 스톡홀름, 런던, 스페인과 아시아태평양 지역의 자카르타, 뭄바이, 도쿄, 서울 등에서도 동일하게 적용된다. 다만 미국 서부(북부 캘리포니아) 리전에서는 p5e.48xlarge가 43.26달러에서 49.749달러로, p5en.48xlarge는 45.23달러에서 52.015달러로 각각 더 높은 요금이 책정됐다.
반면 P6e 계열의 가격은 거의 변동이 없다. 달라스 로컬 존에서 p4d.24xlarge 기준으로 72개의 B200 가속기를 제공하는 P6e 인스턴스는 시간당 761.904달러로 기존 가격이 유지됐다.
EIIR트렌드 및 파리크컨설팅의 CEO 파리크 자인은 이번 요금 조정의 배경에 대해 “수요와 공급에 따른 시장 가격 책정으로 보는 것이 가장 타당하다”라고 분석했다. 자인은 “H100과 H200 GPU에 대한 수요가 공급을 크게 웃돌면서, AWS가 보장형 GPU 물량에 사실상 프리미엄을 적용하고 있다”라며 “전체 인프라 용량이 아니라, 긴급하게 GPU 용량을 필요로 하는 고객을 대상으로 더 높은 인프라 및 자본 비용을 회수하려는 전략”이라고 설명했다.
보장형 GPU 예약 서비스가 새로운 경쟁 시장으로 부상
GPU 클러스터에 대한 접근이 보장되면 기업은 AI 인프라 계획 과정에서 불확실성을 줄이고, 향후 공급 변동성에 대비한 안정성을 확보할 수 있다. 엔비디아 H100과 H200 등 고사양 GPU에 대한 수요가 급증하면서 공급 부족이 심화되자, 주요 클라우드 업체는 기업의 GPU 사용을 보장하는 예약 서비스를 점차 확대하고 있다.
AWS 외에도 구글과 마이크로소프트(MS)가 유사한 서비스를 제공하고 있다. 다만 이들 서비스는 보다 전통적인 예약 모델과 스케줄링 방식으로 구성돼 있다는 점에서 AWS의 접근 방식과는 차이를 보인다.
예를 들어 구글클라우드는 기업이 캘린더 기반 도구를 활용해 GPU 용량을 고정된 블록 단위로 사전에 예약할 수 있도록 하는 스케줄링 기능을 도입했다. 그레이하운드 리서치의 CEO 겸 수석 애널리스트인 산칫 비르 고기아는 “형식만 보면 AWS의 용량 블록과 상당히 유사해 보인다. 그러나 접근 방식은 다르다”라고 설명했다. 고기아는 “구글은 이를 프리미엄 상품이 아니라, 전체 자원 스케줄러의 일부로 다루고 있다. 보장은 유지되지만, 가격 구조가 지나치게 세분화되거나 수시로 변한다는 느낌은 적다”라고 평가했다. 이어 “가격 경쟁보다는 스케줄링을 통해 차별화를 시도하는 것처럼 보이며, 일부 워크로드를 GPU 대신 TPU로 전환할 수 있다는 점도 시스템 전반의 유연성을 높여준다”라고 말했다.
반면 MS의 애저는 리전 단위의 용량 예약에 더 무게를 두고 있다. 고기아는 “특정 리전과 가용 영역에서 특정 가상머신(VM) 유형을 확보할 수 있도록 하지만, 장기 계획과 대규모 엔터프라이즈 약정을 선호하는 구조”라며 “보장된 용량을 확보할 수 있는 대신, 실제 사용 여부와 관계없이 해당 자원을 유지하는 비용을 부담해야 하는 경우가 많다”라고 설명했다. 이어 “이는 요금 자체보다 장기간 약정과 자원 선점에 프리미엄을 붙이는 또 다른 종류”라고 분석했다.
가격 인상에도 단기 영향은 제한적
전문가들은 이러한 보장형 GPU 예약 서비스가 일반 컴퓨팅 자원과 비교하면 전체 클라우드 지출에서 차지하는 비중은 크지 않다고 보고 있다. 다만 기업의 전략적 AI 투자 관점에서는 상대적으로 비중이 높아 의미가 크다고 분석했다.
AWS가 가격 인상을 가장 먼저 공식화했지만, 고기아는 다른 클라우드 업체도 표현 방식만 다를 뿐 동일한 전략을 따르고 있다고 평가했다. 그는 “겉으로 드러나는 설명은 다를 수 있지만, 실제로는 같은 방향으로 움직이고 있다”라고 말했다.
자인은 대부분의 기업에서 이번 가격 인상이 즉각적인 워크로드 이전으로 이어질 가능성은 낮다고 설명했다. EC2 용량 블록 서비스가 전체 GPU 지출에서 차지하는 비중이 크지 않고, 데이터 종속성, 이미 깊게 자리 잡은 ML옵스(MLOps) 환경, 규제 및 컴플라이언스 요건, 그리고 축적된 조직 역량이 여전히 워크로드를 AWS에 묶어두고 있다는 이유에서다. 성숙도가 높아진 ML 학습 환경을 AWS 외부로 이전하는 작업이 복잡하고 시간이 많이 드는 만큼, 이번 가격 인상의 영향은 기존 시스템보다는 신규 AI 워크로드에서 더 크게 나타날 전망이다.
dl-ciokorea@foundryco.com
Read More from This Article: GPU 수요 급증에…AWS, EC2 용량 예약 요금 인상
Source: News

