Skip to content
Tiatra, LLCTiatra, LLC
Tiatra, LLC
Information Technology Solutions for Washington, DC Government Agencies
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact
 
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact

GPU 수요 급증에…AWS, EC2 용량 예약 요금 인상

AWS가 머신러닝(ML)용 엘라스틱 컴퓨트 클라우드(EC2) 용량 예약 서비스 일부에 대한 요금 구조를 조정했다. 요금이 약 15% 인상된 이번 조치는 대규모 ML 워크로드를 계획하는 기업에 영향을 미칠 수 있다.

아마존 용량 블록(Amazon Capacity Blocks)은 기업이 향후 특정 시점부터 가속 컴퓨팅 자원에 접근할 수 있는 권한을 사전에 확보하도록 하는 예약 서비스다. AWS는 기업이 1개부터 64개 인스턴스 규모의 클러스터를 최대 6개월까지 예약해 다양한 ML 워크로드를 실행할 수 있도록 지원한다. 이는 GPU 기준 최대 512개, 트레이니엄(Trainium) 칩 기준으로는 최대 1,024개에 해당한다. 다만 EC2 용량 블록 예약은 최대 8주 전까지만 사전 예약이 가능하다.

한편 AWS는 지난해 6월 P4와 P5 인스턴스를 포함한 엔비디아 GPU 가속 EC2 인스턴스의 요금을 최대 45% 인하한 바 있다. 불과 몇 달 전까지 GPU 인스턴스 전반의 요금을 낮추는 전략을 취했던 만큼, 이번 조정은 일반 인스턴스가 아닌 보장형 예약 서비스에만 별도의 가격 정책을 적용한다는 취지로 해석된다.

P5 계열 예약 서비스 전반에서 요금 상승

이번 요금 조정은 고성능 GPU를 추후에 확정적으로 사용할 수 있는 EC2 용량 예약 서비스 전반에 적용된다. 해당 서비스에는 최신 엔비디아 블랙웰 GPU를 탑재한 EC2 P6 인스턴스, 엔비디아 H100 및 H200 텐서 코어 GPU 기반의 P5 인스턴스, 엔비디아 A100 텐서 코어 GPU로 구동되는 P4 인스턴스가 포함된다.

미국 동부(오하이오) 리전에서 엔비디아 H200 가속기 8개를 장착한 p5e.48xlarge 인스턴스의 경우, 유효 시간당 요금이 각 34.608달러에서 39.799달러로 인상됐다.

같은 리전의 p5en.48xlarge 인스턴스 역시 36.184달러에서 41.612달러로 가격이 올랐다. 이 요금은 유럽의 스톡홀름, 런던, 스페인과 아시아태평양 지역의 자카르타, 뭄바이, 도쿄, 서울 등에서도 동일하게 적용된다. 다만 미국 서부(북부 캘리포니아) 리전에서는 p5e.48xlarge가 43.26달러에서 49.749달러로, p5en.48xlarge는 45.23달러에서 52.015달러로 각각 더 높은 요금이 책정됐다.

반면 P6e 계열의 가격은 거의 변동이 없다. 달라스 로컬 존에서 p4d.24xlarge 기준으로 72개의 B200 가속기를 제공하는 P6e 인스턴스는 시간당 761.904달러로 기존 가격이 유지됐다.

EIIR트렌드 및 파리크컨설팅의 CEO 파리크 자인은 이번 요금 조정의 배경에 대해 “수요와 공급에 따른 시장 가격 책정으로 보는 것이 가장 타당하다”라고 분석했다. 자인은 “H100과 H200 GPU에 대한 수요가 공급을 크게 웃돌면서, AWS가 보장형 GPU 물량에 사실상 프리미엄을 적용하고 있다”라며 “전체 인프라 용량이 아니라, 긴급하게 GPU 용량을 필요로 하는 고객을 대상으로 더 높은 인프라 및 자본 비용을 회수하려는 전략”이라고 설명했다.

보장형 GPU 예약 서비스가 새로운 경쟁 시장으로 부상

GPU 클러스터에 대한 접근이 보장되면 기업은 AI 인프라 계획 과정에서 불확실성을 줄이고, 향후 공급 변동성에 대비한 안정성을 확보할 수 있다. 엔비디아 H100과 H200 등 고사양 GPU에 대한 수요가 급증하면서 공급 부족이 심화되자, 주요 클라우드 업체는 기업의 GPU 사용을 보장하는 예약 서비스를 점차 확대하고 있다.

AWS 외에도 구글과 마이크로소프트(MS)가 유사한 서비스를 제공하고 있다. 다만 이들 서비스는 보다 전통적인 예약 모델과 스케줄링 방식으로 구성돼 있다는 점에서 AWS의 접근 방식과는 차이를 보인다.

예를 들어 구글클라우드는 기업이 캘린더 기반 도구를 활용해 GPU 용량을 고정된 블록 단위로 사전에 예약할 수 있도록 하는 스케줄링 기능을 도입했다. 그레이하운드 리서치의 CEO 겸 수석 애널리스트인 산칫 비르 고기아는 “형식만 보면 AWS의 용량 블록과 상당히 유사해 보인다. 그러나 접근 방식은 다르다”라고 설명했다. 고기아는 “구글은 이를 프리미엄 상품이 아니라, 전체 자원 스케줄러의 일부로 다루고 있다. 보장은 유지되지만, 가격 구조가 지나치게 세분화되거나 수시로 변한다는 느낌은 적다”라고 평가했다. 이어 “가격 경쟁보다는 스케줄링을 통해 차별화를 시도하는 것처럼 보이며, 일부 워크로드를 GPU 대신 TPU로 전환할 수 있다는 점도 시스템 전반의 유연성을 높여준다”라고 말했다.

반면 MS의 애저는 리전 단위의 용량 예약에 더 무게를 두고 있다. 고기아는 “특정 리전과 가용 영역에서 특정 가상머신(VM) 유형을 확보할 수 있도록 하지만, 장기 계획과 대규모 엔터프라이즈 약정을 선호하는 구조”라며 “보장된 용량을 확보할 수 있는 대신, 실제 사용 여부와 관계없이 해당 자원을 유지하는 비용을 부담해야 하는 경우가 많다”라고 설명했다. 이어 “이는 요금 자체보다 장기간 약정과 자원 선점에 프리미엄을 붙이는 또 다른 종류”라고 분석했다.

가격 인상에도 단기 영향은 제한적

전문가들은 이러한 보장형 GPU 예약 서비스가 일반 컴퓨팅 자원과 비교하면 전체 클라우드 지출에서 차지하는 비중은 크지 않다고 보고 있다. 다만 기업의 전략적 AI 투자 관점에서는 상대적으로 비중이 높아 의미가 크다고 분석했다.

AWS가 가격 인상을 가장 먼저 공식화했지만, 고기아는 다른 클라우드 업체도 표현 방식만 다를 뿐 동일한 전략을 따르고 있다고 평가했다. 그는 “겉으로 드러나는 설명은 다를 수 있지만, 실제로는 같은 방향으로 움직이고 있다”라고 말했다.

자인은 대부분의 기업에서 이번 가격 인상이 즉각적인 워크로드 이전으로 이어질 가능성은 낮다고 설명했다. EC2 용량 블록 서비스가 전체 GPU 지출에서 차지하는 비중이 크지 않고, 데이터 종속성, 이미 깊게 자리 잡은 ML옵스(MLOps) 환경, 규제 및 컴플라이언스 요건, 그리고 축적된 조직 역량이 여전히 워크로드를 AWS에 묶어두고 있다는 이유에서다. 성숙도가 높아진 ML 학습 환경을 AWS 외부로 이전하는 작업이 복잡하고 시간이 많이 드는 만큼, 이번 가격 인상의 영향은 기존 시스템보다는 신규 AI 워크로드에서 더 크게 나타날 전망이다.
dl-ciokorea@foundryco.com


Read More from This Article: GPU 수요 급증에…AWS, EC2 용량 예약 요금 인상
Source: News

Category: NewsJanuary 7, 2026
Tags: art

Post navigation

PreviousPrevious post:칼럼 | 범용 컴퓨팅 이후의 시대, AI가 스토리지를 재편한다NextNext post:그록 미성년자 딥페이크 논란에도…xAI, 200억 달러 투자 유치

Related posts

Intel, behind in AI chips, bets on quantum and neuromorphic processors
May 6, 2026
Anthropic’s financial agents expose forward-deployed engineers as new AI limiting factor
May 6, 2026
Agentic AI for marketing: Reimagine end-to-end customer experiences
May 6, 2026
I gave our developers an AI coding assistant. The security team nearly mutinied
May 6, 2026
AI FOMO: When AI Is the wrong answer to the right problem
May 6, 2026
OpenAI, Anthropic expand services push, signaling new phase in enterprise AI race
May 6, 2026
Recent Posts
  • Intel, behind in AI chips, bets on quantum and neuromorphic processors
  • Anthropic’s financial agents expose forward-deployed engineers as new AI limiting factor
  • Agentic AI for marketing: Reimagine end-to-end customer experiences
  • I gave our developers an AI coding assistant. The security team nearly mutinied
  • AI FOMO: When AI Is the wrong answer to the right problem
Recent Comments
    Archives
    • May 2026
    • April 2026
    • March 2026
    • February 2026
    • January 2026
    • December 2025
    • November 2025
    • October 2025
    • September 2025
    • August 2025
    • July 2025
    • June 2025
    • May 2025
    • April 2025
    • March 2025
    • February 2025
    • January 2025
    • December 2024
    • November 2024
    • October 2024
    • September 2024
    • August 2024
    • July 2024
    • June 2024
    • May 2024
    • April 2024
    • March 2024
    • February 2024
    • January 2024
    • December 2023
    • November 2023
    • October 2023
    • September 2023
    • August 2023
    • July 2023
    • June 2023
    • May 2023
    • April 2023
    • March 2023
    • February 2023
    • January 2023
    • December 2022
    • November 2022
    • October 2022
    • September 2022
    • August 2022
    • July 2022
    • June 2022
    • May 2022
    • April 2022
    • March 2022
    • February 2022
    • January 2022
    • December 2021
    • November 2021
    • October 2021
    • September 2021
    • August 2021
    • July 2021
    • June 2021
    • May 2021
    • April 2021
    • March 2021
    • February 2021
    • January 2021
    • December 2020
    • November 2020
    • October 2020
    • September 2020
    • August 2020
    • July 2020
    • June 2020
    • May 2020
    • April 2020
    • January 2020
    • December 2019
    • November 2019
    • October 2019
    • September 2019
    • August 2019
    • July 2019
    • June 2019
    • May 2019
    • April 2019
    • March 2019
    • February 2019
    • January 2019
    • December 2018
    • November 2018
    • October 2018
    • September 2018
    • August 2018
    • July 2018
    • June 2018
    • May 2018
    • April 2018
    • March 2018
    • February 2018
    • January 2018
    • December 2017
    • November 2017
    • October 2017
    • September 2017
    • August 2017
    • July 2017
    • June 2017
    • May 2017
    • April 2017
    • March 2017
    • February 2017
    • January 2017
    Categories
    • News
    Meta
    • Log in
    • Entries feed
    • Comments feed
    • WordPress.org
    Tiatra LLC.

    Tiatra, LLC, based in the Washington, DC metropolitan area, proudly serves federal government agencies, organizations that work with the government and other commercial businesses and organizations. Tiatra specializes in a broad range of information technology (IT) development and management services incorporating solid engineering, attention to client needs, and meeting or exceeding any security parameters required. Our small yet innovative company is structured with a full complement of the necessary technical experts, working with hands-on management, to provide a high level of service and competitive pricing for your systems and engineering requirements.

    Find us on:

    FacebookTwitterLinkedin

    Submitclear

    Tiatra, LLC
    Copyright 2016. All rights reserved.