Skip to content
Tiatra, LLCTiatra, LLC
Tiatra, LLC
Information Technology Solutions for Washington, DC Government Agencies
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact
 
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact

“2026년 물량 전부 달라” 고객 몰린 AWS, 자체 칩 전략 가속

아마존웹서비스(AWS)의 칩 사업은 “불타오르고 있다”고 평가받고 있다. 트레이니움은 엔비디아 대비 더 나은 가격 대비 성능을 제공하고 있으며, 고객은 AI 컴퓨팅 용량을 확보하기 위해 현재 이용 가능한 물량을 모두 사들이려 할 정도로 적극적인 모습을 보이고 있다.

이 같은 내용은 아마존 최고경영자 앤디 재시가 2025년 연례보고서에 담긴 8페이지 분량의 주주 서한에서 밝힌 핵심 메시지다.

재시는 기업이 AI에 전면적으로 투자하고 있다는 점을 강조하는 한편, AI가 전기만큼 혁신적인 기술이 될 것이라고 평가하며 해당 분야를 선도하겠다는 아마존의 의지를 분명히 드러냈다.

컨설팅 기업 인포테크 리서치 그룹의 자문 연구원 스콧 비클리는 “종합해 보면 AWS는 전력, 데이터센터, 중간 계층의 맞춤형 실리콘, 최상단의 학습과 추론에 이르기까지 AI 스택 전반을 아우르며 보다 깊이 통제하려 하고 있다”고 분석했다.

대형 고객, 추론 수요 급증

재시는 주주 서한에서 AWS가 2025년 한 해 동안 3.9기가와트(GW)의 신규 전력 용량을 추가했으며, 2027년 말까지 전체 전력 용량을 두 배로 확대할 계획이라고 밝혔다. 그러면서도 “여전히 용량 제약으로 인해 충족되지 못한 수요가 존재한다”고 설명했다.

특히 재시는 대형 고객 두 곳이 AI 연산 자원을 대규모로 필요로 하면서, AWS의 자체 CPU 칩인 그래비톤의 2026년 전체 인스턴스 용량을 모두 구매하겠다고 요청했다고 공개했다. 다만 다른 고객의 수요를 고려할 때 이러한 요청을 수용할 수는 없다고 분명히 했다.

또 다른 컨설팅 기업 무어인사이트앤스트래티지의 부사장 겸 수석 애널리스트 맷 킴벌은 “두 대형 고객이 2026년 그래비톤 전체 용량을 사들이겠다고 나선 사실은 현재 시장 상황을 단적으로 보여준다”고 분석했다.

킴벌은 이를 단순한 공급망 문제로만 보기는 어렵다고 진단했다. 기업이 단순히 컴퓨팅 자원을 구매하는 차원을 넘어, 경쟁사보다 먼저 용량을 확보하려는 ‘전략적 의존성’ 확보에 나서고 있다는 설명이다. 킴벌은 “AWS의 위험은 인프라를 충분히 빠르게 구축하지 못하는 데 있다기보다, 용량 제약을 느낀 고객이 애저나 구글 클라우드 플랫폼(GCP)으로 일부 수요를 분산하는 상황에 있다”고 짚었다.

이 같은 움직임은 그래비톤의 인기가 크게 높아졌음을 보여주는 동시에, AWS가 수요를 모두 소화하기 어려운 상황일 수 있음을 시사한다. 그래비톤은 더 이상 ‘가벼운 워크로드를 지원하는 경량 칩’에 머무르지 않고, 다양한 연산 특성을 요구하는 폭넓은 워크로드에 활용되고 있다고 킴벌은 설명했다.

또한 애저 코발트와 구글 클라우드 액시온 프로세서 역시 성숙 단계에 접어들면 유사한 수요를 경험할 가능성이 높다고 내다봤다. 이는 Arm과 x86 기술 간 경쟁 구도에 흥미로운 시장 역학을 형성할 것이라고 덧붙였다.

인포테크 리서치 그룹의 비클리 역시 공급망 제약이 AI 인프라 확장 전반에 미치는 영향이 광범위하고 깊다고 평가했다. 2026년 계획된 AI 데이터센터 용량의 50%가 실제로는 실현되지 않을 것이라는 전망이 나오는 상황에서도, “사실상 모든 용량이 전반적으로 매진된 상태”라고 전했다.

트레이니움의 경쟁력

재시는 2026년을 앞두고 아마존의 칩 사업이 “불타오르고 있다”고 평가했다. AWS가 반도체 기업 엔비디아와 긴밀한 협력 관계를 유지하며 해당 반도체를 활용하고 있지만, 고객이 더 나은 가격 대비 성능을 요구하면서 프로세서 시장에 새로운 변화가 나타나고 있다고 설명했다.

아마존은 2024년 말 자체 AI 실리콘 2세대 제품인 트레이니움2를 출시했다. 현재 베드록은 대부분의 추론 작업을 이 차세대 가속기에서 실행하고 있다. 재시는 트레이니움2가 유사한 GPU 대비 약 30% 더 우수한 가격 대비 성능을 제공하며, 현재 상당 물량이 이미 판매된 상태라고 전했다.

최근 출하를 시작한 트레이니움3는 트레이니움2보다 30~40% 더 개선된 가격 대비 성능을 제공하며, 이미 대부분의 용량이 예약됐다고 밝혔다. 또한 본격적인 대량 공급까지 약 18개월이 남은 트레이니움4 역시 상당 부분이 사전 예약된 상태라고 설명했다.

재시는 “우리 칩에 대한 수요가 매우 높아 향후에는 제3자에게 랙 단위로 판매하는 방안도 가능할 수 있다”고 언급했다.

인포테크 리서치 그룹의 비클리는 아마존의 전략이 엔비디아를 배제하는 데 있다기보다, AWS가 경제성 측면에서 경쟁력을 확보할 수 있는 영역에서 엔비디아 기술 의존도를 낮추려는 데 있다고 분석했다.

비클리는 AWS가 여전히 엔비디아의 핵심 파트너이지만, 가격 대비 성능을 기반으로 차별화된 가치를 제시할 수 있다고 평가했다. 베드록과의 긴밀한 통합, AWS가 설계한 인터커넥트, 효율적인 토큰 경제성, 표준 PyTorch·JAX·vLLM 워크플로를 기반으로 한 소프트웨어 스택을 결합해 종합적인 패키지를 제공하고 있다는 설명이다.

트레이니움의 주요 활용 분야는 수천억 개에서 1조 개 이상의 파라미터를 갖는 대규모 언어모델(LLM), 멀티모달 모델, 디퓨전 트랜스포머의 학습과 추론이다.

비클리는 앤스로픽과 우버 같은 주요 기업이 AWS의 효율성 주장을 실제 환경에서 검증하고 있다고 전했다. 반면 코히어와 스태빌리티 AI는 성숙한 툴링 프레임워크와 우수한 칩 설계를 이유로 엔비디아를 선호하고 있으며, AWS의 서비스 및 가용성 문제를 언급하고 있다고 설명했다.

무어인사이트앤스트래티지의 킴벌은 AWS와 미국의 AI 반도체 설계 기업 세레브라스(Cerebras)의 파트너십도 주목할 요소라고 짚었다. 트레이니움은 프리필에, 세레브라스 CS-3는 디코드에 각각 최적화돼 있어 두 기술을 결합하면 사용자 개입 없이도 높은 추론 성능을 제공할 수 있다는 설명이다. 킴벌은 “기업 사용자가 원하는 것은 이러한 ‘포인트 앤 클릭’ 수준의 단순성”이라고 평가했다.

킴벌은 그래비톤이 x86 생태계에 가져온 변화와 트레이니움이 엔비디아에 미치는 영향을 직접적으로 연결 지을 수 있다고 분석했다. 추론은 기업 AI에서 가장 빠르게 성장하면서 비용 민감도가 높은 워크로드이며, 바로 그 지점에서 트레이니움이 빠르게 입지를 넓히고 있다는 설명이다.

추론 엔진 ‘맨틀’에서 얻은 교훈

재시는 “방향을 재설정하기 위해 출발선으로 돌아갈 수 있는 역량”의 중요성도 강조했다. 베드록은 예상보다 빠르게 구축·확장됐지만, 단순한 조정이 아니라 완전히 다른 유형의 추론 엔진이 필요하다는 점을 팀이 인식하게 됐다고 밝혔다.

이에 따라 베드록 팀은 AWS의 에이전트 기반 코딩 서비스 키로를 활용해 6명의 숙련된 엔지니어로 구성된 소규모 팀을 꾸렸고, 76일 만에 새로운 엔진 ‘맨틀(Mantle)’을 개발했다. 맨틀은 이후 베드록의 핵심 기반으로 자리 잡았으며, 재시에 따르면 2026년 1분기에 처리한 토큰 수가 이전 모든 연도를 합친 것보다 많았다.

비클리는 소규모 팀이 짧은 기간 안에 대규모 재구축을 수행하고, 상태 기반 대화 관리, 비동기 추론, 기본 할당량 상향 등 다양한 기능을 추가한 점은 인상적이라고 평가했다. 맨틀은 독자적인 추론 제품으로 간주할 수 있을 만큼 중요한 의미를 갖는다고 분석했다. 또한 AWS가 별도의 게시글을 통해 보안과 거버넌스 측면에 대한 신뢰를 강화하려는 점도 주목할 부분이라고 설명했다.

킴벌은 맨틀의 탄생을 두 가지 관점에서 해석했다. 하나는 운영상의 필요성으로, 베드록에 새로운 아키텍처가 요구됐다는 점이다. 다른 하나는 생산성 압축 효과다.

킴벌은 “에이전트 도구를 활용한 6명의 엔지니어가 기존 40명으로는 더 빠르게 수행하지 못했을 작업을 해냈다면, 팀 규모와 프로젝트 일정, 자체 구축과 외부 도입에 대한 판단 기준이 근본적으로 달라진다”고 분석했다. 이어 “토큰 처리량 수치가 그 결과를 분명하게 보여준다”고 전했다.

맨틀은 단순한 재구축 사례를 넘어, AI 지원 개발이 실제 운영 환경에서 어떤 변화를 만들어내고 있는지를 보여주는 사례로 평가된다. 킴벌은 “이론이나 마케팅 구호 차원이 아니라, 실제 프로덕션 환경에서 벌어지고 있는 변화”라고 설명했다.

재시는 “진전은 선형적으로 이뤄지지 않는다”며 “가속하는 순간도 있고 방향을 조정해야 하는 시점도 있다. 중요한 영역에는 과감히 투자하고, 효과가 없는 부분은 과감히 축소할 것”이라고 밝혔다.
dl-ciokorea@foundryco.com


Read More from This Article: “2026년 물량 전부 달라” 고객 몰린 AWS, 자체 칩 전략 가속
Source: News

Category: NewsApril 14, 2026
Tags: art

Post navigation

PreviousPrevious post:The viability gap: Why 42% of AI initiatives fail (and how to bridge it)NextNext post:코헤시티 “AI 시대, 3중 백업도 무력화…네트워크 분리된 보호 전략 필요”

Related posts

Data centers are costing local governments billions
April 17, 2026
Robot Zuckerberg shows how IT can free up CEOs’ time
April 17, 2026
UK wants to build sovereign AI — with just 0.08% of OpenAI’s market cap
April 17, 2026
Oracle delivers semantic search without LLMs
April 17, 2026
Secure-by-design: 3 principles to safely scale agentic AI
April 17, 2026
No sólo IA marca la transformación digital de los sectores clave
April 17, 2026
Recent Posts
  • Data centers are costing local governments billions
  • Robot Zuckerberg shows how IT can free up CEOs’ time
  • UK wants to build sovereign AI — with just 0.08% of OpenAI’s market cap
  • Oracle delivers semantic search without LLMs
  • Secure-by-design: 3 principles to safely scale agentic AI
Recent Comments
    Archives
    • April 2026
    • March 2026
    • February 2026
    • January 2026
    • December 2025
    • November 2025
    • October 2025
    • September 2025
    • August 2025
    • July 2025
    • June 2025
    • May 2025
    • April 2025
    • March 2025
    • February 2025
    • January 2025
    • December 2024
    • November 2024
    • October 2024
    • September 2024
    • August 2024
    • July 2024
    • June 2024
    • May 2024
    • April 2024
    • March 2024
    • February 2024
    • January 2024
    • December 2023
    • November 2023
    • October 2023
    • September 2023
    • August 2023
    • July 2023
    • June 2023
    • May 2023
    • April 2023
    • March 2023
    • February 2023
    • January 2023
    • December 2022
    • November 2022
    • October 2022
    • September 2022
    • August 2022
    • July 2022
    • June 2022
    • May 2022
    • April 2022
    • March 2022
    • February 2022
    • January 2022
    • December 2021
    • November 2021
    • October 2021
    • September 2021
    • August 2021
    • July 2021
    • June 2021
    • May 2021
    • April 2021
    • March 2021
    • February 2021
    • January 2021
    • December 2020
    • November 2020
    • October 2020
    • September 2020
    • August 2020
    • July 2020
    • June 2020
    • May 2020
    • April 2020
    • January 2020
    • December 2019
    • November 2019
    • October 2019
    • September 2019
    • August 2019
    • July 2019
    • June 2019
    • May 2019
    • April 2019
    • March 2019
    • February 2019
    • January 2019
    • December 2018
    • November 2018
    • October 2018
    • September 2018
    • August 2018
    • July 2018
    • June 2018
    • May 2018
    • April 2018
    • March 2018
    • February 2018
    • January 2018
    • December 2017
    • November 2017
    • October 2017
    • September 2017
    • August 2017
    • July 2017
    • June 2017
    • May 2017
    • April 2017
    • March 2017
    • February 2017
    • January 2017
    Categories
    • News
    Meta
    • Log in
    • Entries feed
    • Comments feed
    • WordPress.org
    Tiatra LLC.

    Tiatra, LLC, based in the Washington, DC metropolitan area, proudly serves federal government agencies, organizations that work with the government and other commercial businesses and organizations. Tiatra specializes in a broad range of information technology (IT) development and management services incorporating solid engineering, attention to client needs, and meeting or exceeding any security parameters required. Our small yet innovative company is structured with a full complement of the necessary technical experts, working with hands-on management, to provide a high level of service and competitive pricing for your systems and engineering requirements.

    Find us on:

    FacebookTwitterLinkedin

    Submitclear

    Tiatra, LLC
    Copyright 2016. All rights reserved.