엔비디아의 최신 세대 AI 칩인 루빈(Rubin) GPU는 올해 말 출하될 예정이지만, 지속되는 지정학적 압박과 공급망 제약으로 인해 공급 지연에 직면할 가능성이 있다.
시장조사업체 트렌드포스에 따르면, 엔비디아 전체 출하량에서 루빈 GPU가 차지하는 비중은 당초 29%에 이를 것으로 예상됐으나, 현재는 2026년 기준 22% 수준에 머물 것으로 전망된다. 트렌드포스는 지연의 주요 원인으로 HBM4 검증 과정, 네트워크 인터커넥트를 CX8에서 CX9로 전환하는 작업, 크게 증가한 전력 소비 관리, 그리고 한층 고도화된 액체 냉각 환경에서의 성능 최적화 과제를 지목했다.
이러한 지연은 차세대 AI 인프라 업그레이드의 다음 단계에 영향을 미칠 가능성이 있다.
엔비디아는 해당 사안에 대한 논평 요청에 즉각적인 답변을 내놓지 않았다.
차세대 AI 인프라에서 루빈의 역할
현재 엔비디아의 블랙웰(Blackwell)과 호퍼(Hopper) 아키텍처와 같은 최신 세대 플랫폼은 학습과 추론 워크로드를 처리하는 데 여전히 충분한 성능을 제공하고 있다. 그러나 루빈은 단순한 GPU 업그레이드를 넘어서는 의미를 지닌다. 연산 밀도와 메모리 대역폭, 전반적인 효율성을 향상시켜 대규모 AI 운영의 경제성을 개선하도록 설계됐다.
그레이하운드 리서치의 수석 애널리스트 산칫 비르 고기아는 “루빈은 토큰당 비용을 낮추고, 대규모 워크로드에 필요한 GPU 수를 줄이며, 대규모 추론을 경제적으로 지속 가능하게 만드는 것을 목표로 한다”라며 “특히 연산 수요를 크게 증가시키는 에이전틱 AI 워크로드로 전환이 가속화되는 상황에서 이러한 변화는 더욱 중요하다”라고 설명했다.
루빈 플랫폼은 고밀도 시스템, 첨단 냉각 기술, 긴밀하게 통합된 아키텍처를 지원할 수 있는 인프라를 갖춘 하이퍼스케일러와 AI 네이티브 기업을 중심으로 초기 도입이 이뤄질 것으로 예상됐다.
하이퍼스케일러, 초기 충격 흡수 전망
일반적으로 하이퍼스케일러는 최신 GPU를 가장 먼저 도입해 내부 인프라와 클라우드 플랫폼에 적용한다. 이후 약 6~12개월에 걸쳐 API와 서비스 형태로 기업에 제공하는 방식이 일반적이다.
컨설팅 기업 테크인사이트의 반도체 애널리스트 마니시 라왓은 “하이퍼스케일러는 블랙웰의 수명을 연장하고 투자 대비 수익률이 높은 워크로드를 우선 배치함으로써 초기 충격을 흡수할 것”이라며 “이로 인해 외부에 제공되는 클라우드 용량은 줄어들고, 가용성은 더욱 제한되며, 가격 변동성은 커질 수 있다. 또한 예약 용량의 중요성도 한층 높아질 것”이라고 분석했다.
라왓은 이어 “기업은 클라우드 기반 AI 인프라에 대한 접근이 제한되고, 차세대 인스턴스의 제공이 지연되는 2차적인 영향을 겪을 가능성이 있다”고 전망했다.
기업 AI 도입 지연과 비용 압박
루빈의 출시가 지연되더라도 기업의 AI 도입이 중단되지는 않을 것으로 보인다. 다만 배포 일정과 비용에 대한 기대치는 조정이 불가피하다.
많은 기업의 AI 전략은 향후 등장할 하드웨어가 현재의 비효율성을 개선해 줄 것이라는 기대를 바탕으로 수립돼 있다. 즉, 더 나은 달러당 성능, 더 높은 집적도, 향상된 에너지 효율을 전제로 하고 있다.
고기아는 이러한 상황이 AI 프로젝트 중단으로 이어지지는 않겠지만, 보다 단계적인 도입, 하이브리드 소비 모델의 확대, 그리고 재무적 검토의 강화로 이어질 것이라고 설명했다. 또한 기업은 특정 하드웨어 로드맵에 조기에 종속되는 것을 피하기 위해 추론 중심 배포, 소규모 클러스터, 그리고 유연한 확장이 가능한 하이브리드 아키텍처를 우선시할 것으로 내다봤다.
라왓은 이 같은 변화가 AMD 및 맞춤형 실리콘과 같은 대안으로의 다변화를 가속화하고, CUDA를 넘어서는 소프트웨어 이식성에 대한 관심을 높일 수 있다고 분석했다.
AI 팩토리 전략, 재조정 가능성
이번 영향은 프라이빗 AI 클러스터와 AI 팩토리 환경과 같은 대규모 프로젝트에서 더욱 두드러질 전망이다.
라왓은 “루빈은 상시 가동되는 AI 팩토리를 위해 시스템 수준에서 최적화된 AI 인프라로의 전환을 의미하며, 뛰어난 비용 효율성과 처리량을 제공하는 것을 목표로 한다”라며 “출시가 지연될 경우 기업은 엔비디아 블랙웰과 호퍼 기반 인프라를 계속 구축하게 되며, 아키텍처 방향성은 유지되지만 경제성은 낮아지고 활용률은 떨어지며 전력 비용과 하드웨어 의존도는 높아질 수 있다”고 설명했다.
트렌드포스는 루빈이 부재한 상황에서 기업이 기존 플랫폼, 특히 엔비디아 블랙웰 아키텍처에 계속 의존할 것으로 전망했다. 이에 따라 2026년에는 GB300 또는 B300 시리즈를 중심으로 블랙웰 플랫폼이 전체 출하량의 70% 이상을 차지할 것으로 예상된다.
라왓은 AI 도입이 워크로드 수요에 기반해 지속되는 만큼, 배포 주기가 분기 단위로 늘어나며 수요가 일시적으로 이연되는 현상이 나타날 수 있다고 분석했다. 다만 루빈 플랫폼이 본격적으로 시장에 공급되면, 억눌렸던 수요가 다시 빠르게 증가할 가능성이 높다고 내다봤다.
dl-ciokorea@foundryco.com
Read More from This Article: 엔비디아 루빈 GPU 공급 차질 우려…기업 AI 인프라 도입 일정 늦어지나
Source: News

