데이터센터는 올해 여러 도전 과제에 직면할 것으로 보인다. AI 수요 증가로 인한 AI 하드웨어의 진화, 학습 및 추론을 위한 온프레미스와 클라우드 기반 전략, 전력 분배 혁신이 주요 과제로 떠올랐다. 여기에 새로운 데이터센터 개발에 대한 반대 여론도 계속 늘어나고 있다.
업타임 인스티튜트(Uptime Institute)가 ‘2025년 데이터센터 5가지 예측‘ 보고서를 통해 데이터센터 산업이 올해 직면할 주요 과제와 기회를 설명했다. 업타임의 연구 책임자인 앤디 로렌스는 대규모 데이터센터가 급속히 확장하면서 산업 전체가 중대한 도전에 직면해 있다고 말했다. 보고서에 따르면, 전 세계적으로 100메가와트 이상의 신규 건설 프로젝트를 추적한 결과 총 3,880억 달러 규모의 새로운 데이터센터 프로젝트가 진행 중이며, 6만 3,000메가와트 이상의 전력이 필요한 것으로 나타났다.
로렌스는 최근 웨비나에서 “데이터센터는 에너지와 물 소비가 증가함에 따라 강도 높은 감시를 받게 될 전망이다. 정부와 사회 전반에서 지속가능성 목표와 AI 및 개발 목표 사이의 갈등은 아직 본격적으로 시작되지 않았다. 이로 인해 개발자와 운영자는 더욱 투명하고 협력적인 태도를 보여야 하며, 더 많은 기여를 해야 할 수 있다. 데이터센터 산업은 자신들의 입장을 설득력 있게 제시하지 않으면 어려움을 겪게 될 가능성이 있다”라고 말했다.
업타임 인스티튜트가 발표한 5가지 전망은 다음과 같다.
대중의 감시와 반대
업타임은 올해 데이터센터가 자원 사용과 환경에 대한 영향으로 인해 강도 높은 감시와 대중의 반대에 직면할 것이라고 전망했다. 데이터센터는 규모와 수가 급격히 증가하고 있으며, 일부 지역에서는 전력 자원의 20~30%를 사용하고 있다고 업타임은 보고했다. 앞서 언급했듯이, 이는 개발자와 운영자가 대중의 감시에 대응하기 위해 더욱 투명하고 협력적인 자세를 취해야 한다는 의미일 수 있다.
업타임은 데이터센터 프로젝트가 AI와 같은 이니셔티브를 지지하는 정부와 지속가능성 규제와 제한을 추진하는 정부 부처 사이에서 난관에 부딪힐 수 있다고 예측했다. 데이터센터 산업이 AI 수요 증가로 인한 대규모 확장을 앞두고 있는 시점에서, 환경단체는 데이터센터의 환경 영향에 대해 더욱 강력히 문제를 제기할 것으로 예상된다.
AI 모델을 위한 클라우드 학습
업타임은 대부분의 AI 모델이 전용 기업 인프라가 아닌 클라우드에서 학습될 것으로 예상했다. 클라우드 서비스는 특정 사용 사례에 맞춰 파운데이션 모델을 미세 조정하는 데 더 비용 효율적인 방법을 제공한다. 미세 조정에 필요한 점진적 학습은 대규모의 온프레미스 클러스터 없이도 클라우드 플랫폼에서 수행할 수 있다. 기업은 자체 하드웨어에 자본과 운영 비용을 투자하지 않고도 필요에 따라 온디맨드 클라우드 리소스를 활용하여 기초 모델을 맞춤화할 수 있다.
업타임의 클라우드 컴퓨팅 연구 책임자인 오웬 로저스 박사는 “미세 조정에는 상대적으로 적은 양의 학습만 필요하기 때문에, 많은 기업에게 이 목적만을 위해 거대하고 비싼 자체 AI 클러스터를 구매하는 것은 합리적이지 않다. 다른 누군가가 이미 학습시킨 파운데이션 모델이 대부분의 학습 부담을 덜고 있다. 대신 온디맨드 클라우드 서비스를 사용해 파운데이션 모델을 필요에 맞게 조정하고, 필요한 리소스에 대해서만 일정 기간 동안의 비용을 지불하면 된다”라고 설명했다.
유틸리티 기업과 데이터센터의 협력
업타임은 데이터센터를 신설 및 확장한 기업이 전력망을 지원하기 위해 전력을 제공하거나 저장하도록 요청받을 수 있다고 언급했다. 이는 데이터센터가 전력망 수요와 안정성을 관리하기 위해 유틸리티 업체와 적극적으로 협력해야 하며, 피크 시간대에는 부하를 줄이거나 로컬 전원을 사용해야 할 수 있음을 의미한다. 업타임은 “특정 AI 학습 작업과 같은 지연에 민감하지 않은 워크로드를 실행하는 데이터센터 운영자는 필요할 때 전력 사용을 줄이도록 재정적 지원을 받거나, 이런 방식이 의무화될 수 있다”라고 전망했다.
로렌스는 “데이터센터가 없더라도 전력망은 시간이 지남에 따라 수요를 충족시키는 데 어려움을 겪을 가능성이 높다. 역사상 유례없는 속도로 투자해야 하는 시점이며, 이는 데이터센터만의 문제가 아니다. 전기 자동차, 에어컨, 탄소화가 모두 관련돼 있다. 또한 석탄 발전소를 폐쇄하고 재생 에너지 발전소로 대체하는 추세가 이어지고 있다. 재생 에너지는 훨씬 덜 안정적이고 간헐적이기 때문에 전력망에는 많은 과제가 남아있다”라고 말했다.
급진적인 데이터센터 전력 전환
업타임에 따르면 2025년 데이터센터는 AI 워크로드의 전력 수요를 처리하기 위해 중전압 시스템으로 전환해야 할 수 있다. 생성형 AI를 위한 인프라 요구사항이 매우 높기 때문에 기업은 새로운 전력 아키텍처를 모색해야 하며, 이는 데이터센터 전력 공급의 혁신을 주도할 수 있다. 데이터센터가 훨씬 높은 전력 밀도를 처리하게 되면서 전기 관련 인프라의 설계와 배치 방식에 있어 시설의 균형이 무너질 수 있다. 예를 들어, AI 시스템은 이미 랙당 100-120kW의 전력 수준에 도달하고 있어 일반적인 데이터센터 밀도를 크게 초과하고 있다고 업타임은 보고했다.
업타임의 연구 책임자인 다니엘 비조는 “산업계가 다시 한번 심각하게 검토하고 전반적인 전력 전환에 더 많은 투자를 할 시기라고 생각한다. 이전에는 슈퍼컴퓨팅에서만 볼 수 있었던 수준의 전력 수요를 처리해야 하는 시설이 점점 더 많아질 것으로 예상된다”라고 언급했다.
엔비디아의 대안 등장
업타임은 올해 데이터센터 전망을 발표하면서, 기업용 GPU 시장에서 엔비디아의 지배력을 직접적으로 다뤘다. 업타임은 기업이 특히 적은 컴퓨팅 자원이 필요한 추론 작업을 위해 “전력 소비가 많은 GPU의 대안을 찾을 것”이라고 예상했다. 보고서는 올해 AI 하드웨어가 더욱 다양해질 것이며, 분산 GPU 컴퓨팅, AMD GPU, 그리고 추론 워크로드를 대상으로 하는 클라우드 서비스 기업과 스타트업의 AI 칩을 포함하여 엔비디아의 고밀도, 수냉식 AI 시스템에 대한 대안이 등장할 가능성이 있다고 설명했다.
업타임은 엔비디아의 고밀도, 고성능 AI 시스템이 데이터센터가 생성형 AI 워크로드를 지원하는 데 필요한 표준을 정립했다면서도, 엔비디아의 특수한 시스템을 호스팅하려면 데이터센터 설계와 운영에 큰 변화가 필요하다고 지적했다. 엔비디아의 접근 방식이 많은 기업에게 실용적이거나 비용 효율적이지 않을 수 있기 때문에, 업타임은 기업들이 다른 접근 방식을 고려할 가능성이 있다고 언급했다.
업타임의 연구 분석가인 맥스 스몰락스는 “대부분의 기업은 사전 학습된 범용 파운데이션 모델을 그대로 사용하거나, 클라우드 서비스로 미세 조정해 더 나은 모델을 개발할 가능성이 높다. 결과적으로 대부분의 AI 학습은 클라우드 인프라에서 이뤄지고, 다른 기업에 판매할 자체 파운데이션 모델을 학습시키는 벤더나 자체 모델을 미세 조정하려는 기업에 의해 작업이 진행될 전망이다. 대부분의 기업은 비용이 많이 드는 최상의 결과를 추구하기보다는 더 나은 결과에 만족할 것으로 예상한다”라고 밝혔다.
[email protected]
Read More from This Article: “지속 가능성, 전력망 문제 떠오른다”··· 2025년 데이터센터 전망 5가지
Source: News