메타가 AI 인프라를 최상위 전략 과제로 격상하고, 신규 조직인 ‘메타 컴퓨트(Meta Compute)’를 출범했다. 메타 컴퓨트는 데이터센터와 네트워크의 구축·운영 책임을 단일 리더십 체계로 통합한다.
메타의 CEO 마크 저커버그는 소셜미디어를 통해 “메타는 향후 10년 동안 수십 기가와트(GW) 규모의 전력을 사용하는 AI 인프라를 구축할 계획이며, 장기적으로는 그 규모를 수백 기가와트 이상으로 확대할 것”이라며 “이 인프라를 어떻게 설계하고 투자하며 파트너십을 맺느냐가 중요한 전략적 경쟁력이 될 것”이라고 밝혔다.
해당 조직은 산토시 자나르단과 다니엘 그로스가 공동으로 이끈다. 자나르단은 기존과 같이 메타의 데이터센터와 네트워크 기반 전반을 총괄하고, 그로스는 AI 인프라의 장기 용량 계획과 벤더 전략, 비즈니스 모델링을 담당한다.
저커버그는 “두 사람은 최근 메타에 사장 겸 부회장으로 합류한 디나 파월 맥코믹과 긴밀히 협력해, 정부와 국가 단위 파트너와의 협업을 통해 메타 인프라의 구축과 배치, 투자, 재원 조달을 추진할 것”이라고 설명했다. 맥코믹은 미국 백악관에서 국가안보회의(NSC) 전략 담당 부보좌관을 지낸 인물로, 배우자인 데이브 맥코믹은 펜실베이니아주 출신 연방 상원의원이자 상원 에너지 소위원회 위원장을 맡고 있다.
이번 조치는 주요 클라우드 업체가 네트워크 성능과 전력 공급에 극단적인 부담을 주는 초대형 AI 클러스터 구축 경쟁에 나서고 있는 상황에서 나왔다. AI 인프라 규모가 커질수록 데이터센터와 네트워크, 전력 설비 전반에 대한 계획을 더욱 긴밀하게 조율할 필요가 있다는 이유다.
이 같은 규모에서는 인프라 제약이 AI 확장의 결정적인 한계 요인으로 작용한다. 신규 데이터센터를 어디에 건설할 수 있는지, 각 시설을 어떤 방식으로 상호 연결할지와 같은 판단이 AI 전략 전반에 직접적인 영향을 미칠 수 있다.
메타는 최근 비스트라(Vistra), 테라파워(TerraPower), 오클로(Oklo) 등 전력 기업과 대규모 계약을 체결한 바 있다. 해당 계약은 오하이오와 펜실베이니아 지역 데이터센터 클러스터에 전력을 공급하기 위해 최대 6.6GW, 즉 원자력 발전소 여러 기에 해당하는 규모의 에너지를 확보하는 것을 목표로 하고 있다.
데이터센터 네트워크에 미치는 영향
업계 분석가들은 AI 경쟁에서 네트워크와 고성능 연결 기술이 더 이상 보조 요소가 아니라, AI 성능과 확장성을 좌우하는 핵심 경쟁 요소로 자리 잡고 있음을 보여준다고 분석했다.
카던스 인터내셔널의 수석부사장 툴리카 실은 메타의 이번 이니셔티브가 데이터센터 네트워크의 변화 필요성을 분명히 보여준다고 설명했다. AI 인프라 내부에서 발생하는 막대한 데이터 흐름을 감당하려면, 네트워크가 고대역폭과 초저지연을 동시에 충족하는 방향으로 빠르게 진화해야 한다는 것이다.
실은 “데이터센터의 규모와 GPU 집적도가 커질수록 네트워크와 광학 부품 공급망에 가해지는 압박이 더욱 커질 것”이라며 “이에 따라 보다 고도화된 연결 기술과 더 빠른 광섬유에 대한 수요가 증가하게 될 것”이라고 진단했다.
일부 전문가는 인프라 아키텍처 전반의 변화로 이어질 가능성에도 주목했다.
포레스터의 수석 애널리스트 비스와지트 마하파트라는 “메타는 DSF(Disaggregated Scheduled Fabric)와 비스케줄링 패브릭을 새로운 51데라비트(Tbps)급 스위치 및 스케일업 네트워킹용 이더넷과 함께 사용하고 있다. 이로 인해 스위치용 반도체, 광 모듈, 오픈 랙 표준 전반에 걸쳐 부담이 커지고 있다”라고 설명했다. 이어 그는 “메타가 백본 네트워크 확장과 AI 클러스터 확대를 추진하면서, 생태계 전반에 더 빠른 광 연결 기술과 더 큰 광섬유 용량을 요구하고 있다”라고 분석했다.
이제 네트워크는 단순한 보조 수단이 아니라 AI 확장을 가로막는 핵심 제약 요소로 부상하고 있다. 실은 대규모 AI 환경에서 네트워크 병목을 피하려는 주요 클라우드 업체에게 차세대 연결 기술이 연산 자원 접근성만큼이나 중요한 요소가 되고 있다고 설명했다.
네트워크 아키텍트에 미치는 영향
수십 기가와트 규모의 AI 인프라를 계획하려면 데이터센터 설계자와 네트워크 아키텍트는 과거보다 훨씬 긴밀하게 전력과 네트워크를 통합해야 한다.
실은 “아키텍트는 에너지 소비와 열 분산, 워크로드 배치를 균형 있게 설계하는 동시에 중복 구성과 지능형 라우팅을 통해 안정성을 확보해야 한다”라면서, “이 정도 규모에서는 성능과 신뢰성을 유지하기 위해 전력 사용을 고려한 설계와 지연을 최소화한 네트워크가 필수적”이라고 분석했다.
마하파트라는 프로메테우스와 하이페리온과 같은 대형 AI 슈퍼클러스터를 예로 들며, 이러한 환경에서는 지역 단위로 견고하게 연결된 네트워크와 유연한 인프라 구성, 그리고 지속적인 확장을 가능하게 하는 임시 배치 구조가 요구된다고 설명했다. 그는 미래 AI 수요가 불확실한 상황에서, 여러 시설에 워크로드를 분산할 수 있는 설계가 중요해지고 있다고 평가했다.
dl-ciokorea@foundryco.com
Read More from This Article: 메타, AI 인프라 총괄 조직 ‘메타 컴퓨트’ 출범···”초대형 AI 클러스터 구축할 것”
Source: News

