2025년이 시작됐다. 수정 구슬을 들여다볼 시점이다. 올해 기술 분야에서 헤드라인을 장식할 이슈를 예측해본다.
트럼프, 기술 관세에서 후퇴
트럼프는 위협만 하고 실행에 옮기지 않은 전력이 있다. 반도체 분야의 관세 문제가 그러한 경로를 밟을 가능성이 높다. 강경한 관세 정책이 미국 내 칩 제조 문제에 있어 유일한 해법이 아니라는 점을 트럼프가 스스로 알아낼 수도, 다른 누군가가 지적할 수도 있다. 이는 트럼프가 칩스 법에 필요한 자금을 승인할 가능성으로 이어진다. 이 기금의 큰 수혜 지역은 오하이오주인데, 오하이오는 JD 밴스 부통령 당선자의 기반 지역이기도 하다.
인텔이 외부에서 CEO를 영입
인텔의 기존 경영진은 앞으로의 과제에 대한 준비가 되어 있지 않다. 문제를 해결하기 위해서는 새로운 시각이 필요할 수 있다. 인텔 턴어라운드 임무를 맡은 전문가는 회사 내부 출신이 아닌 외부 출신일 가능성이 높다. 지금까지 인텔의 CEO는 모두 인텔에서 근무한 경력을 가진 인물들이었다. 일각에서는 이미 퀄컴의 CEO 크리스티아노 아몬이 인텔 CEO로 합류할 가능성을 제기하고 있다.
AI 투자의 결실이 필요
AI 하드웨어에 대한 투자 금액은 엄청나며, 이로 인해 엔비디아 주주들은 매우 만족하고 있다. 그러나 업계의 플레이어 모두가 AI 관련 매출을 쏠쏠하게 거두는 것은 아니다. 오픈AI, 구글, 마이크로소프트, 메타, X 등은 올해 수익 창출에 대한 압박에 직면할 가능성이 크다. 이들은 현재 투자 대비 수익을 얻지 못하고 있으며, 상황이 바뀌지 않는다면 관련 지출이 둔화될 가능성을 열어놓아야 한다.
하이퍼스케일러의 전력 사업 진출
이미 구체적인 움직임들이 존재한다. 구글과 마이크로소프트가 전력 설비에 투자하는 이유는 전력망이 한계에 다다랐고 AI에 대한 수요가 엄청나기 때문이다. 공공 전력 기업들은 AI 데이터센터의 증가하는 전력 수요를 감당할 수 없으며, 하이퍼스케일러는 전력 회사가 행동할 때까지 앉아서 기다릴 수 없다. 이들은 자체적으로 전력을 공급하려 한다. 그리고 AI 워크로드의 전력 수요를 감안할 때 기존 전력 업계가 반발할 가능성은 희박하다.
AI 활용한 HPC 향상
AI가 변화를 가져올 수 있는 영역에는 데이터센터 운영의 최적화와 보안 탐지 개선 등의 운영 분야가 있다. 슈퍼컴퓨터는 알아서 동작하는 플러그 앤 플레이 시스템이 아니다. 로드 밸런싱과 확장성을 극대화하기 위해 최적화하고 조정하는 작업을 필요로 한다.
2025년에는 운영을 최적화하고 성능을 개선하는 데 AI가 본격적으로 사용되기 시작할 전망이다. 특히 상위 500대 슈퍼컴퓨터에 적용되어 모든 슈퍼컴퓨터의 전반적인 성능이 크게 향상될 것이다. 마찬가지로, 특히 제로 트러스트 시나리오에서 의심스러운 노드와 시스템을 격리하기 위해 보안을 개선하는 데 AI가 널리 사용될 전망이다.
액체 냉각의 도약
AI 시스템에서 발생하는 열을 처리하는 데 있어 공랭식 기술은 충분하지 않다. 이로 인해 액체 냉각의 필요성이 대두되고 있다. GPU도 큰 전력을 소모하지만 인텔과 AMD의 새로운 CPU도 만만치 않은 발열량을 보인다. 필자는 기존 데이터센터에 큰 개조가 필요 없는 독립형 액체 냉각이 늘어날 것으로 예상한다. 또한 HPE와 델이 레노버의 프로젝트 넵튠(Project Neptune)과 유사한 자체 액체 냉각 솔루션을 확보할 것으로 전망한다. 지금까지 HPE와 델은 액체 냉각과 관련해 타사의 기술을 활용해왔다.
인텔 분할
다른 방법이 없다. 인텔은 2008년에 AMD가 그랬던 것처럼 제조 사업을 분사해야 한다. 비용이 많이 들고 고통스럽지만 장기적인 성공을 위해 꼭 필요한 일이다. 겔싱어에게는 인텔 파운드리와 인텔 제품을 관리할 수 있는 여유가 없었다. 결국 팹 사업은 시작이 늦어졌고, 칩 사업은 AMD에 뒤처졌으며, 겔싱어는 밀려났다. 이제 인텔은 팹을 정리할 때가 되었다.
온프레미스 이탈이라는 부정확한 예측
매번 틀리는 이 예측은 앞으로도 계속 제기되겠지만 계속해서 틀릴 것이다. 데이터 프라이버시 및 무결성부터 시작하여 온프레미스 데이터센터를 유지해야 할 이유는 많다. 클라우드에서 온프레미스 인프라로 데이터를 송환하는 움직임이 계속 이어지고 있다. 온프레미스 데이터센터는 메인프레임이 존재하는 한 함께 존재할 것이다.
효율적 GPU 활용이 중요해짐
엔비디아 GPU의 전력 소비가 크게 줄 기미가 보이지 않는다. GPU를 최대한 효율적으로 활용하는 과제는 다른 사람들의 몫이다. 즉 GPU 활용도 극대화가 최신 데이터센터의 주요 설계 목표가 될 전망이다. 훈련에 필요한 인프라를 적절히 유지하고 지연 시간, 랙 및 훈련 중단을 유발하는 기타 문제를 최소화하기 위한 하드웨어 및 소프트웨어 혁신이 더욱 절실하게 대두한다. 성공 여부는 데이터센터가 GPU 리소스를 얼마나 효과적으로 활용할 수 있는지에 따라 측정될 것이다.
전력 이슈와 데이터센터 위치
버지니아 지역에만 거의 500개의 데이터센터가 있다. 지역적 한계에 도달했다고 해도 과언이 아니다. 텍사스와 산타클라라도 마찬가지다. AI, 데이터 분석 및 양자 컴퓨팅을 위한 대규모 수요는 새로운 지역으로 옮겨갈 가능성이 크다. 좋은 소식은 이러한 애플리케이션, 특히 AI 교육은 지연 시간에 민감하지 않기에 전력 비용이 저렴한 외딴 지역도 후보가 될 수 있다는 점이다. 코로케이션 제공업체가 시에라 산맥 어딘가에 신규 사이트를 오픈하는 상황을 우려하지 않아도 된다.
[email protected]
Read More from This Article: 칼럼 | AI, 전력 가용성 및 인텔의 미래에 대한 전망
Source: News