대형 데이터센터는 LLM, 생성형 및 에이전틱 AI와 같은 차세대 기술에 필수적이다. 그러나 이러한 데이터센터의 환경적 문제는 점점 더 심각한 우려를 낳고 있다.
마이크로소프트 연구진은 네이처에 게재된 새 논문에서 “강력한 조치가 절실하다. 새로운 기술군의 환경적 영향을 이해하지 못하면 조직은 감축 목표 달성을 위한 길을 모색하기 어렵다”라고 밝혔다.
연구진에 따르면 액체 냉각이 점점 더 많은 가능성을 제시하고 있다. 그들은 고급 냉각 기법들이 온실가스 배출량, 에너지 수요, 물 소비량을 15%에서 82%까지 줄일 수 있음을 발견했다.
콜드 플레이트 및 액침 냉각 분석
과학 기반 목표 이니셔티브(SBTi)는 2030년까지 온실가스 배출량을 42% 감축해야 넷-제로를 달성하고 지구 온난화를 1.5도(2.7화씨)로 제한할 수 있다고 주장한다.
데이터센터는 전통적인 사무실 건물보다 단위면적당 10~50배 더 많은 에너지를 소비한다. 미국 에너지부(DOE)에 따르면 2020년 전 세계 전기 수요의 약 1.5%(약 300 테라와트시)를 차지했다. 이 수치는 계속 증가할 것으로 예상된다. 또한 데이터센터를 식히는 전력은 데이터센터 전체 에너지 수요의 최대 40%를 소비할 수 있다.
마이크로소프트 연구진은 라이프사이클 평가를 통해 클라우드 데이터센터의 냉각 기술이 환경에 미치는 전반적 영향을 분석했다. 이 분석은 건물부터 내부 장비, 운영 과정에서 사용되는 자원, 데이터센터의 수명 종료까지 모든 요소의 영향을 평가했다는 점에서 두드러진다. 연구진은 이 분석이 ‘설계 단계에서의 지속 가능성’으로 이어질 수 있다고 강조했다.
구체적으로 연구진은 콜드 플레이트(직접 칩 냉각), 단상 액침, 이중상 액침 냉각 기술을 분석했다.
콜드 플레이트 냉각은 열 발생원(칩) 옆에 금속판을 배치하고, 이 금속판을 통해 흐르는 냉각제를 이용해 서버에서 열을 직접 흡수한다.
액침 냉각은 서버를 절연 유체로 가득 찬 탱크에 완전히 빠뜨려 열을 흡수한다. 단상 냉각은 대류 현상을 통해 하드웨어에서 유체로 열을 전달하며, 펌프가 유체를 서버를 통과시켜 냉각된 후 다시 순환시키는 구조다. 이상 냉각은 낮은 끓는점(30~50°C)을 가진 유체를 사용해 열을 제거하고 증발시킨 후, 증기가 응축기 코일로 보내져 액체로 재응축되어 탱크로 돌아간다.
연구진은 실험을 통해 전통적인 공기 냉각 방식과 비교한후 다음과 같은 결과를 얻었다:
• 콜드 플레이트는 온실가스 배출량을 15%~16%, 에너지 사용량을 15%, 물 사용량을 31%~50% 감소시켰다;
• 단상 냉각은 온실가스 배출량을 13%~16%, 에너지 소비를 15%, 물 사용량을 45%~80% 감소시켰다;
• 이중상 냉각은 온실가스 배출량을 20%~21%, 에너지 소비를 20%, 물 사용량을 48%~82% 감소시켰다.
연구진은 액체 냉각을 100% 재생 에너지와 결합할 경우 물 절감 효과가 더욱 크게 나타났다고 지적했다(추가 13%에서 48%까지). 이는 재생 에너지원의 물 사용량이 적기 때문이다.
장점과 단점
각 냉각 방법에는 당연히 장단점이 있다. 마이크로소프트 연구진은 콜드 플레이트 시스템이 기존 인프라 재설계 없이 칩 수준 냉각을 제공하며 가장 쉽게 적용할 수 있다고 밝혔다.
연구진은 이어 “공기 냉각이 압도적으로 많은 전력을 소비한다. 또한 콜드 플레이트 냉각 네트워크의 구리 부품은 각 IT 사이클마다 서버마다 교체해야 한다”라고 설명했다.
한편, 단상 침지 방식은 이중상 시스템보다 복잡성과 비용이 낮으면서도 우수한 환경 성능을 보여준다. 그러나 가연성 탄화수소 오일을 사용해야 하기에 새로운 안전 프로토콜이 요구될 수 있다.
이중상 침지 방식은 가장 높은 에너지 및 물 효율성을 구현한다. 그러나 이 방식은 합성 물질로 구성된 PFAS(per- 및 polyfluoroalkyl substances) 기반 냉매를 사용한다. 이 물질은 분해가 어렵고 건강에 해로울 수 있어 미국과 유럽 연합에서 규제 강화 압력을 받고 있다.
또한 연구진은 이중상 침지 방식의 경우 설치가 더 복잡할 수 있어 신규 고밀도 구축에 더 적합하다고 설명했다. 반면 콜드 플레이트는 리모델링에 가장 적합하며, 단일상 침지 방식은 중간 밀도 신규 구축에 이상적이라고 덧붙였다.
연구진은 종합적으로 액체 냉각이 냉각 비용을 줄이고 서버 밀도를 높여 단위면적당 컴퓨팅 성능을 향상시키며 워크로드당 총 인프라 비용을 감소시킨다고 강조했다. 또 액체 냉각은 고장률을 줄이고 높은 가동 시간/가용성을 지원하며 장비 수명을 연장해 유지보수 및 교체 비용을 절감한다는 설명이다.
특히 연구진은 이러한 인프라가 AI 워크로드에 필요한 전력 소비가 높은 고밀도 인프라에 적합하다고 평가했다. 이들은 오버클럭킹(CPU의 클럭 속도를 공장 설정보다 높여 초당 처리 명령어 수를 증가시키는 것)과 더 밀집된 랙 배치를 허용해 데이터센터 용량을 증가시킨다.
“고도로 최적화된 콜드 플레이트 또는 단상 액침 냉각 기술은 이중상 액침 냉각과 동일한 성능을 발휘할 수 있다. 세 가지 액체 냉각 기술 모두 매력적인 옵션이다”라고 연구진은 작성했다.
고려해야 할 요소
마이크로소프트 연구진은 액체 냉각 기술을 도입할 때 고려해야 할 요소가 많다고 설명했다. 먼저 환경, 건강, 안전 분석과 전체 라이프사이클 영향 분석을 수행할 것을 권장했다.
“소프트웨어, 칩, 서버, 랙, 탱크, 냉각 유체 등 데이터센터 생태계 전체를 분석하면 환경 영향 절감 가능성을 이해할 수 있다”라고 그들은 설명했다.
유체 공급업체 및 규제 기관과 조기에 협력해 화학 성분, 폐기 방법, 준수 위험을 이해하는 것도 중요하다. 아울러 관련 사회경제적, 지역 사회, 비즈니스 영향도 마찬가지로 평가해야 한다.
보다 구체적인 환경 고려 사항으로는 오존 고갈과 온실가스 배출 잠재력 등이 있다. 연구진은 운영자가 오존 고갈 잠재력(ODP)이 낮거나 없는 유체만을 사용해야 하며, 수소불화탄소나 이산화탄소는 사용하지 않아야 한다고 강조했다. 유체의 점도(두께나 점성), 가연성, 전체적인 휘발성도 분석해야 한다. 이 밖에 운영자는 생물체(특히 어류) 내 화학물질의 축적(생물축적)이 최소화되고 육상 및 수생 독성이 낮은 유체만을 사용해야 한다.
마지막으로, 데이터센터 운영자는 서버 수명과 고장률을 모니터링하고, 성능 가동 시간을 추적하며, 이에 따라 IT 교체 주기를 조정해야 한다.
연구진은 “냉각 기술 선택 시 추가 고려 사항으로는 시장 출시 시간, 규제 및 공급망 환경, 기술 복잡성, 구현 비용이 포함된다”라고 전했다.
[email protected]
Read More from This Article: 액체 냉각 기술의 환경적 영향을 ‘숫자’로 도출··· MS 연구진, 네이처에 논문 게재
Source: News