지난주 필자로서는 이례적인 조언을 한 고객에게 전했다. 베어메탈 클라우드 서비스(bare-metal cloud service)를 추천한 것이다. 그 고객이 베어메탈과 잘 어울리는 목적을 가지고 있었기 때문이었다.
일반적인 퍼블릭 클라우드 환경에서 대부분의 사용자는 물리적 하드웨어 위에서 실행되는 운영체제 인스턴스인 가상 머신과 상호 작용한다. 하이퍼바이저를 통해 서로 분리되는 이러한 VM은 여러 사용자가 동일한 하드웨어를 안전하고 효율적으로 공유할 수 있도록 한다. 그러나 이러한 추상화는 성능 문제를 유발할 수 있으며, 서버의 물리적 리소스에 대한 사용자 제어를 제한한다.
베어메탈 클라우드 서비스는 이와 대비되는 개념이다. 사용자에게 특정 물리적 서버를 독점적인으로 제공한다. 하이퍼바이저, 가상 머신이 없고, 추가적인 추상화도 없다. 가상화로 인한 지연이나 제한 없이 CPU, GPU, 메모리 자원과 같은 원시 컴퓨팅 파워를 완전히 접근할 수 있다는 의미다. 이러한 특성으로 인해 베어메탈 클라우드는 클라우드 컴퓨팅의 유연성과 전용 온프레미스 서버의 성능을 모두 잡을 수 있게 해준다.
이러한 독특한 포지셔닝 덕분에 베어메탈 클라우드는 고성능 요구 사항이 있는 산업, 이를 테면 AI나 HPC 컴퓨팅, 특수 하드웨어 또는 저지연 환경이 필요한 산업에서 점점 더 중요해지고 있다.
베어메탈의 사용 사례
베어메탈 클라우드가 모든 사용례에 적합하지는 않지만 특정 상황에서는 빛을 발한다. 고성능을 추구하며 단기적인 작업량에 대한 비용 최적화를 추구하며 모종의 커스터마이션 요구로 인해 하드웨어에 직접 액세스해야 하는 경우가 대표적이다. 베어메탈 클라우드가 장점을 발휘하는 몇 가지 중요한 사용 사례는 다음과 같다.
AI 및 ML 모델 훈련. 이 집중적 작업에는 엄청난 연산 능력이 필요하다. 베어메탈 클라우드가 가상화로 인한 오버헤드 없이 제공할 수 있는 GPU와 기타 특수 가속기가 이러한 워크로드와 잘 어울린다. 특히 AI 모델을 훈련은 주기적으로 집중적인 작업을 통해 이뤄지는 경우가 많기에, 베어메탈 클라우드는 하드웨어를 직접 구매하는 것보다 더 저렴한 대안일 수 있다.
HPC 애플리케이션. 시뮬레이션, 데이터 모델링, 연구 및 분석 등의 작업은 짧은 지연 시간과 하드웨어 자원의 완전한 활용이 가능한 환경을 필요로 한다. 베어메탈 서버는 가상화에 수반되는 비효율성을 제거할 수 있기 때문에 성능 중심 워크로드에 이상적이다.
특수한 워크로드. Arm 또는 IBM의 Z 메인프레임 아키텍처와 같은 표준 x86 프로세서를 뛰어넘는 하드웨어 아키텍처의 이점을 필요로 하는 특정 애플리케이션들이 있다. 베어메탈 클라우드를 사용하면 이러한 비표준 아키텍처에 액세스하여 테스트하거나, 이를 위해 설계된 워크로드를 실행할 수 있다. 전형적인 가상 환경에서 다소 구현하기 어려운 장점이다.
엄격한 규제를 받는 산업. 정부, 금융, 의료 및 기타 규제 대상 산업은 규제 또는 규정 준수 의무를 충족하기 위해 전용 서버가 필요할 수 있다. 베어메탈 클라우드는 클라우드 배포의 유연성을 유지하면서 고립성을 확보할 수 있게 해준다.
베어메탈 서비스 업체
베어메탈 클라우드의 고유한 이점을 제공하는 시중의 옵션은 다양하다. 다음은 이 분야에서 인기 있는 제공업체의 목록이다(알파벳 순서대로 나열).
• 아마존 EC2 베어메탈 인스턴스. AWS 산하의 이 인스턴스는 일반 EC2 VM과 유사하게 작동하기에 기존 AWS 사용자가 쉽게 전환해 사용할 수 있다. 그러나 아마존의 베어메탈 제품은 전문 제공업체에 비해 일부 제어 기능이 제한적이다.
• 애저 베어메탈 인프라. 마이크로소프트의 애저 플랫폼은 강력한 베어메탈 하드웨어와 다양한 구성을 제공한다. 단 전 세계 리전별로 사용성이 제한적이다.
• 디지털오션 베어메탈 GPU. 디지털오션은 인공지능과 머신러닝이 필요한 중소 규모 사용자를 위해 설계한 베어메탈 서버(GPU 강화)를 제공한다.
• 에퀴닉스 메탈. 에퀴닉스의 글로벌 데이터센터와 인프라를 통해 광범위한 지리적 범위를 확보하고 있다. 그러나 이 서비스는 2026년까지 중단될 예정이다.
• IBM 클라우드. IBM의 베어메탈 서비스는 표준 x86 서버 외에도 Z 메인프레임과 리눅스원(LinuxONE)과 같은 아키텍처를 포함하고 있다는 점에서 차별화된다.
• 오픈메탈. 베어메탈 서비스를 특화하고 있는 오픈메탈은 오픈소스인 오픈스택 도구를 관리에 활용한다. 전 세계적으로 데이터센터의 수가 적지만, 포괄적인 관리 옵션을 제공함으로써 강력한 선택지로 인정받고 있다.
• 피닉스NAP. 인프라스트럭처 코드(IaC) 기능으로 잘 알려진 피닉스NAP(PhoenixNAP)은 API, CLI 도구 등을 통해 베어메탈 자원을 관리할 수 있는 유연한 방법을 제공하고 있다. 그러나 지리적 범위가 상대적으로 제한적이다.
• 랙스페이스(Rackspace). 클라우드 분야의 베테랑 랙스페이스는 광범위한 구성 옵션과 강력한 지원을 통해 엔터프라이즈 고객을 위한 베어메탈 서비스를 제공하고 있다.
• 벌처. 보다 저렴한 옵션인 벌처(Vultr)는 전 세계 24개 데이터센터에서 베어메탈 서버를 제공하지만, GPU 지원 변형 옵션은 제공하지 않는다.
베어메탈의 단점
그렇다면 왜 베어메탈 옵션이 많이 사용되지 않는 걸까? 장단점은 다음과 같다.
• 높은 비용. 베어메탈 리소스는 일반적으로 VM 기반 클라우드 제품에 비해 비싸다. 베어메탈은 더 나은 성능을 제공하지만, 이러한 환경이 꼭 필요한 애플리케이션에 대해서는 비용효율적이지 않을 수 있다.
• 제한된 애플리케이션 이동성. 가상화된 환경용으로 작성되었거나 특정 퍼블릭 클라우드의 기능에 맞춰진 애플리케이션을 베어메탈 클라우드에서 최적의 상태로 안전하게 실행하기 위해 상당한 재작업이 필요할 수 있다. 또한, 베어메탈 호스팅 서비스에는 VM 기반 서비스에 내장된 확장 및 부하 분산 기능이 없다.
• 지리적 한계. 오픈메탈과 피닉스NAP 등의 업체는 지리적 데이터센터 가용성 문제로 인해 글로벌 지연 이슈에 직면한 기업에 적합하지 않다.
• 유연성 감소. 베어메탈 하드웨어를 사용하면 물리적으로 사용 가능한 것 이상으로 프로비저닝할 여지가 거의 없다. 추가적인 메모리나 하드웨어 확장을 동적으로 수행할 수 없다. 성능과 제어 기능을 위해 클라우드 컴퓨팅의 유연성 일부를 희생해야 한다.
모든 주요 기술 결정과 마찬가지로, 베어메탈 클라우드의 선택은 비즈니스 전략과의 일치가 요구된다. 전략적으로 사용될 때, 베어메탈 클라우드는 막대한 가치를 창출할 수 있지만, 그럴 때는 명확하게 정의된 목적을 달성할 때만 가능하다. 필자가 지금까지 경험한 바에 따르면, 베어메탈 클라우드를 꼭 써야하는 사례가 그리 많지는 않다. 아마 또 앞으로 1년 동안은 추천할 이유가 희박해 보인다.
[email protected]
Read More from This Article: 기고 | 베어메탈 클라우드를 선택해야 할 때
Source: News