콘텐츠 전송 네트워크(CDN) 기업 클라우드플레어에서 장애가 발생하면서 전 세계 온라인 서비스와 웹사이트가 접속 중단 문제를 겪었다. 이는 원래 클라우드플레어가 고객을 대신해 방어해야 하는 서비스 중단 사태가 발생한 셈이다.
클라우드플레어는 지난 18일 오후 8시 48분, 상태 페이지를 통해 “내부 서비스 성능 저하가 발생하고 있으며, 일부 서비스가 간헐적으로 영향을 받을 수 있다. 현재 복구에 집중하고 있으며 문제를 해결하는 대로 업데이트할 예정”이라고 밝혔다.
약 90분 후 클라우드플레어는 문제 해결 과정에서 런던 지역의 워프(WARP) 서비스를 비활성화해 해당 지역 사용자가 접속할 수 없게 됐다고 보고했다. 몇 분 뒤 회사는 원인을 파악했다며 런던 지역의 워프 접속을 다시 활성화했고, 워프와 클라우드플레어 액세스에 변경 사항을 적용해 복구할 수 있게 됐다고 전했다. 워프는 기업이 제로 트러스트 정책을 구현할 수 있도록 지원하는 DNS 프록시다.
그러나 조치 이후에도 다수의 웹사이트는 여전히 접속이 불가능했으며, 화면에는 “내부 서버 오류 코드 500”과 같은 메시지가 표시됐다.
사고 발생 후 약 3시간이 지난 시점에도 클라우드플레어는 “애플리케이션 서비스 고객 대상 복구 작업을 계속 진행하고 있다”라고 밝혔다.
다운디텍터닷컴(Downdetector.com)은 이때 전 세계 웹 서비스 장애 신고가 급증했다고 전했다. 이는 클라우드플레어 장애 시점과 겹쳤으며, 오픈AI의 챗GPT, 온라인 디자인 도구 캔바(Canva), 아마존웹서비스(AWS) 등에서도 문제가 보고됐다. 블룸버그는 오픈AI 챗GPT 서비스와 소셜미디어 플랫폼 X(구 트위터) 장애 역시 클라우드플레어 문제로 발생한 것으로 보인다고 보도했다.
클라우드플레어는 글로벌 네트워크 장애를 공식 인정하기 31분 전, 이미 자사 지원 포털에서 문제가 발생했다고 보고했다. 오후 8시 17분 공지를 통해 “지원 포털의 서드파티 업체에서 장애가 발생해 고객이 지원 티켓을 조회하거나 답변하는 과정에서 오류가 발생할 수 있다. 고객 문의에 대한 답변 자체는 영향을 받지 않았고, 비즈니스·엔터프라이즈 고객은 클라우드플레어 대시보드의 라이브 채팅 또는 엔터프라이즈 긴급 전화 라인을 통해 연락할 수 있다”라고 설명했다. 이어 “서드파티 업체와 함께 영향 범위를 파악하고 문제를 완화하기 위한 작업을 진행 중”이라고 언급했다.
지원 포털 장애와 이후 발생한 CDN 서비스 장애가 연관됐다는 증거는 아직 나오지 않았지만, 최근 몇 달 동안 IT 벤더를 겨냥한 공격에서 지원 포털이 취약 지점으로 드러난 사례가 잇따르고 있다. 디스코드(Discord)에서는 서드파티 고객 지원 업체가 침해되면서 고객 데이터가 유출됐고, 세일즈포스 역시 일부 고객 계정이 침해된 보안 문제가 발생했다. 세일즈포스는 이에 대해 자사 책임이 아니라는 입장을 내놓았는데, 여러 사례에서 세일즈포스와 연동되는 서드파티 AI 챗봇 서비스인 세일즈로프트 드리프트(Drift)가 취약 지점으로 지목됐다.
지난 9월 버라이즌은 CISO의 71%가 지난 1년 동안 서드파티 보안 사고를 겪었다고 발표했다. IDC 역시 기업에서 서드파티 리스크 관리가 핵심 우려사항으로 떠오르고 있다고 분석했다.
불과 한 달 전에도 여러 IT 부서가 활용하는 또 다른 서드파티 서비스에서 광범위한 장애가 발생했다. 지난 10월 20일 AWS의 다이나모DB(DynamoDB) 서비스에서 오류가 발생하며 다른 AWS 서비스로 장애가 연쇄적으로 확산됐고, 결국 다수 고객사 시스템까지 영향을 미쳤다.
dl-ciokorea@foundryco.com
Read More from This Article: 클라우드플레어 접속 장애에 챗GPT·캔바·X 먹통···원인은 서드파티?
Source: News

