앤트로픽은 프로젝트 글래스윙(Project Glasswing)에 참여 중인 50개 이상의 파트너사와 함께 자사 소프트웨어에서 약 1만 개의 치명적 또는 고위험 수준 취약점을 발견했다고 밝혔다.
앤트로픽은 지난 4월 클로드 미토스 프리뷰(Claude Mythos Preview)를 기반으로 한 사이버보안 프로젝트를 출범했다. 당시 회사는 참여 파트너들이 이를 방어형 보안 업무에 활용할 것이라고 설명했다.
앤트로픽은 프로젝트 글래스윙을 만든 배경에 대해 “새 프론티어 모델의 역량이 한 가지 냉혹한 사실을 드러냈다”며 “AI 모델이 소프트웨어 취약점을 탐지하고 악용하는 능력에서 최고 수준 인간 전문가를 제외한 대부분을 뛰어넘는 수준에 도달했다는 점”이라고 밝혔다.
당시 회사는 1억 달러(약 1,370억 원) 이상의 사용 크레딧과 함께 오픈소스 보안 단체를 위한 추가 기부금 400만 달러(약 60억 원)도 지원하겠다고 발표했다.
앤트로픽은 지난주 말 공개한 업데이트에서 “지난 몇 달 동안 미토스 프리뷰를 활용해 인터넷과 자사 인프라의 핵심 기반이 되는 1,000개 이상의 오픈소스 프로젝트를 분석했다”고 설명했다.
이 과정에서 미토스 프리뷰는 총 6,202개의 고위험 또는 치명적 취약점을 발견했으며, 이 가운데 1,752건은 이후 6개 독립 보안 연구기관의 검증을 거쳤다.
버그 리포트 홍수에 시달리는 메인테이너
앤트로픽은 검증을 거친 1,752건 가운데 90.6%인 1,587건이 실제 취약점으로 확인됐으며, 이 중 62.4%인 1,094건은 고위험 또는 치명적 수준으로 판정됐다고 밝혔다.
회사는 “미토스 프리뷰가 추가 취약점을 더 발견하지 않더라도 현재의 검증 후 실제 취약점 판정 비율을 기준으로 하면, 오픈소스 코드에서만 약 3,900개의 고위험·치명적 취약점을 찾아낸 셈이 된다”며 “이는 프로젝트 글래스윙 파트너사에서 발견된 취약점을 제외한 수치”라고 설명했다.
보고서 작성진은 오픈소스 유지관리자들이 기존 유지보수 부담에 더해 AI가 생성한 저품질 버그 리포트까지 대량으로 처리해야 하는 상황에 놓였다고 지적했다.
이들은 “일부 유지관리자는 현재 심각한 인력·역량 부족 상태에 있다”며 “패치 설계에 더 많은 시간이 필요하다며 취약점 공개 속도를 늦춰달라고 요청한 사례도 있었다”고 설명했다.
앤트로픽은 현재까지 유지관리자에게 총 530건의 고위험·치명적 취약점을 공개했으며, 추가로 827건을 더 공개할 계획이라고 밝혔다.
현재까지 공개된 530건 가운데 실제 패치가 완료된 사례는 75건이며, 공개 권고문이 발표된 사례는 65건이다.
회사 측은 공개 수치가 상대적으로 적은 이유로 ▲협력형 취약점 공개 정책에 따른 90일 유예 기간이 아직 끝나지 않았고 ▲일부 취약점은 별도 공개 없이 패치됐을 가능성이 있으며 ▲보안 생태계 전반이 이미 과부하 상태라는 점을 들었다.
보고서 작성진은 “취약점을 찾는 것은 점점 쉬워지고 있지만 이를 수정하는 일은 여전히 어렵다”며 “이 격차가 사이버보안 업계의 중대한 과제가 되고 있다”고 분석했다.
그럼에도 프로젝트 글래스윙의 성과를 바탕으로 앤트로픽은 기업 고객 대상 ‘클로드 시큐리티(Claude Security)’ 베타 서비스를 출시했다. 또한 합법적인 보안 전문가가 일부 안전장치 제한 없이 모델을 활용할 수 있도록 하는 ‘사이버 검증 프로그램(Cyber Verification Program)’도 시작했다.
IT 리서치 기업 인포테크 리서치 그룹(Info-Tech Research Group)의 수석 애널리스트 마크 타우셰크는 앤트로픽이 프로젝트 글래스윙을 통해서만 클로드 미토스 프리뷰 접근을 제한하고 있는 점에 주목했다.
타우셰크는 “이는 프론티어 AI 역량이 사이버보안 분야에서 실제 임계점을 넘어섰다는 가장 분명한 신호 가운데 하나”라고 평가했다.
이어 “앤트로픽은 시스템 카드 공개와 프로젝트 글래스윙 운영 구조 측면에서 일정 수준 투명성을 보여줬다는 점에서 평가받을 만하다”면서도 “문제를 투명하게 공개하는 것과 실제 해결하는 것은 전혀 다른 문제”라고 지적했다.
타우셰크는 이번 업데이트가 IT·보안 리더들에게 새로운 현실을 보여줬다고 분석했다.
그는 “소프트웨어 취약점 발견 비용이 급격히 낮아졌다는 사실을 이제 IT와 보안 리더들이 받아들여야 한다”며 “AI 모델 하나가 몇 주 만에 핵심 소프트웨어에서 수천 건의 심각한 취약점을 찾아낼 수 있다면, 취약점 발견과 실제 악용 사이의 시간 간격은 계속 짧아질 것”이라고 설명했다.
이어 “여전히 분기 단위 패치를 유지하는 조직은 불과 얼마 전보다 훨씬 더 큰 위험에 노출돼 있다”고 경고했다.
타우셰크는 일부 유지관리자가 앤트로픽에 공개 속도 조절을 요청한 현상을 보안 강화에 대한 저항으로 봐서는 안 된다고 강조했다.
그는 “이는 수년간 누적돼온 역량 부족 문제를 보여주는 사례”라며 “기업이 의존하는 많은 오픈소스 프로젝트는 소규모 팀이나 자원봉사자 중심으로 운영되고 있고, 이들 상당수는 본업이 따로 있는 사람들”이라고 설명했다.
사이버보안 병목, 이제는 ‘탐지’ 아닌 ‘패치 대응’
타우셰크는 이어 “해당 코드에 의존하는 조직은 매우 대규모로 운영되고 있다”며 “AI는 취약점 발견 속도를 높일 수 있지만, 발견 내용을 검증하고 안전한 패치를 설계·테스트·배포할 인간 역량까지 만들어내지는 못한다”고 설명했다.
또한 “이런 변화는 방어 심층화(defense-in-depth) 전략 자체를 다시 고민하게 만들고 있다”고 덧붙였다.
딥코브 사이버시큐리티(DeepCove Cybersecurity)의 CTO 켈만 메구 역시 프로젝트 글래스윙 결과가 놀랍지 않다고 평가했다.
메구는 “숙련된 연구자가 활용할 경우 AI의 취약점 탐지와 악용 능력이 크게 빨라진다는 사실을 우리 회사는 이미 약 2년 전에 파악했다”며 “지금 달라진 점은 대규모언어모델(LLM) 프롬프트를 다루기 위한 진입 장벽이 크게 낮아졌다는 것”이라고 설명했다.
이어 “이 흐름은 앞으로 더욱 가속화될 것이며, 이제 이것이 새로운 현실이 됐다”고 진단했다.
메구는 딥코브 역시 대응 속도를 높이고 있다고 밝혔다. 그는 “현재 회사는 패치와 통제 평가 프로세스를 더욱 빠르게 운영하고 있다”며 “서비스와 고객 인프라의 취약점을 탐지하고 패치하거나 보완 통제를 구축하기 위해 LLM도 적극 활용하고 있다”고 설명했다.
메구는 “이제 버그를 찾는 비용은 매우 낮아졌지만, 패치는 여전히 느리고 상당 부분 인간 중심 프로세스에 의존하고 있다”고 분석했다. 이어 “고객사는 변경 관리 절차와 규제 테스트 일정, 시스템 변경 제한 기간 등을 운영하고 있기 때문에 현재 속도를 따라가는 것이 현실적으로 쉽지 않다”고 말했다.
메구는 이번 앤트로픽 업데이트가 보여주는 핵심은 사이버보안 병목 지점의 변화라고 평가했다.
그는 “이제 병목은 취약점 발견이 아니라 패치를 얼마나 빠르게 적용하고 고객 방어 체계를 얼마나 신속하게 조정할 수 있는지로 이동했다”고 강조했다.
이 같은 분석은 앤트로픽의 설명과도 일치한다.
앤트로픽은 “이런 취약점을 수정하는 과정의 핵심 병목은 분류·보고·패치 설계·배포를 수행할 인간 역량 부족”이라고 설명했다.
메구는 새로운 패치 주기가 조직 운영 측면에서도 상당한 압박을 만들고 있다고 지적했다.
그는 “새로운 패치 사이클이 주는 운영 압박은 공격 위협만큼이나 즉각적”이라며 “이에 대응하기 위해 자체 개발 파이프라인에 AI 기반 감사 기능을 도입하고 중요 의존성에 대한 고객 패치 SLA도 강화했다”고 설명했다.
다만 “이를 관리하는 일은 결코 쉽지 않다”며 “LLM이나 AI 에이전트를 완전히 자율적으로 신뢰하지는 않으며, 이 때문에 운영자 보조 기반 LLM 통합 프로세스 역시 크게 바뀌고 있다”고 덧붙였다.
뷰세론 시큐리티(Beauceron Security)의 CEO 데이비드 시플리는 이번 발표 수치를 보다 냉정하게 볼 필요가 있다고 지적했다.
시플리는 “사람들의 관심을 끈 헤드라인은 1만 개 잠재 취약점과 그중 6,000개의 치명적 취약점이라는 숫자”라며 “하지만 실제 수치를 정리해보면 인간 검증을 거쳐 유효성이 확인된 것은 약 1,500건 수준”이라고 설명했다.
이어 “검증된 1,752건 가운데 약 90%가 실제 취약점으로 판명됐다고 하지만, 전체 발견 건수 기준으로 보면 여전히 약 15% 수준에 불과하다”고 평가했다.
시플리는 무엇보다 취약점 탐지 비용 공개가 필요하다고 주장했다.
그는 “취약점 하나를 찾기 위해 얼마나 많은 토큰을 소모하는지 궁금하다”며 “분당 500달러(약 68만 원) 수준이라는 이야기도 들었는데 실제 비용이 어느 정도인지 매우 궁금하다”고 말했다.
이어 “이 정도 규모의 취약점을 발견했다고 말할 수 있다면, 그 과정에 얼마나 많은 컴퓨팅 자원이 들어갔는지도 설명할 수 있어야 한다”고 지적했다.
시플리는 궁극적인 해결책은 소프트웨어 제작사의 책임 강화라고 강조했다.
그는 “소프트웨어 제작사가 자사 소프트웨어에 책임을 지도록 만드는 것이 유일한 해법”이라며 “현재 혼란의 근본 원인은 바로 그 책임 구조의 불균형에 있다”고 말했다.
dl-ciokorea@foundryco.com
Read More from This Article: AI가 취약점 1만 건 캐냈지만…진짜 병목은 ‘패치’였다
Source: News


