앤트로픽은 최신 대형언어모델인 클로드 오푸스 4.6을 지난 목요일에 공개했지만, 그 이전부터 이미 내부적으로 이 모델을 활용해 오픈소스 소프트웨어의 제로데이 취약점을 식별해 왔다.
이번 시험에서 앤트로픽은 클로드를 가상 머신 환경에 배치하고 최신 버전의 오픈소스 프로젝트에 접근할 수 있도록 했다. 여기에 일반적으로 사용되는 각종 유틸리티와 취약점 분석 도구를 제공했지만, 해당 도구를 어떻게 활용해야 하는지나 구체적으로 어떤 방식으로 취약점을 찾아야 하는지에 대한 지침은 제시하지 않았다.
이처럼 별도의 안내가 없는 상황에서도 클로드 오푸스 4.6은 고위험 수준의 취약점 500건을 찾아냈다. 회사 블로그에 따르면, 앤트로픽 내부 인력은 대형언어모델이 환각을 일으키거나 오탐을 보고하지 않았는지 확인하기 위해, 개발자에게 버그를 전달하기 전에 해당 결과를 검증하고 있다.
앤트로픽은 “AI 언어 모델은 이미 새로운 취약점을 식별할 수 있는 수준에 도달했으며, 머지않아 숙련된 인간 보안 연구자조차 능가하는 속도와 규모로 발전할 수 있다”고 설명했다.
앤트로픽은 자사 소프트웨어가 자동화된 공격에 활용된 사례가 이미 알려진 만큼, 소프트웨어 보안 업계에서의 평판을 개선하려는 의도도 있는 것으로 풀이된다.
이미 다른 기업들도 버그 헌팅에 AI를 활용하고 있으며, 이번 사례는 이러한 기술적 가능성을 추가로 입증하는 사례로 평가된다.
다만 일부 소프트웨어 개발자들은 품질이 낮은 AI 생성 버그 보고서가 대량으로 유입되면서 부담을 느끼고 있다. 실제로 AI 가속 버그 헌터의 남용 문제로 인해 버그 바운티 프로그램을 중단한 사례도 최소 한 곳 이상 존재하는 것으로 전해졌다.
dl-ciokorea@foundryco.com
Read More from This Article: 클로드 AI, 고위험 소프트웨어 취약점 500건 발견
Source: News

