과거 검색 엔진 크롤링은 웹으로 다시 트래픽을 돌려주는 이로운 구조였지만, 이제는 상황이 다르다. AI 기업들은 웹에서 수집한 콘텐츠를 학습 데이터로 활용해 요약·응답·개요 형태의 파생 콘텐츠를 제공하고, 사용자는 원본 사이트를 방문하지 않고도 필요한 정보를 얻게 된다. 이는 트래픽과 광고 수익을 감소시켜 콘텐츠 제작자의 수익 구조를 위협할 뿐 아니라, 지적 재산권 보호·데이터 출처 확보·콘텐츠 오남용 문제를 야기하는 구조적 변화다. 콘텐츠 제작자가 자신의 데이터에 대한 통제력을 잃게 되는 것이다.
더 큰 문제는 AI 기반 봇이 보안 위협으로 진화하고 있다는 점이다. 일부 악성 봇은 단순 크롤링을 넘어 웹 취약점을 자동으로 탐색하고, 계정 탈취, 사기성 결제 시도 등 다양한 공격을 수행한다. 예를 들어, 기업이 증시 마감 후 발표할 예정이었던 중요 비공개 재무 정보가 악성 봇에 의해 유출될 경우, 이는 불법 주식 거래와 규제 위반으로 이어져 회사에 치명적인 결과를 초래할 수 있다.
AI 봇의 양적 확산은 이제 무시하기 어려운 수준이다. 인터넷 현황 모니터링 플랫폼 클라우드 레이더의 데이터에 따르면, 특히 메타의 AI 봇 ‘메타-익스터널 에이전트(Meta-External Agent)’는 1년 새 요청량이 843%라는 폭발적인 증가세를 보였다. 오픈AI의 GPT봇(GPTBot) 역시 147% 증가하며 기존의 IP 차단이나 단순 레이트 리미팅만으로는 이들을 통제하기 어려워졌다는 것을 반증한다. 더불어, AI가 ‘CAPTCHA(캡차)’를 학습해 우회하는 사례도 늘고 있다.
이러한 변화 속에서 기업과 퍼블리셔는 악의적인 AI 봇을 차단하고 콘텐츠 스크래핑을 제어할 수 있는 효과적인 방법을 찾아야 한다. AI가 만들어내는 새로운 비즈니스 기회를 차단하지 않으면서도, 조직의 데이터·보안·브랜드를 보호하려면 기존보다 훨씬 정교한 접근이 필요하다.
따라서 AI 봇 위협에 대응하고 콘텐츠 통제권을 되찾기 위해서는 다음과 같은 다중 계층 보안 전략구축이 요구된다:
첫째, 기초 단계인 정적 제어(Layer 1)다. 이는 대규모 봇 공격을 견디고, AI 기반 봇이 기존 방어선을 쉽게 우회하지 못하도록 하는 출발점이 된다. CAPTCHA를 사용하지 않는 인증 방식, 다중 인증(MFA), 레이트 리미팅과 같은 요소들은 실제 사용자의 경험을 저해하지 않으면서도 자동화된 시도를 효과적으로 차단한다. 또한 악성 봇을 정상 페이지 대신 대체 콘텐츠로 유도해 리소스를 소비시키는 기법도 정적 제어의 일환으로 활용될 수 있다.
둘째, 동적 제어(Layer 2)는 예측적 방어 능력을 더한다. 정적 제어 위에 더해지는 동적 제어는 변화하는 AI 봇의 움직임을 조기에 감지하고 대응하는 역할을 한다. 실시간 위협 인텔리전스 분석을 통해 새로운 공격 패턴이 도달하기 전에 차단할 수 있고, 상세한 트래픽 로그는 사람이 보기 어려운 행동 패턴의 차이를 식별하는 데 도움을 준다. 머신러닝(ML) 기반 행동 분석은 정상 사용자와 비정상적 트래픽의 간극을 자동으로 파악해 이상 징후를 식별한다. 이러한 동적 제어는 AI 봇이 시시각각 패턴을 바꾸며 등장하는 환경에서 필수적이다.
셋째, 가장 중요한 세분화된 거버넌스(Layer 3)다. 이는 무조건적인 차단 전략에서 벗어나, 어떤 봇이 어떤 목적을 가지고 어떤 페이지에 접근할 수 있는지를 조직이 직접 결정하는 체계를 의미한다. 이를 위해 조직은 먼저 AI 감사(AI Auditing) 기능을 통해 어떤 AI 봇이 사이트에 접근하고 있는지 투명하게 파악해야 한다. 봇이 접근 목적과 소속 서비스를 암호화 서명으로 증명하도록 요구함으로써, 봇의 신뢰성을 확보하고 정식 크롤러와 비정상적인 접근을 구분할 수 있다. 더 나아가, 페이지 단위로 접근 권한을 조정해 광고 기반 수익 페이지는 차단하고 개발자 문서나 공공성 있는 자료는 허용하는 등 콘텐츠 성격에 따라 전략적 선택을 할 수 있다. 특히, 크롤링당 결제(pay-per-crawl) 모델을 적용하면 AI 기업이 데이터를 학습에 활용할 때 합당한 비용을 지불하도록 할 수 있어 콘텐츠 제작자에게 새로운 수익 모델을 열어줄 수 있다.
궁극적으로 이러한 다중 계층 전략은 인터넷이 AI를 중심으로 재편되는 흐름 속에서 콘텐츠 제작자와 기업이 다시 통제권을 확보하는 과정이다. 단순히 유해한 봇을 막는 것에 그치지 않고, 어떤 주체가 어떤 방식으로 콘텐츠를 활용할 수 있는지 선택할 수 있는 권한을 되찾는 방향으로 나아가야 한다. 이를 통해 조직은 AI가 만들어내는 위협으로부터 스스로를 보호하는 동시에, 새로운 인터넷 시대가 제공하는 기회를 보다 공정하고 안정적으로 활용할 수 있을 것이다.
*필자 조원균 클라우드플레어(Cloudflare) 한국 지사장은 한국 내 클라우드플레어의 입지 강화와 브랜드 인지도 제고에 주력하고 있으며, 세일즈 및 채널 파트너를 통한 고객 접점 최적화에도 집중하고 있다. 원균 지사장은 25년 이상 리더십 경험을 보유한 베테랑으로, 클라우드플레어 합류 전 F5, 포티넷, 시스코 등을 포함한 주요 글로벌 테크 기업에서 근무한 바 있다.
dl-ciokorea@foundryco.com
Read More from This Article: 클라우드플레어 기고| AI 시대, 콘텐츠 통제권을 위한 ‘허가 기반 인터넷’으로 전환해야
Source: News

