저작권 말썽 불가피?··· AI 코딩 에이전트의 법적 위험성

AI 코딩 에이전트가 향후 몇 년 안에 소프트웨어 개발의 상당 부분을 차지할 것으로 예상되는 가운데, 이러한 변화에는 지적 재산권 법적 리스크가 수반된다는 지적이 법조계에서 제기되고 있다.

AI 기반 코딩 에이전트는 오늘날 많은 프로그래머가 사용하는 AI 기반 코딩 어시스턴트 또는 코파일럿에서 한 단계 더 발전한 형태다. 이러한 코딩 에이전트가 잠재적으로 더 많은 소프트웨어를 작성하고 주니어 개발자의 역할을 대체할 가능성이 있기에 조직은 로봇 코더의 결과물을 모니터링해야 할 것이라고 기술에 정통한 변호사들은 말했다.

AI 저작권 소송을 이미 다수 제기돼 있다. 지금까지는 대부분 미디어 매체와 연예인이 제기한 것들이다. 원고들은 AI 공급업체가 자신들의 자료를 사용하여 AI 모델을 훈련시키거나 출력물에 자신들의 자료를 복사했다고 주장한다고 저작권 전문 법무 기업 패니치 슈발츠의 제프리 글럭 변호사는 설명했다.

그에 따르면 기업이 소스 코드를 공개하지 않더라도 문제가 발생할 수 있다. 글럭은 “결과물이 다른 이의 작업을 침해한 것일 수 있다. AI가 다른 저자의 지적 재산을 사용해 더 많이 훈련된다면, 결과물 또한 비슷해지기 쉽다”라고 말했다.

AI 훈련 방법

AI 코딩 에이전트가 코드 라인을 복사할 가능성만이 문제가 아니다. 법원은 AI 공급업체가 코드 외의 다른 자료를 AI 모델 학습에 사용할 수 있는지 여부를 결정해야 할 것이라고 글럭은 말했다. 그는 “대규모 언어 모델 영역에서는 아직 해결되지 않은 저작권 문제들이 있다”라고 설명했다.

법률 문제가 조만간 사라질 것 같지는 않다고 디케마 고셋 로펌의 IP 및 IT 전문 변호사인 마이클 워드는 예상했다. 그는 “AI를 사용하여 코드의 상당 부분을 작성할 수 있는 시대가 이미 열렸다. 사용자 인터페이스에 ‘내 애플리케이션이 이 작업을 수행하기를 원한다’라고 지시하면 코드가 생성된다”라고 말했다.

AI가 생성한 코드를 제대로 검토하지 않으면 소송에 노출될 수 있다. 그는 “차용할 수 있는 개별 코드 조각을 넘어 그 이면에서 많은 작업이 진행되고 있다. 한 소스에서 모두 차용한 것일까? 아니면 여러 소스에서 차용한 것일까? 무언가 진행되고 있는 것은 분명하다”라고 말했다.

사람이 작성한 코드도 저작권을 침해하거나 오픈소스 라이선스를 위반할 수 있기는 하다. 단 AI가 생성한 코드는 학습 데이터와의 관련성이 좀더 직접적이다. 여행 기술 회사인 트레볼루션 그룹의 데이터 과학 책임자 일리아 바디예브는 많은 AI 에이전트가 지적 재산권으로 보호되는 코드를 학습했을 가능성이 높다고 지적했다.

바디예브는 “즉 AI가 학습 데이터에서 독점 코드와 동일한 코드를 뱉어낼 수 있다는 것을 의미하며, 이는 큰 위험이다. 오픈소스일지라도 문제가 된다. 많은 오픈소스 프로그램은 비상업적 용도로만 사용하도록 되어 있다. AI가 코드를 생성할 때 해당 코드가 어떻게 사용될지 모르기 때문에 실수로 라이선스 약관을 위반할 수 있다”라고 말했다.

공급업체의 조치

실제로 마이크로소프트의 인기 AI 코딩 어시스턴트인 깃허브 코파일럿은 이에 대한 위험성을 인정하고 있다. “AI 모델을 학습하는 데 사용된 깃허브의 코드 예제와 일치할 수 있다”라는 것이다. 이미 이 코딩 어시스턴트는 공개 코드와 일치하는 제안을 감지하고 억제하는 코드 참조 필터를 옵션으로 제공한다. 나아가 사용자가 잠재적으로 관련된 오픈소스 라이선스를 찾고 검토할 수 있도록 지원하는 코드 참조 기능을 프리뷰로 선보이고 있다.

깃허브 차원에서도 법적 보호 장치를 마련하고 있다. “사용자가 기존 공개 코드와의 일치를 차단하는 필터를 활성화하면 깃허브 면책 정책의 적용을 받다”라고 이 조직의 대변인은 말했다.

또 다른 AI 코딩 어시스턴트 공급업체인 탭나인(Tabnine)도 10월 말에 자체 코드 검토 에이전트를 발표한 바 있다. 하지만 깃허브 코파일럿과 탭나인 외에도 코딩 어시스턴트를 공급하는 벤더는 다수다. 오픈소스 라이선스 정책에 대한 책임은 결국 사용자에게 있다고 깃허브는 밝히고 있다.

AI 코딩 에이전트를 사용하는 조직은 스스로를 보호하기 위해 인간 프로그래머 또는 소프트웨어의 지적 재산권 침해 여부를 검사하는 서비스를 활용해 AI 생성 코드의 저작권 침해 및 오픈소스 라이선스 위반 여부를 확인해야 한다고 다이케마 고셋의 워드는 강조했다.

이 변호사는 “일부 AI 코드 생성 플랫폼이 “사용자를 보호하고 일부 책임으로부터 사용자를 보호하거나 적어도 어느 정도 안심할 수 있게 하기는 한다”라고며, 향후 다른 서비스도 등장할 가능성이 높다고 예상했다. 워드는 “이러한 유형의 시스템이 점점 더 많이 사용됨에 따라 오픈소스 위반 여부를 검사하는 서비스가 등장하리라 예상할 수 있다. 이러한 업체들은 시중에 나와 있는 모든 공개 데이터 세트에 기반해 코드를 감사하여 잠재적인 저작권 침해 신고가 있는지 확인할 것”이라고 말했다.

트레볼루션의 바디예프는 기업이 코딩 에이전트를 사용하여 사람이 생성한 코드의 IP 위반 여부를 감사하는 것과 같은 방식으로 결과물을 검사할 것을 권장했다. 그는 “사람이 작성한 코드와 동일한 모범 사례를 모두 적용해야 한다. 코드 리뷰와 같은 작업은 여전히 매우 중요하다. AI가 스스로 모든 것을 올바르게 처리할 것이라고 믿을 수는 없다”라고 말했다.

미지의 위험성

코딩 에이전트를 사용하는 조직들이 향후 얼마나 큰 문제에 처할지 여부는 불분명하다. 패니치 슈바르츠의 글럭은 대형 AI 공급업체가 저작권 및 기타 지적재산권 침해 소송의 주요 표적이 될 수 있지만, 사용자 조직도 자유롭지 못하다고 지적했다. 특히 사용자 조직이 코딩 에이전트를 사용하여 상업적으로 이용 가능하고 성공적인 소프트웨어 패키지를 만들 때 위험이 커진다는 설명이다.

워드는 “코더가 무엇을 하고 있는지 알고 있어야 한다. 코딩 에이전트는 매우 유용한 도구이기 때문에 코더들이 이를 사용할 것이다. 이런 일이 발생하지 않도록 막기는 어렵다”라고 말했다.

즉 기업은 IP 침해를 방지하기 위해 합리적인 조치를 취해야 한다. “문제는 가드레일을 설치하지 않고 방치할 것인가, 아니면 실제로 적극적으로 해결하려고 노력할 것인가다”라고 그는 말했다.
dl-ciokorea@foundryco.com

저작권 말썽 불가피?··· AI 코딩 에이전트의 법적 위험성

AI 훈련 방법

공급업체의 조치

미지의 위험성

Related posts