Skip to content
Tiatra, LLCTiatra, LLC
Tiatra, LLC
Information Technology Solutions for Washington, DC Government Agencies
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact
 
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact

합성 데이터로 비즈니스 가치를 창출하는 7가지 방법

올해 대부분의 기업이 AI를 빠르게 도입하고 있지만, 거의 모두가 동일한 플랫폼을 동일한 솔루션 업체에게서 도입하고 있다.

기업 맞춤형 AI 솔루션을 만들려면 고유한 데이터가 필요하다. 그러나 기업이 보유한 데이터는 종종 큰 결함이 있고, 프라이버시나 컴플라이언스 문제로 활용이 어려우며, 양도 충분하지 않은 경우가 많다. 합성 데이터는 이런 간극을 메우고, AI 도입을 통해 실질적인 비즈니스 가치를 끌어내는 데 도움이 된다.

디지털 전환 컨설팅 업체 EPAM은 4월 중순, 대기업의 경영진 및 IT 전문가 7,300명 이상을 대상으로 설문조사를 진행했다. 응답자 전원이 AI를 실험 중이거나 도입 중이라고 답했으며, 이 가운데 14%는 이제 막 시작한 단계, 32%는 역량을 쌓는 중이지만 아직 일관된 결과는 얻지 못하고 있다고 밝혔다. 반면 절반에 가까운 응답자는 일정한 성과를 내고 있으며, 이를 통해 경쟁력을 확보하고 있다고 응답했다. 하지만 자사를 ‘시장 판도를 바꾸는 선도 기업’으로 여기는 곳은 5%에 불과했다.

딜로이트 조사에 따르면, 고위 임원의 30%가 생성형 AI 도입의 가장 큰 장애물 중 하나로 ‘고품질 데이터 부족’을 꼽았다. 이 지점에서 합성 데이터가 중요한 역할을 한다.

딜로이트 컨설팅의 데이터 클라우드 및 머신러닝 대표 전문가 치다 사다야판은 “실제 데이터를 갖는 것은 모든 비즈니스의 핵심”이라며, “합성 데이터를 함께 활용하면 큰 차별화를 가져올 수 있다. 이렇게 생성된 AI 모델은 기업에 경쟁우위를 안겨줄 것”이라고 강조했다.

가트너에 따르면, 내년까지 전체 기업의 75%가 생성형 AI를 활용해 합성 고객 데이터를 생성하게 될 전망이다. 이는 2023년 5% 미만에서 크게 증가한 수치다.

포레스터에 따르면, 전 세계 대다수 기업은 이미 합성 데이터를 활용한 프로젝트를 진행 중이다. 구체적으로는 전체의 14%가 전사적 규모로 다수의 사용례를 배포했고, 22%는 부서 단위로 활용 중이며, 또 다른 22%는 초기 생산 단계에 있다. 이외에도 15%는 파일럿 단계를 진행 중이며, 15%는 고도화된 연구 및 PoC 단계를 밟고 있다.

그렇다면 합성 데이터는 비즈니스 가치를 창출하는 데 어떻게 도움이 되는지 알아보자.

1. 비즈니스를 진짜로 이해하는 AI 구축하기

    대형 AI 기업의 모델은 구조적으로 ‘범용형’일 수밖에 없다. 데이터 서비스 업체 데이터 액슬의 CEO 앤디 프롤리는 “주요 AI 솔루션 업체가 모두 공개 데이터로 모델을 학습시키면, 결국 출력 결과도 획일화된다. 이는 차별화를 제한하는 요인”이라고 설명했다.

    프롤리는 “더 나아가 이런 데이터 세트는 오랜 시간 동안 누적된 오류를 그대로 반영할 수 있어, AI 기반 의사결정의 신뢰성도 떨어뜨린다”라고 지적했다. 대형 상용 모델이 학습한 데이터는 특정 고객군의 미묘한 특성을 포함하지 않기 때문에, 이 역시 신뢰성 저하의 원인이 된다.

    기업은 이 간극을 해소하기 위해 기존 AI 모델을 세부 조정하거나 자체 데이터나 구매한 데이터를 기반으로 맞춤형 SLM을 만들 수 있다. 그리고 그마저도 부족할 경우, 새로운 합성 데이터를 생성해 활용할 수 있다.

    재고 관리 솔루션 업체 넥스터플(Nextuple)은 합성 데이터를 활용해 재고 관리의 과제를 이해하는 맞춤형 AI/ML 모델을 만들고 있다. 넥스터플 CEO 다르판 세스는 “예를 들어 대규모 재고가 중앙 창고로 입고됐다고 하자. 이 재고를 어디에 보내야 할지 결정해야 하는데, 이건 매우 중요한 의사결정”이라고 설명했다.

    이런 결정에는 물류와 최적화에 관련된 수많은 요소가 반영되며, 각 기업마다 이 요소가 모두 다르기 때문에, 합성 데이터를 활용한 학습과 테스트는 수년간 필수적인 역할을 해왔다고 밝혔다. 세스는 “이런 방식 자체가 새롭지는 않다. 하지만 지금은 합성 데이터를 활용할 수 있는 가능성과 범위가 어느 때보다 넓어졌다”라고 강조했다.

    넥스터플은 단순히 AI/ML 모델 학습용으로 합성 데이터를 쓰는 데 그치지 않고, 이제는 생성형 AI로 합성 데이터를 생성함으로써 이 과정을 더 빠르고 유연하며 지능적으로 만들고 있다고 밝혔다. 세스는 “우리는 모든 고객의 공통 요구사항을 생성형 AI에 입력했다”라며, “이제는 사용자 스토리, 테스트 사례, 테스트 데이터는 물론, 테스트 자동화까지 생성형 AI로 만들 수 있다”라고 말했다.

    과거에는 이런 합성 데이터를 만드는 데 수작업이 많이 필요했다. 예를 들어 주문서 하나에 상품 3개를 넣었다가, 다른 주문서에는 10개를 넣는 식으로, 여러 가지 변형을 만들어야 했다. 세스는 “이 모든 것이 이제는 생성형 AI 덕분에 엄청난 속도로 처리된다”라며, “지난해 말, 팀 전체에 AI 도구를 적용해 누구나 사용할 수 있도록 했다. 이제는 누구든 합성 데이터를 만들 수 있는 시대”라고 덧붙였다.

    넥스터플의 고객 기업은 다양한 플랫폼을 사용하고 있기 때문에, 자사 시스템을 모델 비종속 구조로 개발했다. 세스는 “우리는 오픈AI, 클로드, 라마, 제미니 등 모든 모델을 사용하고 있다. AWS에는 베드록이 있고, 애저도 있으며, 이 업체들이 제공하는 모델만 75~80종이 넘는다”라고 설명했다.

    그래서 넥스터플은 AI 백엔드를 언제든 교체할 수 있도록 기술 구조를 설계했다. 바로 내일 더 성능이 좋거나, 비용이 저렴한 모델이 나올 수도 있기 때문이다.

    모든 주요 클라우드와 AI 플랫폼을 지원해야 하는 넥스터플은 특정 업체의 AI 기술 스택을 쓰지 않고, 오픈소스 구성요소를 직접 조합해 자체 스택을 구축했다. 여기에는 랭체인(LangChain), 랭그래프(LangGraph), 랭플로우(LangFlow), 그리고 RAG 임베딩을 위한 포스트그레SQL의 Pgvector 같은 벡터 DB가 포함된다. 세스는 “요즘은 MCP 같은 새로운 패러다임도 등장하고 있다. 기술 변화 속도가 매우 빠르다”라고 덧붙였다.

    2. 데이터의 공백 채우기

    실제 데이터는 대부분 불완전하다. 때로는 사용자 행동 변화로 인해 데이터 공백이 발생한다. 예를 들어, 과거의 쇼핑 데이터는 블랙프라이데이 하루 동안 구매가 급증하는 양상을 보였지만, 지금은 대부분이 온라인 쇼핑을 하며 급증 기간이 일주일 전체로 늘어날 수도 있다. 또는 아주 드물게 발생하는 상황 때문에 사례가 부족한 경우도 있다. 일부 기업에는 이런 데이터 공백이 심각한 영향을 줄 수 있다.

    IEEE 펠로우이자 터프츠대학교 대학원 공과대학 학장인 캐런 파네타는 트래픽 관리에 관심을 가지고 있다. 다양한 비디오 카메라에서 얻은 데이터는 풍부하지만, 특정 유형의 교통사고처럼 중요한 데이터일수록 희귀하다.

    파네타는 “전복 사고 영상이 충분히 없었다. 그래서 합성 데이터를 생성해 사용했다”고 밝혔다. 얼굴 인식도 마찬가지다. 좋은 조명에서 정면을 응시하는 얼굴 사진은 데이터베이스에 넘쳐나지만, 이런 유형의 데이터만으로 학습하면 시스템이 항상 잘 작동하지 않을 수 있으며, 보안에 쓰일 경우 위험할 수도 있다. 파네타는 “머리를 돌리거나 안경을 쓰거나, 미소를 짓거나 마스크를 쓰면 시스템이 제대로 작동하지 않는다”라고 덧붙였다.

    이미지 생성 기술로 다양한 조명 조건이나 각도를 시뮬레이션하는 사진 변형 데이터를 만들 수 있지만, 현재 기술로는 한계도 있다. 파네타는 “마스크를 쓴 사람의 합성 데이터를 생성하려 했지만 인체 해부학과 잘 맞지 않았다. 얼굴 윤곽선 같은 요소는 매우 중요하기 때문에 결과는 엉망이었다. 하지만 합성 데이터가 목표한 행동을 잘 반영한다면 좋은 도구가 될 수 있다”고 설명했다.

    3. 프라이버시 보호와 데이터 가치 극대화

    많은 기업은 범용 모델로는 처리하기 어려운 고유의 사용례를 갖고 있다. 이는 단순히 특수한 재고관리 애플리케이션이나 자율주행차만의 문제가 아니다. 잠재 고객을 위한 이메일이나 프레젠테이션 자료를 생성하는 단순한 작업도 여기에 해당된다. AI 가드레일과 컴플라이언스를 전문으로 하는 다이나모 AI(Dynamo AI)의 어플라이드 AI 담당 부사장 에릭 린은 “고객에게 보낼 이메일 초안을 어떻게 작성할지에 대해 정답은 없다”고 말했다.

    이는 기업마다 고유한 스타일과 언어, 제품 정보가 다르기 때문이다. 제품 정보 부족 문제는 RAG 임베딩 방식을 통해 추론 시점에 벡터 데이터베이스에 연결해 해소할 수 있다. 하지만 고객에게 실제로 보낸 이메일을 학습 데이터로 활용하려면 프라이버시 문제가 발생한다. 파인 튜닝이나 RAG 임베딩 방식이든, 다른 고객의 민감한 정보가 AI에 섞이는 것은 피해야 한다.

    린은 “우리는 프라이버시와 안전 문제 때문에 이런 데이터를 제대로 활용하지 못했다”라며, “합성 데이터는 민감한 개인정보를 제거해 AI의 학습 기반에 포함되지 않게 하고, 기업이 원하는 정확한 형태의 이메일이나 프레젠테이션 자료를 생성할 수 있도록 돕는다”라고 설명했다. 그리고 마케팅 분야에만 국한되지 않는다.

    커니(Kearney)의 디지털 및 애널리틱스 부문 파트너 바라스 토타는 “헬스케어 기업의 경우, 합성 데이터는 환자 데이터와 임상 시나리오를 시뮬레이션하는 데 유용하다. 프라이버시 법규를 준수하면서도 다양한 학습 데이터를 확보할 수 있다”라고 설명했다. 토타는 규제가 엄격한 의료 분야에서도, 합성 데이터를 통해 정확도를 높이거나 혁신적인 신제품을 개발할 수 있다고 강조했다.

    4. 제품 개발과 연구개발 속도 높이기

    제품을 새로 만드는 상황이라면, 프라이버시보다 더 큰 문제는 아예 기존 데이터가 없다는 점일 수 있다. 넥스터플이 새로운 재고 관리 애플리케이션을 개발하려 했을 때가 그랬다. 넥스터플 CEO 다르판 세스는 “우리는 기업의 유통센터와 매장 네트워크에서 재고가 수요 요인에 따라 어떻게 소진되는지를 시뮬레이션하고자 했다”라며, “실제 데이터가 없으면 실제 시나리오에서 작동 여부를 확인할 수 없었다”고 설명했다.

    넥스터플이 생성한 합성 데이터는 매장과 창고 네트워크 전반의 재고 현황과 가상 주문, 주문이 들어오는 시점 등을 포함했다. 세스는 “예를 들어 추수감사절에 판매가 급증하는 양상을 시뮬레이션하고, 이런 실제 상황을 반영한 합성 데이터를 만들었다. 이후 유망 고객과 테스트할 기회를 얻었고, 이로써 가설이 검증됐다”라고 밝혔다.

    합성 데이터를 활용한 제품 개발의 또 다른 예는 로봇 개발이다. 소프트웨어 개발 기업 글로번트(Globant)의 디지털 혁신 부문 수석부사장 아구스틴 후에르타는 “요즘 로보틱스 분야의 발전이 눈부시다”라며, “엔비디아 옴니버스 같은 가상 환경에서는 시뮬레이션된 로봇이 가상 객체와 상호작용하면서, 로봇이 공간을 탐색하거나 물건을 다루는 능력을 키우는 데 필요한 방대한 훈련 데이터를 생성할 수 있다”라고 설명했다.

    후에르타는 “자율주행 솔루션을 위한 컴퓨터 비전 데이터를 훈련시키려면 반드시 합성 데이터가 필요하다. 그렇지 않으면 실제로 자동차를 충돌시켜야 할 것”이라고 덧붙였다.

    5. 기존 데이터 없이 새로운 시장 개척하기

    합성 데이터의 또 다른 사용례는 기존 제품을 갖고 있지만 새로운 시장에 진출하고자 할 때다. 커니의 바라스 토타는 “기업은 소비자가 어떤 행동을 보일지, 어떤 것을 선호하고 새로운 제품이나 서비스에 어떻게 반응할지를 모델링할 수 있다”라며, “이렇게 생성한 데이터로 기능이나 마케팅 전략도 정교화할 수 있다”고 말했다.

    토타는 “예를 들어, 한 은행이 새로운 지역에 진출하려 한다면, 합성 데이터를 활용해 해당 지역의 경제 상황, 소비 습관, 금융 상품 채택 가능성을 시뮬레이션할 수 있다”고 설명했다.

    카네기멜런대학교 AI 교수 아난드 라오는 과거 새 시장에 진출하려던 차량 공유 서비스 업체와 협력한 적이 있다. 하지만 모든 지역에 같은 전략을 적용하는 것은 효과적이지 않았다. 지리적 조건이 각기 다르기 때문이다. 라오는 “뉴욕시에서는 대기시간이 5~10분 이내여야 한다. 예측이 빗나가면, 예컨대 8분 걸린다고 했는데 실제로는 12분 걸리면, 뉴욕 시민은 이를 못 참는다. 하지만 미시간 애너버에서는 몇 분 늦어도 괜찮다”라고 설명했다.

    즉, 지역마다 최적화 전략이 달라야 하며, 합성 데이터는 이를 정교화하는 데 도움이 됐다. 라오는 “10개 도시에 대해 20만 개 이상의 시장 진입(go-to-market) 시나리오를 시뮬레이션했다. 이를 통해 경영진은 새로운 시장에 적응하는 데 필요한 실제 인사이트를 확보할 수 있었다”고 설명했다.

    6. 디지털 트윈 구축하기

    디지털 트윈은 원래 제트 엔진을 모델링하거나 예측 정비를 돕거나 공장이나 복잡한 물리 설비를 설계 및 운영하는 용도로 사용됐다. 지금은 디지털 트윈의 정의가 소프트웨어 시스템, 비즈니스 워크플로우, 심지어 사람까지 포함하는 방향으로 확장되고 있다.

    EY의 북미 소비자 AI 책임자 톰 에드워즈는 “기업은 고객, 고객 행동, 쇼핑 여정, 구매 패턴, 특정 프로모션에 대한 반응까지 시뮬레이션하고 있다”라며, “이때 합성 고객 프로필을 만들어 활용한다”고 말했다. 에드워즈는 “이렇게 하면 다양한 인구통계학적 그룹이 제품 포지셔닝에 어떻게 반응할지를 알 수 있다. 수요 예측과 타깃 마케팅의 정확도가 향상된다”라고 설명했다.

    또 “포커스 그룹 대신 합성 페르소나를 쓰는 기업이 늘고 있다”라며, “수백 개 페르소나를 만들고 다양한 메시지를 테스트할 수 있으며, 합성 데이터는 여기에 심리적 특성까지 반영할 수 있게 해준다”라고 덧붙였다.

    이런 합성 페르소나는 이커머스 개인화 개선에도 활용할 수 있다. 에드워즈는 “수백만 가지 조합을 미리 돌려볼 수 있고, 실제 사용자가 쇼핑할 때 그에 가장 가까운 사전 구성 페르소나로 매칭할 수 있다”라며, “이 방식은 기존 알고리즘보다 사용자에 대해 더 깊이 파악할 수 있으며, 수백만 가지 경로를 미리 예측해 놓았기 때문”이라고 강조했다.

    이런 방식은 이전에 보지 못한 상품 추천을 가능하게 하고 소비자와 매끄럽게 연결되도록 하기 때문에 수백만 달러 규모의 비즈니스 가치를 창출할 수도 있다.

    기업은 직원의 디지털 트윈도 만들 수 있다. 경영 컨설팅 기업 SSA & 컴퍼니의 어플라이드 솔루션 부문 책임자 닉 크레이머는 “우리 내부적으로는 인력 구성과 기술력 현황을 분석 중”이라고 말했다. 크레이머는 “컨설턴트에 대한 과거 데이터는 있지만, 역량과 기술력에 대한 데이터는 신뢰도가 낮다. 다만 프로젝트 관련 데이터는 풍부하게 보유하고 있어, 이를 점토 덩어리처럼 가공해 합성 데이터를 실험 중”이라고 밝혔다.

    또한, “합성 페르소나는 사람, 프로젝트 역할, 직책 등으로 구성할 수 있다. 이들을 조합해 가상 프로젝트팀을 만들고, 이를 통해 인력 배치를 시각화하거나 기술력과 도구 조합을 최적화해 성과, 속도, 수익, 이익률을 향상시키는 전략을 수립할 수 있다”라고 설명했다.

    7. 에이전틱 AI를 위한 준비

    AI가 진화하면서 합성 데이터를 활용할 수 있는 기회도 함께 확장되고 있다. 올해 가장 주목받는 트렌드는 에이전틱 AI다.

    클라우데라가 4월 발표한 설문조사에 따르면, 기업 IT 리더의 96%가 향후 12개월 내 AI 에이전트 활용을 확대할 계획이라고 밝혔다. 현재 57%는 이미 도입을 완료했지만, 가장 큰 장애물은 데이터 프라이버시로, 전체의 53%가 이 문제 때문에 도입 속도가 늦어진다고 답했다. 그러나 이는 단순히 프라이버시 보호에 그치지 않는다.

    EY의 에드워즈는 “합성 데이터는 에이전트의 학습을 가속하고 복잡한 시나리오를 시뮬레이션하는 데 매우 유용하다”라며, “수백만 가지 상호작용 기반 시나리오를 실행할 수 있다면 이는 엄청난 도구가 된다. 이 기능은 앞으로 기업 내에 AI 에이전트를 배치하는 데 있어 핵심적인 기반 기술이 될 것”이라고 강조했다.

    합성 데이터 의존의 위험

    합성 데이터를 과도하게 사용하는 것은 위험할 수 있다. 캐런 파네타가 마스크를 쓴 사람의 얼굴 이미지를 합성하려다 실패했던 사례처럼, 합성 데이터에는 한계가 존재한다. AI 플랫폼 기업 멘딕스(Mendix)의 전략 담당 수석 부사장 고든 반 후이젠은 “남용할 경우 과적합 문제처럼 출력이 반복되고, 학습하지 않은 패턴에 대한 입력을 받으면 무작위적이거나 엉뚱한 결과가 나올 수 있다”라고 경고했다.

    이를 방지하는 방법도 있다. 합성 데이터 세트를 다양화하거나 실제 데이터와 혼합하거나 데이터를 노이즈 처리해 이상치를 만들 수도 있다. 반 후이젠은 “합성 데이터의 가치를 최대한 끌어내려면 가능한 모든 상황에서 사람이 검증하는 프로세스를 반드시 포함해야 한다”라고 강조했다.
    dl-ciokorea@foundryco.com


Read More from This Article: 합성 데이터로 비즈니스 가치를 창출하는 7가지 방법
Source: News

Category: NewsJune 26, 2025
Tags: art

Post navigation

PreviousPrevious post:에이전트포스에 통합된 MCP, 세일즈포스를 CRM AI 경쟁에서 선두로 이끌까?NextNext post:Join our live discussion – CIO Essential Insights: New Thinking about Cloud Computing

Related posts

Deuda de DevOps: el impuesto oculto a la innovación
June 26, 2025
The agentic AI reset is here
June 26, 2025
오프라인 단말기 ‘커넥트’ 공개···네이버페이, AI·웹3로 글로벌 핀테크 비전 제시
June 26, 2025
구글 클라우드, 터미널용 AI 에이전트 ‘제미나이 CLI’ 공개
June 26, 2025
준비된 자만이 살아남는다···모든 CISO가 스스로에게 던져야 할 10가지 질문
June 26, 2025
에이전트포스에 통합된 MCP, 세일즈포스를 CRM AI 경쟁에서 선두로 이끌까?
June 26, 2025
Recent Posts
  • Deuda de DevOps: el impuesto oculto a la innovación
  • The agentic AI reset is here
  • 오프라인 단말기 ‘커넥트’ 공개···네이버페이, AI·웹3로 글로벌 핀테크 비전 제시
  • 구글 클라우드, 터미널용 AI 에이전트 ‘제미나이 CLI’ 공개
  • 준비된 자만이 살아남는다···모든 CISO가 스스로에게 던져야 할 10가지 질문
Recent Comments
    Archives
    • June 2025
    • May 2025
    • April 2025
    • March 2025
    • February 2025
    • January 2025
    • December 2024
    • November 2024
    • October 2024
    • September 2024
    • August 2024
    • July 2024
    • June 2024
    • May 2024
    • April 2024
    • March 2024
    • February 2024
    • January 2024
    • December 2023
    • November 2023
    • October 2023
    • September 2023
    • August 2023
    • July 2023
    • June 2023
    • May 2023
    • April 2023
    • March 2023
    • February 2023
    • January 2023
    • December 2022
    • November 2022
    • October 2022
    • September 2022
    • August 2022
    • July 2022
    • June 2022
    • May 2022
    • April 2022
    • March 2022
    • February 2022
    • January 2022
    • December 2021
    • November 2021
    • October 2021
    • September 2021
    • August 2021
    • July 2021
    • June 2021
    • May 2021
    • April 2021
    • March 2021
    • February 2021
    • January 2021
    • December 2020
    • November 2020
    • October 2020
    • September 2020
    • August 2020
    • July 2020
    • June 2020
    • May 2020
    • April 2020
    • January 2020
    • December 2019
    • November 2019
    • October 2019
    • September 2019
    • August 2019
    • July 2019
    • June 2019
    • May 2019
    • April 2019
    • March 2019
    • February 2019
    • January 2019
    • December 2018
    • November 2018
    • October 2018
    • September 2018
    • August 2018
    • July 2018
    • June 2018
    • May 2018
    • April 2018
    • March 2018
    • February 2018
    • January 2018
    • December 2017
    • November 2017
    • October 2017
    • September 2017
    • August 2017
    • July 2017
    • June 2017
    • May 2017
    • April 2017
    • March 2017
    • February 2017
    • January 2017
    Categories
    • News
    Meta
    • Log in
    • Entries feed
    • Comments feed
    • WordPress.org
    Tiatra LLC.

    Tiatra, LLC, based in the Washington, DC metropolitan area, proudly serves federal government agencies, organizations that work with the government and other commercial businesses and organizations. Tiatra specializes in a broad range of information technology (IT) development and management services incorporating solid engineering, attention to client needs, and meeting or exceeding any security parameters required. Our small yet innovative company is structured with a full complement of the necessary technical experts, working with hands-on management, to provide a high level of service and competitive pricing for your systems and engineering requirements.

    Find us on:

    FacebookTwitterLinkedin

    Submitclear

    Tiatra, LLC
    Copyright 2016. All rights reserved.