많은 최고 경영진과 IT 임원들은 자사 데이터를 매우 양호한 상태로 보고 있다. 특히 자사가 데이터 기반 의사 결정을 촉진하고 AI 기반 솔루션을 제공할 역량을 갖추고 있다고 여기는 경향이 있었다.
그러나 IT 리더가 데이터와 가까운 위치에 있을수록 품질에 대한 확신이 줄어드는 것으로 나타났다. IT 컨설팅 기업 소프트서브(Softserve)의 최근 설문조사에 따르면, C레벨 IT 임원을 포함한 대기업 최고 경영진의 거의 절반이 자사 데이터가 완전히 성숙하다고 믿었다. 반면 현업 부서장급 데이터 및 AI 리더 중에서는 37%만이 이와 같은 의견을 드러냈다.
전문가들은 최고 경영진과 현업 부서장급 IT 리더 간의 데이터에 대한 확신 수준이 다르면 AI 모델 학습이나 다른 데이터 기반 이니셔티브를 진행할 때 심각한 문제를 초래할 수 있다고 경고했다.
더욱이 AI나 데이터 관리를 담당하는 현업 부서장의 68%는 자사가 항상 또는 대부분 부실한 데이터로 의사 결정을 내린다고 언급했다. 반면 C레벨 IT 임원 중에서는 47%만이 그렇게 생각했다.
미시간대학교 혁신기술대학의 티모시 베이츠 교수는 C레벨 임원이 데이터 품질을 포함한 IT 문제를 파워포인트 수준의 간결한 요약 보고서로만 받는 경우가 많아 인식에 차이가 나타난다고 분석했다.
베이츠는 “경영진은 대시보드를 통해 깔끔하게 잘 다듬어진 정보를 본다. 반면 현업 부서장들은 고장난 파이프라인, 일관성 없는 정의, 맥락 없는 경고 등이 뒤섞인 백엔드를 마주한다”라고 언급했다.
제너럴 모터스의 전 CTO이기도 했던 베이츠 교수는, 근무 당시 IT 문제에 대한 다양한 관점을 접할 수 있었다고 언급했다. 현업 부서장급 IT 리더들이 최고 경영진이 인식하지 못한 문제를 자주 지적했다는 것이다.
그는 “부서장들이 특별히 비판적이어서가 아니라, 대시보드에 드러나지 않는 격차를 봤기 때문이다. 이들은 시스템 속에서 직접 일하고 있다. 따라서 단순히 요약 보고서를 검토하는 것보다 확신 수준을 더 정확히 평가하는 경우가 많다”라고 설명했다.
데이터 전략의 균형
IT 리더의 직급 간 인식 격차 외에도 데이터 품질 문제의 원인은 다양할 수 있다. 이는 종종 분산된 IT 인프라에서 비롯되기도 한다. AI 기반 HR 소프트웨어 개발사인 아이도라(Aidora)의 공동 설립자이자 CTO인 아난트 아가왈은 많은 기업이 원하는 기능을 달성하기 위해 여러 IT 벤더의 제품을 사용하고 있는 점을 지적했다.
예를 들어 그는 내부 도구를 실행할 때 클라우드 서비스, 데이터베이스 API, 캐싱 서비스, AI 도구, 로그인 서비스에 모두 다른 벤더를 활용하는 경우가 많다고 언급했다.
아가왈은 “본질적으로 각 벤더가 소유한 여러 작은 소프트웨어 조각들이 모두 함께 모여 제품을 구축하고 있다. 이 모든 시스템은 자체 데이터를 생성하며, 생성된 모든 데이터가 적절한 주석과 함께 중앙 데이터 레이크로 흐르도록 의식적으로 노력해야 한다. 그래야 권한을 올바르게 설정할 수 있기 때문”이라고 설명했다.
아가왈은 IT 팀이 내부 서비스 구축을 완료하면 곧바로 다음 작업으로 넘어간다면서, “기능이 구축되자마자 팀은 프로젝트를 완료로 표시하고 공지 이메일을 보낸다. 데이터가 장기적인 사용을 위해 제대로 흐르고 있는지 확인하는 데는 특별한 보상이 없다. 팀들은 장기적 전망보다 단기적 성과를 우선시하는 경향이 있다”라고 분석했다.
이런 단기적 성과 중심의 접근 방식은 시간이 지남에 따라 조직의 데이터 기반을 서서히 약화시킬 수 있다. 데이터 관리 전략에 충분한 예산을 할당하지 않고, 데이터 이니셔티브보다 디지털 전환에만 치중하는 것이 대부분 조직에서 데이터 기반 프로젝트가 실패하는 원인 중 하나가 되고 있다. 다만 이는 여러 원인 중 일부에 불과하다.
AI로의 급격한 전환
소프트서브의 빅데이터 및 분석 담당 부사장인 로디온 미로노프는 많은 기업이 생성형 AI 도구를 채택하기 위해 서두르면서 지난 2년 동안 데이터 품질 문제가 더욱 복잡해졌다고 말했다.
그는 “이사회가 C레벨 임원에게 이 기술에 대해 묻는다면, 자연스럽게 사람들은 무언가를 생각해내야 한다는 의무감을 느낀다. ‘우리가 그것으로 무엇을 할 수 있는지 모르겠습니다’라고 말할 수는 없다”라고 설명했다.
그는 많은 기업이 해결하려는 문제를 정의하지 않고 프로젝트 성공에 필요한 데이터를 정리하지 않은 채 생성형 AI 프로젝트를 시작했다면서, 일부 경우에는 내부 데이터가 여전히 많은 데이터베이스, 저장 위치 및 형식에 흩어져 있다고 지적했다.
IT 솔루션 제공업체인 텍시스템즈(TEKsystems)의 CTO 람 팔라니아판은 기업이 데이터를 수집하고 정리하지 않은 채 AI 프로젝트를 시작하면 비즈니스 실수로 이어질 수 있는 AI 환각 현상에 더 쉽게 노출된다고 설명했다.
그는 “AI 기반 매출 보고서를 이사회에 제출했는데 어떤 이유로 한 지역을 놓쳤다면, 사람들은 보고서를 덜 신뢰하게 될 것”이라고 언급했다.
팔라니아판은 초기 생성형 AI에의 과장된 기대치로 인해 올바른 데이터를 사용하지 않는 프로젝트가 성급히 생겨났다고 말했다. 그는 또한 “AI에 대한 과장된 기대치가 C레벨 임원과 부서장들에게도 전파되고 있다. 실제로 이를 실행하는 현장의 최전선에 있는 관리자들이 그 문제점과 격차를 발견하고 있으며, 이제 문제를 공개적으로 지적하고 있다”라고 설명했다.
부실한 데이터의 문제점
아이도라의 아가왈은 좋은 데이터의 부족이 여러 문제로 이어질 수 있다고 말했다. CIO를 포함한 C레벨 임원들은 데이터가 준비되지 않았음에도 새로운 제품 개발을 요구할 가능성이 있다. 이로 인해 현업 IT 리더들은 2가지 어려운 상황에 처할 수 있다. 일정을 계속 미뤄 무능해 보이거나, 아니면 부담을 직원들에게 떠넘기게 될 수 있다.
아가왈은 “팀이 준비되지 않은 다음 단계의 작업을 강행하면 이니셔티브 실패, 심각한 지연, 팀 번아웃으로 이어질 수 있다”라고 진단했다.
팔라니아판은 데이터 품질에 대한 자신감 격차를 해결하기 위해 기업이 조직 전체에 걸쳐 투명성을 높이는 데 집중해야 한다고 조언했다. 부서장급 IT 리더는 CIO와 다른 최고 경영진이 조직의 데이터 준비 수준을 이해하도록 돕기 위해 상세한 IT 이니셔티브 로드맵을 수립해야 하며, 여기에는 데이터 문제 해결에 필요한 일정도 포함해야 한다고 그는 설명했다.
팔라니아판은 “’기어가기, 걷기, 달리기’와 같은 단계적 접근법을 취해 올바른 방향으로 이끌고 명확한 로드맵을 제시해야 한다. 로드맵을 실행하기 위해 조직의 데이터 성숙도를 파악하고, 그 다음 점진적으로 개선해 나가는 것이 중요하다”라고 조언했다.
한편 미로노프는 기업이 비즈니스 사례에 초점을 맞춘 데이터 전략, 데이터 접근성, 데이터 보안 등 강력한 데이터 기반을 갖춰야 한다고 말했다. 또한 조직이 AI 및 기타 데이터 기반 프로젝트 과정에서 잠재적인 데이터 문제를 지적할 수 있는 사람을 고용해야 한다고 제안했다.
그는 “AI를 언급하지 않더라도, 어떤 개념 증명(PoC) 프로젝트와 그것을 진행하는 팀을 살펴보면 아마도 그 프로젝트에 투자한 사람들, 즉 결과가 반드시 성공일 것이라고 믿는 사람들만 있을 가능성이 높다. 소프트웨어 개발에서 QA 역할을 하는 사람들, 즉 의도적으로 결함과 불완전한 부분을 찾아내려고 노력하는 사람들은 PoC 팀에서 보기 어렵다는 의미다”라고 지적했다.
그는 개념 증명에 대해 비판할 수 있는 직원이 없다면 기업이 많은 시간과 비용을 투자하고도 프로젝트 실패를 경험할 수 있다고 말했다. 따라서 빠른 실패가 더 나은 결과일 수 있다는 것이다.
미로노프는 “개발자 중에는 이상적인 상황만 바라보는 사람들이 있다. 좋은 개발자라면 실제 작동하는 무언가를 만드는 데 집중하지만, 이와 별개로 작동하지 않는 부분을 찾는 데만 전념하는 독립된 역할이 필요하다”라고 조언했다.
[email protected]
Read More from This Article: AI 시대의 또 다른 과제 ‘데이터 자신감 격차’··· IT 리더가 관리해야 할 이유
Source: News