초창기 디지털 트랜스포메이션의 주요 목표는 조직이 종이 기반 프로세스를 디지털화된 워크플로우로 전환하는 데 있었다. 종이 문서는 웹이나 모바일 양식으로 바뀌고, 디지털 워크플로우가 전달 과정을 대체했다. 종이 기반 문서 다수가 PDF, 마이크로소프트 워드 또는 다른 문서 형식의 디지털 버전으로 변환되면서, 조직들은 문서에서 구조화된 정보를 추출하는 데 유용한 문서 처리 기술에 투자해 왔다.
AI 이전의 문서 처리 기술은 규칙과 패턴에 의존해 정보를 식별하고 추출하는 방식이었다. 이는 인보이스, 계약서 및 기타 구조화된 문서에서 기본 정보를 추출하는 데 상당히 정확했지만, 예외 사항을 처리하고 누락된 정보를 수동으로 추출할 때는 사람의 개입이 필요한 경우가 많았다.
또한 AI 이전의 문서 처리 기술은 복잡한 문서 형식을 처리하는 데 한계가 있었다. 예를 들어, 규칙과 패턴 매칭에 기반한 시스템은 기밀유지계약서(NDA)에서 이름과 날짜를 추출할 수 있었지만, 계약서의 정보를 요약하거나 조직의 NDA 요구사항을 충족하는지 확인할 수는 없었다.
이제는 문서 마이닝 및 분석 플랫폼이라고도 불리는 새로운 영역인 ‘생성형 AI 기반 지능형 문서 처리’가 등장했다. 기본적인 검색 기능만 제공하거나 전문가의 문서 검토가 필요한 워크플로우를 사용하던 조직들에게는 획기적인 변화를 가져올 가능성이 높다. 문서 처리는 비교적 평범한 생성형 AI 사용 사례로 언급되지만, 비즈니스에는 상당한 영향을 미칠 수 있다. 예를 들면 보험 업계의 청구 처리, 생명과학 분야의 임상 시험 수행, 금융 서비스의 규제 보고 등에서 높은 성능을 보일 수 있다.
애피안(Appian)의 CTO이자 설립자인 마이클 베클리는 “생성형 AI 기반 지능형 문서 처리를 통해 페이퍼리스 오피스의 꿈을 실현할 수 있게 됐으며, 이는 정부, 은행, 보험, 생명과학 분야를 변화시킬 것이다. 특히 규제가 강한 곳에서 서류가 많이 쌓이는 만큼, 그곳에서 영향력은 기하급수적으로 늘 수 있다”라고 설명했다.
생성형 AI 기반 지능형 문서 처리란?
비즈니스 요구사항을 살펴보기 전에, 지능형 문서 처리(IDP) 기술이 할 수 있는 일과 벤더 간 차별화된 기능을 이해할 필요가 있다. 선택할 수 있는 벤더 목록은 다음과 같다.
- ABBYY
- 애피안(Appian)
- 오토메이션 애니웨어(Automation Anywhere)
- AWS
- 데이터매틱스(Datamatics)
- 엑스퍼트닷에이아이(expert.ai)
- 구글(Google)
- 하이퍼사이언스(Hyperscience)
- IBM
- 인디코 데이터(Indico Data)
- 인스타베이스(Instabase)
- 마이크로소프트(Microsoft)
- 오픈텍스트(OpenText)
- 로섬(Rossum)
- 유아이패스(UiPath)
- UST
- 워크퓨전(WorkFusion)
또한 업계 인사이트와 플랫폼 리뷰를 확인하기 위해 IDC 퍼스펙티브, 포레스터 웨이브, QKS 스파크 매트릭스 등을 살펴볼 수 있다.
엠파시스(Mphasis)의 최고 솔루션 책임자인 스리쿠마르 라마나탄은 “생성형 AI는 비구조화된 데이터를 규모에 맞게 실행 가능한 인사이트로 변환함으로써 문서 처리를 재정의하고 있다. 엔티티 추출, 분류 체계 정리, 정량 분석과 같은 작업이 더 높은 정확도로 자동화된다”라고 언급했다.
- 엔티티 추출(Entity extraction)은 이름, 장소, 조직, 날짜, 통화 및 관련 컨텍스트를 추출하는 것을 의미한다.
- 분류 체계 정리(Taxonomy classifications)는 알려진 카테고리 분류 체계나 다른 계층 구조가 있는 경우 감독을 받을 수 있고, 대규모 언어 모델(LLM)이 사전 지침 없이 주제 목록을 추출할 때 감독을 받지 않을 수도 있다.
- 정량 분석(Quantitative analysis)의 예로는 인보이스 금액 추출 및 합계 계산, 보험 청구 금액 및 보장 한도 추출, 규제 요건의 수수료 및 벌금 정량화 등이 있다.
LLM과 통합된 IDP 기술은 요약 제공, 컨텍스트 캡처, 기타 의미론적 정보 마이닝을 통해 정보 추출을 더 높은 수준으로 끌어올릴 수 있다.
뉴젠(Newgen)의 제품 관리 부사장인 바룬 고스와미는 “생성형 AI는 데이터 추출, 분류, 편집과 같은 전통적인 작업뿐만 아니라 여러 고급 기능으로 IDP를 크게 향상시키고 있다. 이제 요약 및 콘텐츠 생성 기능이 향상되어 문서를 더 효율적이고 정확하게 처리할 수 있다. 생성형 AI는 콘텐츠와 더 지능적이고 컨텍스트를 인식하는 상호작용을 가능하게 해 검색 및 검색 프로세스를 혁신하고, 문서 관리를 그 어느 때보다 직관적이고 효과적으로 만들고 있다”라고 말했다.
생성형 AI로 문서 처리 워크플로우 자동화하기
IDP를 도입하려면 목표 설정, 요구사항 정의, 규정 준수 요소 이해, 최소 품질 지표 지정 등의 사전 단계가 필요하다.
트레이닷에이아이(Tray.ai)의 CEO이자 공동 설립자인 리치 월드론은 “조직은 생성형 AI 기반 IDP를 통해 더 큰 AI 자동화를 실현할 수 있다. 이는 문서 유형을 인식하고 주요 필드를 추출하며, 비구조화된 데이터를 빠르게 사용 가능한 데이터로 변환한다. 기본적인 추출을 넘어 워크플로우를 자동화하고 모델 정확도와 데이터 관련성을 나타내는 신뢰도 점수를 제공한다”라고 설명했다.
조직이 전통적인 문서 처리에서 생성형 AI 기반 문서 처리로 전환하기 위한 구체적인 사전 단계는 다음과 같다.
- 문서 유형, 파일 형식, 문서 수량, 데이터 볼륨 및 저장 위치를 식별한다.
- 모든 기밀 데이터 또는 프라이버시 보호, 보안 및 최종 사용 권한에 관한 규정 준수 요구사항을 수립한다.
- 정보 추출, 자동화 및 의사 결정을 위해 문서 유형을 사용하는 사람, 비즈니스 프로세스 및 시스템을 식별하고 워크플로우 요구사항을 검토한다.
- 문서 샘플을 분석해 정보가 어떻게 구조화되어 있는지 이해하고, 일관성이 있는 부분과 다양한 형식이 존재하는 부분을 파악한다. 구현 및 테스트 과정에서 특별한 조치가 필요할 수 있는 데이터의 복잡성을 파악한다.
- 정보 추출 목표를 설정하고 품질 목표를 정한다.
비구조화 데이터 준비
단순한 문서 유형을 제외하고, 대부분의 문서 처리 과정에는 문서 구조와 메타데이터를 캡처하는 사전 처리 단계와 품질 검증 및 정량적 분석이 구현되는 후처리 단계가 포함될 가능성이 높다.
인스타베이스의 제품 책임자인 클레멘스 메왈드는 “경험에 따르면, IDP에서 AI의 전반적인 성능은 주로 복잡한 문서의 디지털화, 구문 분석 및 표현 방식, 즉 LLM이 관여하기 전에 이뤄지는 비구조화 데이터에 기인한다”라고 설명했다.
메왈드는 머신러닝과 AI를 사용해 문서의 의미 구조를 감지하고, 콘텐츠의 스타일과 위치에 대한 메타데이터로 주석을 달며, 표, 체크박스, 서명, 로고와 같은 관련 엔티티를 감지할 것을 권장했다. 그는 “이렇게 표현된 결과물은 LLM이 복잡한 추출 및 추론 질문에 더 잘 답하도록 도와주며, 환각을 피하는 데 도움이 되는 신뢰도 점수와 정확한 출처 계산에 중요한 메타데이터를 제공할 수 있다”라고 말했다.
엠파시스의 라마나탄도 이에 동의하며, IDP를 성공적으로 구현하려면 이미지 노이즈 제거, 정렬 수정, 콘텐츠 표준화 등 강력한 전처리를 통해 깨끗하고 구조화된 LLM용 입력을 보장해야 한다고 조언했다. 그는 “통합이 원활하면 정확성과 효율성이 모두 향상돼 조직이 데이터에서 의미 있는 가치를 추출할 수 있도록 돕는다”라고 설명했다.
LLM 프롬프트 미세 조정으로 문서 처리 정확도 개선
AI 이전의 IDP 기술은 문서에서 한 번 실행되면 새로운 정보 추출 규칙과 패턴을 도입한 후에만 다시 실행되는 경우가 많았다. 그런 다음 애드혹 쿼리를 처리하기 위해 검색 엔진이 사용됐다.
LLM을 사용하면 보다 동적인 처리가 가능하다. 프롬프트와 예제는 LLM이 정보 추출 목표를 향해 나아가도록 안내하고 문서 복잡성을 해결하는 데 도움을 줄 수 있다. 또한 애드혹 쿼리에 동일한 LLM을 사용할 수 있으며, 최종 사용자의 프롬프트에 따라 정보 추출을 개선하기 위한 피드백 메커니즘을 구현할 수 있다.
샌프란시스코 대학의 컴퓨터 과학 교수이자 스냅로직(SnapLogic)의 최고 과학자인 그렉 벤슨은 “생성형 AI와 LLM의 발전으로 자연어를 사용해 원하는 프로그램, 표현 또는 결과를 설명할 수 있게 됐다. 이는 특히 비구조화 및 멀티모달 소스에서 데이터를 추출하는 데 뛰어나다. 기존에는 PDF와 같은 문서에서 정확한 정보를 추출하는 작업을 코드로 작성하기 매우 어려웠다. 이제 프롬프트 엔지니어링의 힘을 실감하고 있다. 원하는 추출 데이터의 몇 가지 예를 공유함으로써 LLM이 미래 입력 문서에 패턴을 적용하는 방법을 어떻게 ‘학습’할 수 있는지 깨닫고 있다”라고 설명했다.
더 스마트한 워크플로우를 위한 IDP 통합
IDP는 문서가 여러 위치에 저장되고 많은 다운스트림 플랫폼, 워크플로우 및 분석이 추출된 정보를 활용할 수 있는 팬인 팬아웃 프로세스다. 문서 저장소와 엔터프라이즈 애플리케이션이 상당히 많은 기업은 통합을 관리하기 위해 iPaaS(서비스형 통합 플랫폼), 데이터 패브릭 및 데이터 파이프라인을 고려할 수 있다.
트레이닷에이아이의 월드론은 “복잡성을 더하는 대신, 기능을 AI 지원 iPaaS에 직접 통합하면 IT 및 개발 팀이 실시간으로 정보를 추출하고 검증할 수 있다. 조직은 시스템 전반에서 비구조화 데이터를 효과적으로 처리함으로써 AI 자동화 잠재력을 극대화할 수 있다”라고 언급했다.
현재 IDP의 한계
LLM과 검색 증강 생성(RAG)이 AI 및 분석을 위해 문서에서 엔티티와 값을 추출하는 역량을 향상시킬 수 있지만, 아직까지는 한계도 있다.
IBM의 왓슨x 플랫폼 담당 부사장인 에드워드 칼베스버트는 “오늘날 가장 우수한 RAG 시스템조차도 주로 정보 제공에 그치고 있으며, 계산을 수행하는 데는 어려움이 따른다. 데이터 레이크하우스 테이블 형식으로 저장된 엔티티 및 값을 결합하고 다양한 데이터 플랫폼에서 액세스할 수 있는, 보다 에이전트에 가까운 시스템으로 발전하려면 생성형 AI 시스템의 정확도와 데이터 거버넌스 개선이 필요하다”라고 설명했다.
특히 문서 구조가 복잡하고 정보 정확도에 대한 기대치가 높거나 여러 부분으로 구성된 정량 분석이 필요한 경우, IT팀은 요구 사항 단계에서 현실적인 기대치를 설정해야 한다. 이러한 상황에서는 사람이 중요한 정보, 분석 및 예외 사항을 직접 검토하는 IDP 워크플로우를 구축하는 것이 중요할 수 있다.
그렇다고 해도 생성형 AI를 활용한 IDP는 정확성을 크게 높이며, 이전보다 예외 사항이 적게 발생한다. 에피안의 베클리는 “전통적인 OCR과 AI 모델을 사용하면 60%의 처리율, 운이 좋으면 70%를 얻었지만, 이제 생성형 AI는 모든 예외 사례를 해결해 처리율을 99%까지 높일 수 있다”라고 말했다.
IDP의 미래
조직은 워크플로우의 이점 외에도 IDP를 사용해 LLM, RAG 및 에이전트 AI 정확도를 향상시킬 방법을 연구해야 한다. IDP 기술은 문서 저장소를 생성형 AI 기능을 지원하는, 보다 구조화된 정보 소스로 전환할 수 있다.
릴레이셔널AI(RelationalAI)의 연구 ML 부사장인 니콜라오스 바실로글루는 “올해 주요 AI/ML 연구 컨퍼런스인 ‘뉴럴PS(NeurIPS)‘에서 연구자들은 생성형 AI가 축구 매뉴얼을 읽고 게임에서 이기는 방법을 학습하는 과정을 시연했다. 곧 생성형 AI는 HR 핸드북을 읽고 직원들에게 서비스를 제공할 수 있게 될 것”이라고 말했다.
‘정책 학습‘ 연구에 따르면 규칙 기반 AI는 중간 난이도의 축구 게임에서 생성형 AI 방법론보다 성능이 우수했지만, 생성형 AI는 고난도 게임에서 더 나은 성능을 보였다. 생성형 AI를 활용한 IDP 기술이 높은 잠재력을 갖고 있는 이유다. 다만 그에 앞서 조직은 적절한 기대치를 설정하고 출력 품질을 반드시 검증해야 한다. 앞으로 IDP는 LLM의 발전과 함께 계속 성장할 것으로 전망된다.
[email protected]
Read More from This Article: 생성형 AI로 자동화 실현한다··· ‘지능형 문서 처리(IDP)’ 체크포인트
Source: News