음성-텍스트 변환 서비스로 주로 알려진 오터.ai(Otter.ai)가 음성으로 활성화되는 AI 에이전트를 발표했다. 15일 출시된 ‘오터 미팅 에이전트’는 요청이 있을 때 활성화되고 받은 질문을 이해하며, 공개 웹이나 내부 문서에서 정보를 가져와 질문에 답변한다.
오터.ai는 이미 웹 인터페이스와 음성 메모를 텍스트로 변환하는 앱을 보유하고 있다. 메모의 요약을 생성하고 텍스트를 통해 시스템에 질문을 할 수 있도록 하는 앱이다. 새로운 에이전트를 활용하면 이제 회의 중에도 음성을 통해 동일한 작업을 수행할 수 있다.
덕분에 즉각적인 정보를 번거로운 타이핑 작업 없이 받아볼 수 있게 됐다고 오터의 샘 리앙 CEO는 밝혔다. 그는 “이 새로운 AI 미팅 에이전트는 실제로 질문에 답하거나 회의에 참여할 수 있다. 뿐만 아니라, 일부 작업을 수행하기 위한 몇 가지 조치를 취할 수도 있다”라고 말했다.
그는 줌 화상 회의 시연에서 사례를 제시했다. 리앙은 참석자로 참여한 AI 에이전트에게 “오터, 오디오 레코더를 발명한 사람은 누구고, 몇 년도에 발명했지?”라고 물었고, 에이전트는 즉시 “오디오 레코더는 1877년에 토마스 에디슨이 발명했다”라고 대답했다.
이 음성 인식 에이전트는 줌에서 운용되며, 앞으로 몇 주 안에 구글 미트와 마이크로소프트 팀즈 소프트웨어에 통합될 예정이다.
회사에 따르면 이 에이전트는 기업 데이터에서 정보를 가져와 질문에 답변할 수도 있다. 예를 들어, 내부 데이터베이스에서 데이터를 선택적으로 가져와 가입자 수 또는 성장률에 대한 질문에 답한다.
이 밖에 후속 회의 예약이나 이메일 초안 작성 등 다른 작업도 수행할 수 있다. 이 시스템은 검색 증강 생성(Retrieval-Augmented Generation)(RAG)을 사용하여 사용자 질의를 분석한 다음, 이를 하위 작업으로 세분화하고 어떤 기능을 호출할지 또는 어떤 내부 시스템에 질의를 전송할지 결정한다. “여러 곳에서 데이터를 가져온 다음, 결과를 요약하는 답변을 생성할 수 있다”라고 리앙은 말했다.
현재 음성 인식 회의 에이전트는 텍스트 기반 요청과 마찬가지로 내부 문서에서 질문에 답하는 온디맨드 기능이다. 에이전트는 음성 요청 시에만 활성화되며 대화를 방해하지 않는다. 리앙은 그러나 에이전트가 곧 적극적인 참여자가 되는 방향으로 나아가고 있다고 제시했다. 잘못된 정보를 수정할 수도 있다는 것이다.
그러나 AI 회의 참가자가 환영 받기까지는 해결해야 할 몇 가지 문제가 있다. 정확성과 사회적 수용이 이에 포함된다. 참가자들은 AI 에이전트에 의해 방해받는 것을 좋아하지 않을 수 있다. 그리고 이 도구가 실수를 저지른다면 이내 신뢰성을 잃게 될 가능성이 있다.
포레스터의 J.P 가운더 애널리스트는 “이러한 서비스가 주류가 되려면 아직 몇 년은 더 걸릴 것 같지만, 매우 논리적이고 잠재적으로 강력한 가치 제안을 제공한다는 점에서 주목할 만하다”라고 말했다.
오터는 현재 무료 등급과 비즈니스 사용자를 위한 월 30달러 요금제를 포함하여 다양한 월간 및 연간 구독 요금제를 갖추고 있다. 구독 서비스에는 가격이 명시되지 않은 기업 요금제도 포함되어 있다. 현재 오터의 구독자 수는 2,500만 명이며, 유료 구독자 수는 알려지지 않았다.
[email protected]
Read More from This Article: 회의에도 참여하는 음성 비서··· 오터.ai, 음성 인식 AI 에이전트 출시
Source: News