Skip to content
Tiatra, LLCTiatra, LLC
Tiatra, LLC
Information Technology Solutions for Washington, DC Government Agencies
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact
 
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact

오픈AI “AI 환각은 피할 수 있다···평가 방식 개선 필요”

오픈AI가 대화형 AI의 고질적 문제인 ‘환각(hallucination)’ 현상에 대한 심층 연구 결과를 공개했다. 환각이란 언어모델이 그럴듯하지만 사실이 아닌 답변을 확신에 찬 듯 생성하는 현상을 말한다.

오픈AI는 블로그에서 이 환각이 지속되는 주요 이유로 현행 AI 훈련·평가 방식을 지목했다. 현재의 평가 체계는 정확도만을 중시해, 모델이 불확실한 상황에서 “모르겠다”라고 답하기보다 추측하도록 유도한다는 것이다.

특히 연구진은 환각을 단순한 기술적 결함이나 불가피한 결과로 보지 않았다. 오히려 답을 모를 때 추측을 하는 것이 점수상 유리하기 때문에 발생하는 문제라고 설명했다. 예를 들어 생일을 묻는 질문에 “9월 10일”이라고 추측하면 365분의 1 확률로 맞을 수 있지만, “모르겠다”라고 답하면 0점을 받기 때문에 모델이 추측을 선택하게 된다.

“정확도를 높이면 환각이 사라진다”는 주장에 대해서도 선을 그었다. 현실에는 본질적으로 답할 수 없는 질문이 존재해 모델의 크기나 성능과 무관하게 정확도 100%는 불가능하다는 것이다. 또한 “환각은 불가피하다”는 통념에도 반대하며, 불확실할 때 답변을 보류(abstain)하는 방식으로 환각을 줄일 수 있다고 표현했다.

‘다음 단어 예측’ 학습이 환각의 뿌리

연구진은 환각의 근본 원인도 짚었다. 언어모델은 대규모 텍스트에서 ‘다음 단어 예측’으로 학습하는데, 옳고 그름을 명확히 구분하는 라벨이 없어 거짓 정보도 자연스러운 언어로 습득하게 된다.

특히 애완동물의 생일처럼 본질적으로 무작위인 정보는 패턴 예측이 불가능해 오류가 불가피하다고 오픈AI는 설명했다. 반면 철자나 괄호 짝 맞추기처럼 규칙성이 뚜렷한 영역은 학습 규모가 커질수록 오류가 줄어든다.

연구진은 해결책으로 평가 체계의 개편을 제안했다. 확신에 찬 오답에는 더 큰 감점을, 불확실성을 솔직히 표현한 답변에는 부분 점수를 주자는 것이다. 오픈AI는 “정확도만을 중시하는 기존 평가 방식을 바꿔야 한다”며 “현재의 순위표가 운 좋은 추측에 보상을 주는 한, 모델들은 계속 추측을 학습할 것”이라고 지적했다.

오픈AI는 “최신 모델의 환각률은 점차 낮아지고 있으며, 언어모델의 확신에 찬 오답을 줄이기 위해 지속적으로 연구를 이어가고 있다”고 덧붙였다.
jihyun.lee@foundryco.com


Read More from This Article: 오픈AI “AI 환각은 피할 수 있다···평가 방식 개선 필요”
Source: News

Category: NewsSeptember 8, 2025
Tags: art

Post navigation

PreviousPrevious post:Volkswagen Japan sales streamlines IT with analyticsNextNext post:“권한은 없는데 책임만 진다” 현직 CISO들이 뽑은 ‘최대 불만 요소’

Related posts

オプトインからオプトアウトへ―次世代医療基盤法が変えた医療データのルール
December 13, 2025
AI ROI: How to measure the true value of AI
December 13, 2025
Analytics capability: The new differentiator for modern CIOs
December 12, 2025
Stop running two architectures
December 12, 2025
法令だけでは足りない―医療情報ガイドラインと医療DXのリアル
December 12, 2025
SaaS price hikes put CIOs’ budgets in a bind
December 12, 2025
Recent Posts
  • オプトインからオプトアウトへ―次世代医療基盤法が変えた医療データのルール
  • AI ROI: How to measure the true value of AI
  • Analytics capability: The new differentiator for modern CIOs
  • Stop running two architectures
  • 法令だけでは足りない―医療情報ガイドラインと医療DXのリアル
Recent Comments
    Archives
    • December 2025
    • November 2025
    • October 2025
    • September 2025
    • August 2025
    • July 2025
    • June 2025
    • May 2025
    • April 2025
    • March 2025
    • February 2025
    • January 2025
    • December 2024
    • November 2024
    • October 2024
    • September 2024
    • August 2024
    • July 2024
    • June 2024
    • May 2024
    • April 2024
    • March 2024
    • February 2024
    • January 2024
    • December 2023
    • November 2023
    • October 2023
    • September 2023
    • August 2023
    • July 2023
    • June 2023
    • May 2023
    • April 2023
    • March 2023
    • February 2023
    • January 2023
    • December 2022
    • November 2022
    • October 2022
    • September 2022
    • August 2022
    • July 2022
    • June 2022
    • May 2022
    • April 2022
    • March 2022
    • February 2022
    • January 2022
    • December 2021
    • November 2021
    • October 2021
    • September 2021
    • August 2021
    • July 2021
    • June 2021
    • May 2021
    • April 2021
    • March 2021
    • February 2021
    • January 2021
    • December 2020
    • November 2020
    • October 2020
    • September 2020
    • August 2020
    • July 2020
    • June 2020
    • May 2020
    • April 2020
    • January 2020
    • December 2019
    • November 2019
    • October 2019
    • September 2019
    • August 2019
    • July 2019
    • June 2019
    • May 2019
    • April 2019
    • March 2019
    • February 2019
    • January 2019
    • December 2018
    • November 2018
    • October 2018
    • September 2018
    • August 2018
    • July 2018
    • June 2018
    • May 2018
    • April 2018
    • March 2018
    • February 2018
    • January 2018
    • December 2017
    • November 2017
    • October 2017
    • September 2017
    • August 2017
    • July 2017
    • June 2017
    • May 2017
    • April 2017
    • March 2017
    • February 2017
    • January 2017
    Categories
    • News
    Meta
    • Log in
    • Entries feed
    • Comments feed
    • WordPress.org
    Tiatra LLC.

    Tiatra, LLC, based in the Washington, DC metropolitan area, proudly serves federal government agencies, organizations that work with the government and other commercial businesses and organizations. Tiatra specializes in a broad range of information technology (IT) development and management services incorporating solid engineering, attention to client needs, and meeting or exceeding any security parameters required. Our small yet innovative company is structured with a full complement of the necessary technical experts, working with hands-on management, to provide a high level of service and competitive pricing for your systems and engineering requirements.

    Find us on:

    FacebookTwitterLinkedin

    Submitclear

    Tiatra, LLC
    Copyright 2016. All rights reserved.