출시 48시간 만에 취약점 드러낸 그록-4 AI···다중 회화형 우회 기법에 무력화
xAI가 새롭게 출시한 그록-4가 방어 체계의 허점을 드러내고 있다. 최근 공개된 다중 회화 기반의 유도 우회 기법에 취약한 모습을 보인 것이다. 일론 머스크가 선보인 최신 대형 언어 모델(LLM)이 공개된 지 이틀 만에, 뉴럴트러스트(NeuralTrust) 연구팀은 명시적인 유해 입력 없이도 그록-4의 가드레일(안전장치)을 무력화하고 몰로토프 칵테일 제조법을 끌어내는 데 성공했다. 연구팀은 에코챔버(Echo Chamber)와 크레센도(Crescendo)라는 기법을 조합해, 그록-4로부터 몰로토프…

