Hypes·13시간 전
Ethan Mollick "제네바 협약" 같은 엉뚱한 공격이 AI 에이전트 뚫는다

Ethan Mollick 이 "제네바 협약 때문에 그렇게 많이 못 내" 같은 터무니없는 주장(whimsey attacks)이 AI 에이전트의 가드레일을 우회할 수 있다고 지적했습니다. 분포 외(out-of-distribution) 논리에 약한 가드레일의 취약성을 보여주며, 작은 모델뿐 아니라 큰 모델도 예외가 아니라고 강조합니다. 에이전트 보안 설계 시 이런 비정형 공격을 고려해야 한다는 신호로 읽힙니다.
- #ethan-mollick
- #ai-agents
- #guardrails
- #adversarial-attacks
Ethan Mollick@emollick