Papers·2주 전
AgentHijack: MLLM 기반 컴퓨터 사용 에이전트의 내구성 평가 벤치마크 — 사소한 UI 오류에도 성능 급락

TMLR 그룹이 멀티모달 LLM 기반 컴퓨터 사용 에이전트가 팝업, 해상도 변경 등 일상적인 UI 오류에 얼마나 취약한지 평가하는 AgentHijack 벤치마크를 공개했습니다. 9가지 유형의 오류를 주입한 결과, 사소한 방해에도 작업 성공률이 크게 떨어지는 현상을 발견했습니다. 제안한 AgentHijack-Agent 프레임워크는 강화된 접지 능력과 환경 감시 모듈로 이 문제를 완화합니다.
멀티모달 LLM 기반 컴퓨터 사용 에이전트는 복잡한 디지털 워크플로를 자동화하지만, 실제 환경의 예기치 못한 UI 변화에 취약합니다.
핵심 결론
- 벤치마크 — AgentHijack은 9가지 일반적인 UI 오류(팝업, 해상도 변경 등)를 주입해 에이전트의 내구성을 평가합니다.
- 성능 저하 — 사소한 오류만으로도 작업 성공률이 크게 감소하며, 이는 현재 MLLM 기반 에이전트의 취약성을 드러냅니다.
- 해결책 — AgentHijack-Agent는 강화된 접지 능력과 환경 감시(onlooker) 모듈을 통해 내구성을 개선합니다.
방법
- 오류 유형 — 9가지 설정 가능한 오류(예: 팝업, 해상도 변경, 경쟁 앱 등)를 실제 환경에서 흔히 발생하는 시나리오로 구성했습니다.
- AgentHijack-Agent — 액션 생성기(action generator)에 접지 능력을 강화하고, 행동 요약과 환경 상태를 확인하는 감시자(onlooker)를 추가했습니다.
- 실험 결과, 제안 프레임워크가 다양한 오류 상황에서 기존 에이전트보다 높은 성능을 보였습니다.
한계·조건
- 환경 — 벤치마크는 데스크톱 태스크에 한정되며, 웹이나 모바일 환경으로의 일반화는 추가 검증이 필요합니다.
- 코드 — 코드, 환경, 베이스라인 모델, 데이터는 https://AgentHijack.github.io 에서 공개되었습니다.
편집자 한 줄
사용자 입장에서는 사소한 UI 오류에도 에이전트가 멈춰 버리면 신뢰도가 크게 떨어지죠. 이 연구는 실제 배포 전 내구성 평가의 필요성을 잘 보여줍니다.
- #mllm
- #robustness
- #benchmark
- #computer-use
- #agent
TMLR Group