← Back to feed
Papers·1주 전

웹 에이전트의 행동 추적만으로 LLM 식별 가능 — 14개 모델, 96% F1

웹 에이전트의 행동 추적만으로 LLM 식별 가능 — 14개 모델, 96% F1

웹사이트가 사용자 몰래 LLM 기반 에이전트의 행동과 상호작용 타이밍을 추적해 어떤 모델인지 식별할 수 있다는 연구가 나왔습니다. 14개 최신 LLM과 4가지 웹 환경에서 수동 JavaScript 트래커로 수집한 액션 시퀀스만으로 최대 96% F1 점수로 모델을 구별했네요. 분류기는 모델 크기와 계열 간에도 일반화되며, 소수의 상호작용만으로도 훈련 가능하고 에피소드 초반부터 식별이 가능합니다. 지연 시간을 무작위로 추가하면 성능이 떨어지지만, 재훈련하면 다시 회복되어 완전한 방어는 어렵다는 점이 한계입니다.

  • #llm
  • #security
  • #web-agent
  • #privacy
  • #identification
William Lugoloobi

Comments

— 첫 댓글을 남겨보세요 —