Papers·3개월 전

VLA 모델 안전성 통합 서베이 — 공격·방어·평가·배포 전 영역

VLA(Vision-Language-Action) 모델의 물리적 위험(돌이킬 수 없는 결과, 멀티모달 공격 표면, 실시간 제약, 오류 전파, 데이터 공급망 취약점)을 체계적으로 정리한 서베이입니다. 공격 시점(학습·추론)과 방어 시점(학습·추론)을 축으로 위협을 분류하고, 데이터 포이즈닝·백도어·적대적 패치·크로스모달 변조·semantic jailbreak·freezing attack 등 기존 연구를 망라합니다. 6개 배포 도메인별 안전 과제와 미해결 문제(인증된 강건성, 물리적 실현 가능한 방어, 안전 인식 학습, 통합 런타임 아키텍처, 표준화된 평가)도 제시합니다.

#vla
#safety
#survey
#embodied-ai
#multimodal

Qi Li

원문 보기 →

VLA 모델 안전성 통합 서베이 — 공격·방어·평가·배포 전 영역

Comments