Ships·18시간 전
Hugging Face 커뮤니티, 안전 평가 시 추론 연산량을 명시해야 한다는 제안

Hugging Face 커뮤니티 글에서 안전 평가가 정적이지 않고, 적대적 공격자가 사용할 수 있는 다양한 추론 연산량(샘플 수, 재시도, 도구 사용 등)을 고려해야 한다고 주장합니다. 저렴한 단일 평가에서는 안전해 보여도, 더 많은 추론 자원을 투입하면 위험해질 수 있다는 점을 지적하며, 평가 결과에 '예산 라벨'을 붙여 추론 연산량을 명시할 것을 제안합니다. 실무자 입장에서는 모델의 실질적 위험을 평가할 때 이 관점을 반영할 필요가 있겠네요.
- #hugging-face
- #safety-evals
- #test-time-compute
- #adversarial
Hugging Face