Ships·1개월 전

Hugging Face 커뮤니티, 안전 평가 시 추론 연산량을 명시해야 한다는 제안

Hugging Face 커뮤니티 글에서 안전 평가가 정적이지 않고, 적대적 공격자가 사용할 수 있는 다양한 추론 연산량(샘플 수, 재시도, 도구 사용 등)을 고려해야 한다고 주장합니다. 저렴한 단일 평가에서는 안전해 보여도, 더 많은 추론 자원을 투입하면 위험해질 수 있다는 점을 지적하며, 평가 결과에 '예산 라벨'을 붙여 추론 연산량을 명시할 것을 제안합니다. 실무자 입장에서는 모델의 실질적 위험을 평가할 때 이 관점을 반영할 필요가 있겠네요.

#hugging-face
#safety-evals
#test-time-compute
#adversarial

Hugging Face

원문 보기 →

Hugging Face 커뮤니티, 안전 평가 시 추론 연산량을 명시해야 한다는 제안

Comments