Papers·1개월 전

NUS, VLM 잠재 추론 가정 반증 — 정렬도와 정확도 음의 상관(r=-0.94)

NUS 연구진이 vision-language model(VLM)의 latent visual reasoning(LVR)에서 잠재 변수 정렬도(cosine similarity)와 정답 정확도가 강한 음의 상관(r=-0.94)을 보인다는 사실을 발견했습니다. 다섯 가지 LVR 변형을 체계적으로 비교한 결과, 감독된 잠재 토큰이 실제로는 거의 우회되며, 이를 손상시켜도 정확도 변화가 최대 4포인트에 불과했습니다. 연구진은 PRISM이라는 추론 시간 진단 도구를 제안하며, 기존 가정(정렬도가 좋을수록 성능 향상)이 역전됨을 보였습니다.

VLM의 latent visual reasoning(LVR)에서 정렬도와 성능 간 관계를 체계적으로 분석한 결과, 기존 가정이 성립하지 않음을 밝혔습니다.

핵심 결론

가정 역전 — cosine alignment와 accuracy 간 상관계수 r=-0.94로, 정렬도가 높을수록 오히려 성능이 낮았습니다.
잠재 우회 — 잠재 토큰을 손상시켜도 accuracy 변화가 최대 4p에 불과해, 모델이 잠재 변수를 거의 사용하지 않음을 시사합니다.

방법

실험 설계 — 다섯 가지 LVR 변형(cosine/MSE loss, 다양한 latent 위치)을 matrix로 구성해 비교했습니다.
PRISM — 두 가지 추론 시간 진단 도구: linear probe로 정답 디코딩 가능 위치를 찾고, corruption test로 잠재의 기능적 중요도를 측정합니다.

한계·조건

해석 — Information Bottleneck 관점에서 보조 손실이 공유 파라미터를 통해 언어 모델을 재형성할 뿐, 잠재 변수 자체를 최적화하지 않는다는 설명을 제시합니다.
일반화 — 실험은 특정 VLM 아키텍처와 데이터셋에 국한되며, 다른 구조에서도 동일한 패턴이 나타날지는 추가 검증이 필요합니다.

편집자 한 줄

잠재 변수 기반 추론의 근본 가정을 뒤흔든 연구라 눈여겨볼 만합니다. 다섯 변형 모두에서 일관된 역상관이 나온 점이 특히 인상적이네요.

#vision-language
#latent-reasoning
#nus
#vlm
#interpretability

National University of Singapore

원문 보기 →

NUS, VLM 잠재 추론 가정 반증 — 정렬도와 정확도 음의 상관(r=-0.94)

핵심 결론

방법

한계·조건

Comments