Papers·6일 전
Equilibrium Reasoners: 반복 잠재 상태 업데이트로 추론 확장, 4만 레이어로 스도쿠 정확도 2.6%→99%

Locus Lab 연구진이 반복적 잠재 상태 업데이트를 통해 테스트 시점 연산을 확장하는 Equilibrium Reasoners (EqR)를 제안했습니다. EqR은 학습된 태스크 조건부 어트랙터(attractor)를 통해 외부 검증기나 태스크별 사전 지식 없이도 깊이(반복 횟수)와 폭(여러 초기화의 확률적 궤적 집계) 두 축으로 추론을 확장합니다. 스도쿠-Extreme 벤치마크에서 피드포워드 모델의 2.6% 정확도를 40,000 레이어에 해당하는 반복 후 99% 이상으로 끌어올렸으나, 이는 단순한 문제는 1~5회 반복으로 충분하고 어려운 문제에만 대규모 연산이 필요하다는 점에서 실용적 한계가 있습니다.
- #test-time-compute
- #reasoning
- #equilibrium-reasoner
- #locus-lab
Locus Lab