← Back to feed
Papers·5일 전

군 대칭성 prior의 샘플 복잡도 이득을 측정하다 — 오히려 잘못된 군은 해롭다

군 대칭성 prior의 샘플 복잡도 이득을 측정하다 — 오히려 잘못된 군은 해롭다

C_n 대칭 태스크에서 equivariant 모델이 augmentation + test-time orbit averaging과 bit-identical validation 곡선을 보여, architecture-vs-augmentation 격차는 비대칭 test-time 계산 조건부임을 밝혔습니다. 잘못된 군 제약은 오히려 성능을 해친다는 점이 가장 깔끔한 발견입니다. 다만 이 연구는 탐색적이며, 사전 등록되지 않았고, 주요 추정량은 사후 채택된 점을 유의해야 합니다.

Equivariant prior가 샘플 복잡도를 |G|배 줄인다는 이론적 예측을 통제된 실험으로 측정한 연구입니다.

핵심 결론

  • 잘못된 군같은 orbit 크기와 compute 조건에서 잘못된 군 제약은 아무 제약보다 성능이 나빴습니다 (joint pairwise CI [+0.79, +3.26], zero 제외).
  • augmentationTest-time orbit averaging을 포함한 augmentation baseline이 equivariant 모델과 epoch별 validation 곡선이 완전히 일치했습니다.
  • 상대 교환율beta_diff = 1.28로 이론값 1.0과 부호 및 크기 일관성을 보였으나, 보수적 bootstrap은 CI [-0.63, +1.72]로 zero를 포함합니다.

방법

  • 상대율 추정량공유 난이도 confound를 상쇄하는 relative-rate estimator를 도입했습니다.
  • 통제군잘못된 군 제어(wrong-group control)와 사전 정의된 실패 분류 체계를 사용했습니다.
  • 한계주 추정량 beta_diff는 초기 분석 후 사후 채택되었으며, coarse N grid에서 OLS slope에 의존합니다.

한계·조건

  • 탐색적 연구사전 등록되지 않았고, 확증적 측정이 아닌 탐색적 연구입니다.
  • 재현성재현 등록 복제는 향후 과제입니다.
  • 일반화방법론은 다른 귀납적 편향으로 전이 가능하나, 본 결과는 C_n 대칭 태스크에 국한됩니다.

편집자 한 줄

잘못된 군이 해롭다는 결과는 직관에 반하지만 통계적으로 깔끔합니다. 다만 탐색적 설계이므로 확증적 해석은 주의가 필요합니다.

  • #equivariance
  • #symmetry
  • #sample-complexity
  • #scaling-law
  • #inductive-bias
Ahmed M. Adly
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —