Papers·어제
PRISM: 디코더 전용 트랜스포머로 광학 박막 설계 — MAE 50% 개선, 파라미터 1/5

Runtian Wang 팀이 광학 박막 설계의 역문제를 해결하는 디코더 전용 트랜스포머 PRISM을 제안했습니다. 재료 선택(이산)과 두께 회귀(연속)를 단일 백본에서 공동 예측하며, 스펙트럼 프리픽스 컨디셔닝과 누적 깊이 RoPE를 도입했습니다. 13M 모델이 기존 트랜스포머 대비 MAE 50% 이상 감소, 파라미터는 1/5 수준이며, 44M 변종은 MAE 0.010으로 SOTA를 달성했습니다. 다만 벤치마크가 in-distribution에 국한되어 범용성은 추가 검증이 필요합니다.
광학 박막 설계의 복잡한 조합-연속 최적화 문제를 디코더 전용 트랜스포머로 단일화한 접근법입니다.
핵심 결론
- 성능 — PRISM-13M이 기존 트랜스포머 대비 MAE 50% 이상 감소, 파라미터는 1/5만 사용.
- SOTA — 44M 변종은 in-distribution 검증에서 MAE 0.010으로 최고 성능, simulated annealing보다 훨씬 빠름.
방법
- 아키텍처 — 디코더 전용 autoregressive transformer로, 재료 선택(discrete)과 두께 회귀(continuous)를 joint prediction.
- 스펙트럼 프리픽스 — 표준 prefix token으로 target 스펙트럼을 in-context 주입.
- 누적 깊이 RoPE — 연속 두께를 위치 임베딩에 직접 인코딩해 물리적 공간 관계 보존.
한계·조건
- 범위 — 벤치마크는 in-distribution에 국한되어, out-of-distribution 일반화는 추가 검증 필요.
- 코드 — Hugging Face에 모델 가중치와 코드가 공개되어 재현 가능.
편집자 한 줄
광학 설계 도메인에 트랜스포머를 적용한 점이 신선하지만, 실제 제조 공정에서의 robustness는 아직 확인되지 않았습니다.
- #transformer
- #inverse-design
- #optical-coatings
- #prism
Runtian Wang