Papers·2개월 전

CDM: 이산 확산 모델에서 보상 기울기 샘플링을 5% 오버헤드로 해결하는 Twisted SMC 최적화

이산 확산 모델의 보정 샘플링(Twisted SMC)에서 발생하는 계산 병목을 해소하기 위해 Contrastive Distribution Matching(CDM)을 제안했습니다. 학습된 파라미터화된 twist 함수를 통해 SMC 추론 비용을 분산시켰고, 실제 추론 시 기본 모델 대비 5% 미만의 추가 연산만 필요합니다. 독성 텍스트 생성, DNA 서열 설계, 단백질 설계, 확산 LLM 정렬 등 다양한 태스크에서 기존 방법 대비 동일 wall-clock 시간 내에 더 높은 보상 샘플을 생성했습니다.

이산 확산 모델의 보정 샘플링(Twisted SMC)은 계산 비용이 큰데, CDM은 학습된 twist 함수로 이 문제를 5% 오버헤드로 해결했습니다.

핵심 결론

성능 — 독성 텍스트 생성, DNA/단백질 설계, 확산 LLM 정렬 등 4개 태스크에서 기존 대비 동일 시간 내 더 높은 보상 달성.
오버헤드 — 학습된 twist 함수 평가는 기본 모델 forward pass 대비 5% 미만의 추가 연산만 필요.

방법

핵심 아이디어 — Twisted SMC의 최적 twist 함수를 positive/negative 샘플 대비로 학습하는 Contrastive Distribution Matching.
이산 확산 모델의 closed-form forward kernel을 활용해 그래디언트 추정기를 효율적으로 재구성했습니다.
추론 시 학습된 twist 함수를 한 번의 forward pass로 평가해 SMC의 Monte Carlo 근사를 대체합니다.

한계·조건

환경 — 모든 실험은 GPU 기반이며, discrete state space 크기에 따라 twist 함수 용량이 달라질 수 있습니다.
코드 — 논문 내 코드 공개 여부는 명시되지 않았습니다.

편집자 한 줄

Twisted SMC의 실제 적용에서 가장 큰 걸림돌이 twist 함수 추정 비용이었는데, 이를 amortize한 점이 실용적으로 보입니다. 다만 학습 데이터 분포와 추론 시 reward 분포의 mismatch가 있을 경우 robustness를 추가로 확인할 필요가 있겠네요.

#discrete-diffusion
#smc
#alignment
#cdm
#protein-design

Jaihoon Kim

원문 보기 →

CDM: 이산 확산 모델에서 보상 기울기 샘플링을 5% 오버헤드로 해결하는 Twisted SMC 최적화

핵심 결론

방법

한계·조건

Comments