Papers·1개월 전

Penn, diffusion policy 의 고주파 잡음 억제 — 15개 태스크에서 smoothness +0.8x

Penn 대학 팀이 diffusion policy 의 action jitter 문제를 해결하는 Frequency Guidance Operator (FGO) 를 제안했습니다. 기존 diffusion policy 가 사람 시연의 고주파 잡음을 증폭하는 문제를, 생성 과정에서 sub-frequency manifold 를 점진적으로 확장하는 방식으로 완화합니다. 5개 벤치마크 15개 태스크에서 smoothness 와 temporal consistency 를 유의미하게 개선했으며, task 성공률도 떨어지지 않았습니다.

Penn 대학이 diffusion policy 의 action jitter 를 억제하는 주파수 기반 알고리즘 FGO 를 공개했습니다.

핵심 결론

태스크 — 5개 벤치마크 15개 로봇 조작 태스크에서 smoothness 와 temporal consistency 개선.
개선폭 — 기존 diffusion policy 대비 action smoothness 지표가 0.8x 이상 향상되었고, task 성공률은 유지.

방법

핵심 아이디어 — diffusion 의 denoising 과정에서 noisy sample 을 sub-frequency manifold 로 유도한 뒤 점차 spectral band 를 확장.
고주파 잡음을 직접 제거하지 않고, 생성 경로를 조정함으로써 저주파 구조를 보존하는 게 특징입니다.

한계·조건

데이터 — 모든 태스크가 사람 시연 데이터 기반 — 시연 품질에 따라 결과가 달라질 수 있습니다.
코드 — 프로젝트 페이지에서 코드 공개 예정 — 현재는 abstract 와 figure 만 확인 가능.

편집자 한 줄

고주파 잡음 문제는 diffusion policy 의 고질적 약점이었는데, FGO 는 추가 학습 없이 inference 단계만 건드려서 실용성이 높아 보입니다.

#diffusion-policy
#robotics
#behavior-cloning
#frequency-guidance
#penn

University of Pennsylvania

원문 보기 →

Penn, diffusion policy 의 고주파 잡음 억제 — 15개 태스크에서 smoothness +0.8x

핵심 결론

방법

한계·조건

Comments