Papers·어제
NVIDIA, 코딩 에이전트로 로봇 조작 자동화 — ENPIRE 프레임워크로 99% 성공률

NVIDIA 연구진이 코딩 에이전트를 활용해 실제 로봇 조작 학습을 자동화하는 ENPIRE 프레임워크를 공개했습니다. 환경 리셋, 정책 실행, 결과 검증, 반복 개선의 물리적 피드백 루프를 코드로 구현해, 핀 박스 정리나 지퍼타이 체결 같은 까다로운 작업에서 99% 성공률을 달성했습니다. 다만 실험 환경이 통제된 연구실 세팅이며, 코드 공개 여부는 아직 확인되지 않았습니다.
NVIDIA가 코딩 에이전트가 스스로 로봇 조작 정책을 개선하는 폐쇄 루프 시스템 ENPIRE를 제안했습니다.
핵심 결론
- 성능 — 핀 박스 정리, 지퍼타이 체결, 도구 사용 등 까다로운 작업에서 99% 성공률.
- 자동화 — 코딩 에이전트가 로그 분석, 문헌 참고, 코드 수정을 반복하며 사람 개입 없이 정책을 개선합니다.
방법
- ENPIRE — Environment(자동 리셋·검증), Policy Improvement(정책 개선), Rollout(병렬 평가), Evolution(로그 분석·코드 수정) 네 모듈로 구성.
- 에이전트는 실패 사례를 분석해 훈련 레시피나 알고리즘 코드를 직접 수정하는 식으로 진화합니다.
한계·조건
- 환경 — 실험은 통제된 연구실 세팅에서 진행되었으며, 실제 잡다한 환경에서의 일반화는 추가 검증이 필요합니다.
- 리소스 — 로봇 플릿을 병렬로 운영할 경우 가속화되지만, 단일 로봇에서는 시간이 더 소요됩니다.
- 코드 — 현재 코드 공개 여부는 불명확합니다.
편집자 한 줄
코딩 에이전트가 물리적 피드백 루프를 자동화한 점은 신선하지만, 실패 케이스의 다양성과 안전성 문제는 아직 풀어야 할 숙제로 보입니다.
- #robotics
- #coding-agent
- #nvidia
- #dexterous-manipulation
NVIDIA