Papers·1개월 전

MuJoCo-Drones-Gym: 오픈소스 멀티드론 RL 환경 — MuJoCo 기반으로 물리 충실도·처리량·멀티에이전트 동시 지원

TAU Intelligence 팀이 MuJoCo 물리 엔진 위에 구축한 Gymnasium 호환 멀티드론 환경을 공개했습니다. Crazyflie 2.x 나노쿼드콥터를 임의 개수 지원하며, 물리 모델(강체, Python 동역학, 지면효과·블레이드 항력·다운워시), 액션 인터페이스(RPM, 추력, 속도, PID), 관측 공간(운동 상태, RGB/깊이/세그멘테이션 카메라, 이웃 인접성)을 모듈식으로 선택 가능합니다. PettingZoo ParallelEnv 래퍼로 멀티에이전트 RL을 바로 쓸 수 있고, hover·속도 추종·군집 비행·게이트 레이싱 등 7개 태스크가 포함되었습니다. 기존 gym-pybullet-drones 대비 MuJoCo의 접촉 처리·렌더링·병렬화 이점을 활용한 점이 특징입니다.

MuJoCo-Drones-Gym은 MuJoCo 물리 엔진 기반의 Gymnasium 호환 멀티드론 환경으로, 물리 충실도·처리량·멀티에이전트 지원을 동시에 확보한 점이 핵심입니다.

핵심 결론

지원 모델 — Bitcraze Crazyflie 2.x 나노쿼드콥터를 임의 개수 시뮬레이션 가능.
태스크 — hover, 속도 추종, 멀티드론 hover, waypoint 항법, 군집 비행, 게이트 레이싱, 일반 멀티에이전트 템플릿 등 7개 환경 제공.
호환성 — PettingZoo ParallelEnv 래퍼로 멀티에이전트 강화학습(RL)을 바로 적용 가능.

방법

모듈식 API — 물리 모델(강체 MuJoCo, Python 동역학, 지면효과·블레이드 항력·드론 간 다운워시 조합), 액션 인터페이스(RPM, 추력, 속도, PID waypoint), 관측 공간(운동 상태, RGB/깊이/세그멘테이션 카메라, 이웃 인접성)을 선택 가능.
물리 엔진 — MuJoCo의 접촉 처리, 렌더링, 병렬화 이점을 활용해 기존 gym-pybullet-drones 대비 처리량 향상.
오픈소스 — Gymnasium 스타일 인터페이스로 기존 RL 파이프라인에 쉽게 통합.

한계·조건

물리 단순화 — 지면효과·블레이드 항력·다운워시는 선택적 활성화이며, 기본은 강체 모델.
실물 전이 — 시뮬레이션 환경으로, 실제 드론과의 sim-to-real 격차는 별도 검증 필요.
코드 — GitHub에서 오픈소스로 공개 — 라이선스 확인 필요.

편집자 한 줄

멀티드론 RL 연구를 시작하려는 팀에게는 gym-pybullet-drones의 현대적 대안으로 괜찮은 선택지가 될 만합니다.

#reinforcement-learning
#quadcopter
#mujoco
#multi-agent
#simulation

TAU Intelligence

원문 보기 →

MuJoCo-Drones-Gym: 오픈소스 멀티드론 RL 환경 — MuJoCo 기반으로 물리 충실도·처리량·멀티에이전트 동시 지원

핵심 결론

방법

한계·조건

Comments