Papers·5일 전
Oppo X-OmniClaw — 통합 모바일 에이전트, UI·시각·음성 통합으로 태스크 신뢰도 향상

Oppo가 Android 생태계에서 멀티모달 이해와 상호작용을 위한 통합 모바일 에이전트 X-OmniClaw를 공개했습니다. Omni Perception이 UI 상태, 실세계 시각, 음성 입력을 temporal alignment로 구조화된 의도 표현으로 변환하고, Omni Memory가 작업 메모리와 개인 장기 메모리를 결합해 맥락 인식 상호작용을 구현합니다. Behavior Cloning과 Trajectory Replay로 사용자 동작을 재사용 가능한 스킬로 캡처해 직접 실행 정확도를 높인 점이 특징입니다. 다만 기술 보고서 수준이라 벤치마크 수치와 오픈소스 여부는 아직 공개되지 않았습니다.
- #mobile-agent
- #multimodal
- #android
- #oppo
- #behavior-cloning
Oppo