Papers·6일 전
Kairos: 네이티브 월드 모델 스택 — 크로스-임보디먼트 데이터 커리큘럼과 하이브리드 선형 시간 어텐션

Kairos 팀이 Physical AI 를 위한 네이티브 월드 모델 스택을 공개했습니다. 크로스-임보디먼트 데이터 커리큘럼으로 비디오·인간 행동·로봇 상호작용을 계층적으로 학습하고, Hybrid Linear Temporal Attention 으로 장기 상태 전파를 수학적으로 보장합니다. 서버 및 컨슈머 하드웨어에서 실시간 추론이 가능하며, 임보디드 월드 모델·장기 태스크·액션 폴리시 벤치에서 최고 수준의 효율-성능 트레이드오프를 달성했습니다.
Kairos 팀이 Physical AI 를 위한 네이티브 월드 모델 스택을 공개했습니다. 크로스-임보디먼트 데이터 커리큘럼과 하이브리드 선형 시간 어텐션으로 장기 상태 전파를 수학적으로 보장합니다.
핵심 결론
- 벤치 — 임보디드 월드 모델·장기 태스크·액션 폴리시 벤치에서 최고 수준 성능, 효율-능력 트레이드오프 우수.
- 수학 보장 — 시간적 분해가 오차 누적을 엄격히 제한함을 이론적으로 증명.
방법
- 네이티브 사전학습 — 오픈월드 비디오·인간 행동·로봇 데이터를 점진적 발달 경로로 구성하는 Cross-Embodiment Data Curriculum 도입.
- 통합 아키텍처 — Hybrid Linear Temporal Attention: 슬라이딩 윈도우로 국소 역학, 확장 슬라이딩 윈도우로 중간 범위 의존성, 게이트 선형 어텐션으로 전역 메모리 유지.
- 세 가지 기능(이해·생성·예측)을 단일 아키텍처에서 통합.
한계·조건
- 환경 — 서버 및 컨슈머 GPU 에서 실시간 추론 가능하나, 특정 하드웨어 사양 명시는 없음.
- 코드 — Hugging Face 논문 페이지에 abstract 와 figure 만 공개, 코드 및 모델 가중치 공개 여부 미정.
편집자 한 줄
장기 상태 전파의 수학적 보장과 실제 하드웨어에서의 효율성을 동시에 챙긴 점이 인상적입니다. 후속 오픈소스 공개가 기대됩니다.
- #world-model
- #physical-ai
- #kairos
- #attention
- #embodied-ai
Kairos Team