Papers·1개월 전

Tsinghua, LLM 에이전트를 OS 프로세스처럼 다루는 Agent libOS 공개 — 장기 실행·감사·재개 가능

Tsinghua 팀이 LLM 에이전트를 OS 프로세스처럼 스케줄링·권한·상태 관리하는 Agent libOS를 제안했습니다. 에이전트를 AgentProcess로 추상화해 툴 호출 경계 대신 런타임 프리미티브에서 권한 검사를 수행하는 점이 핵심. Python 프로토타입으로 123개 회귀 테스트를 통과했지만, 플래너 정확도 자체는 개선하지 않았다는 한계가 있습니다.

Tsinghua 팀이 LLM 에이전트를 OS 프로세스처럼 스케줄링·권한·상태 관리하는 Agent libOS를 제안했습니다.

핵심 결론

아이디어 — 에이전트를 AgentProcess로 추상화해 프로세스 ID, 부모-자식 관계, 생명주기, 상태, 툴 테이블, Object Memory, 권한, 휴먼 큐, 체크포인트, 이벤트, 감사 기록을 관리합니다.
차별점 — 툴 디스패치 자체를 신뢰 경계로 삼지 않고, 런타임 프리미티브(파일 접근, 객체 접근, 슬립, 사람 승인, JIT 툴 등록, 외부 부수효과)에서 명시적 권한·정책 검사를 수행합니다.

방법

설계 원칙 — 툴은 libc 같은 래퍼일 뿐, 실제 권한 경계는 런타임 프리미티브에 있습니다.
구현 — Python 프로토타입은 비동기 스케줄링, 네임스페이스-로컬 Object Memory, 런타임 내장 휴먼 승인, 일회성 권한 부여, 프로세스별 작업 디렉터리, 셸·이미지 등록 프리미티브, Deno/TypeScript JIT 툴, 파일시스템/객체 브리지 툴, 주입 가능한 Resource Provider Substrate 등을 포함합니다.
테스트 — 현재 123개의 회귀 테스트와 결정론적 데모, 실제 모델 스모크 스크립트를 통과했습니다.

한계·조건

정확도 미개선 — 플래너(에이전트의 추론 능력) 자체는 개선하지 않으며, 런타임 인프라에 초점을 맞춥니다.
프로토타입 — Python 프로토타입이며, 실제 프로덕션 환경에서의 성능·안정성 검증은 추가로 필요합니다.
위협 모델 — 논문에서 위협 모델을 설명하지만, 실제 보안 증명이나 formal verification은 포함되지 않았습니다.

편집자 한 줄

LLM 에이전트를 OS 프로세스처럼 다루는 발상은 신선하지만, 플래너 성능 자체를 올리지 않는다는 점에서 실용성은 향후 연구에 달려 있습니다.

#llm-agents
#operating-system
#agent-libos
#tsinghua

Tsinghua University

원문 보기 →

Tsinghua, LLM 에이전트를 OS 프로세스처럼 다루는 Agent libOS 공개 — 장기 실행·감사·재개 가능

핵심 결론

방법

한계·조건

Comments