Papers·1개월 전

OpenClaw, 에이전트 스킬 보안을 위한 67,453개 버전 데이터셋 공개 — 세 가지 스캐너 간 일치율 0.69%

OpenClaw가 에이전트 스킬 보안을 위한 대규모 데이터셋 ClawHub Security Signals를 공개했습니다. 67,453개의 최신 공개 스킬 버전을 VirusTotal, 정적 휴리스틱 분석, NVIDIA SkillSpector 세 가지 스캐너로 분석한 결과, 세 스캐너 모두가 악성으로 판단한 스킬은 0.69%에 불과했고, 81.9%는 단일 스캐너만 플래그를 올렸습니다. 이는 에이전트 스킬 보안이 단일 스캐너가 아닌 다층적 거버넌스가 필요함을 시사합니다.

OpenClaw가 에이전트 스킬 보안 연구를 위한 67,453개 버전의 데이터셋을 공개했습니다.

핵심 결론

데이터셋 — ClawHub Security Signals는 67,453개의 최신 공개 OpenClaw 스킬 버전을 포함하며, SKILL.md와 번들 파일을 익명화한 후 세 가지 스캐너의 판정 결과를 제공합니다.
스캐너 불일치 — 세 스캐너가 동시에 악성으로 판단한 스킬은 0.69%에 불과하며, 81.9%는 단일 스캐너만 플래그를 올렸습니다. 이는 스캐너 간 합의가 매우 낮음을 보여줍니다.

방법

스캐너 구성 — VirusTotal (악성코드 평판), 정적 휴리스틱 분석 (의심 패턴), NVIDIA SkillSpector (에이전트 위험 경고) 세 가지를 사용했습니다.
분석 결과 — SkillSpector는 의심 행위(25,504건) 중 75.3%를 양성으로 판단했지만, 악성(206건) 중에서는 6.8%만 탐지했습니다. 반면 VirusTotal은 악성의 72.8%를 탐지했습니다.

한계·조건

데이터 한계 — 데이터셋은 자동 판정 결과를 기반으로 한 silver-standard로, 인간이 주석을 단 ground truth가 아닙니다. 향후 인간 주석 데이터셋이 개발 중입니다.
재현성 — 데이터셋은 공개되어 있으며, 추가 연구를 위해 초기 스냅샷 형태로 제공됩니다.

편집자 한 줄

스캐너 간 불일치가 이렇게 크다는 점은 에이전트 스킬 보안이 아직 초기 단계임을 보여주네요. 다층적 접근이 필수적이라는 점은 분명합니다.

#agent
#security
#dataset
#openclaw
#skills

OpenClaw

원문 보기 →

OpenClaw, 에이전트 스킬 보안을 위한 67,453개 버전 데이터셋 공개 — 세 가지 스캐너 간 일치율 0.69%

핵심 결론

방법

한계·조건

Comments