Papers·2개월 전

Qualcomm, 온디바이스-클라우드 하이브리드 멀티 에이전트 시스템의 설계 공간 체계적 분석

Qualcomm 연구진이 온디바이스 SLM과 클라우드 LLM을 결합한 하이브리드 멀티 에이전트 시스템의 설계 공간을 체계적으로 분석했습니다. 두 가지 대표 MAS 아키텍처를 하이브리드 추론에 맞게 변형하고, 개별 설계 선택이 전력·비용·성능의 Pareto frontier에 미치는 영향을 측정했습니다. 결과는 최적 아키텍처가 태스크에 크게 의존하며, 더 큰 프론티어급 연산이 항상 더 나은 성능으로 이어지지 않는다는 점을 보여줍니다.

Qualcomm이 온디바이스 SLM과 클라우드 LLM을 결합한 하이브리드 멀티 에이전트 시스템의 설계 공간을 체계적으로 분석한 연구를 공개했습니다.

핵심 결론

태스크 의존성 — 최적 하이브리드 아키텍처는 태스크에 따라 크게 달라지며, 단순히 더 큰 LLM을 사용한다고 성능이 항상 좋아지지는 않습니다.
Pareto frontier — 정확도·비용·에너지 소비 간 트레이드오프를 체계적으로 측정하여 각 설계 선택이 operating point를 어떻게 이동시키는지 보여줍니다.

방법

아키텍처 — 두 가지 대표 MAS 아키텍처(중앙 조정형, 분산형)를 하이브리드 추론에 맞게 확장하여, SLM과 LLM이 협력하는 방식을 설계했습니다.
실험 변수 — SLM 크기, LLM 호출 빈도, 에이전트 수, 태스크 복잡도 등을 변화시키며 Pareto frontier를 매핑했습니다.

한계·조건

환경 — 온디바이스 SLM은 Qualcomm Snapdragon 칩셋에서, LLM은 클라우드 API를 통해 평가되었으며, 특정 하드웨어에 최적화된 결과일 수 있습니다.
범위 — 분석은 제한된 태스크 세트(주로 QA, 추론)에 대해 수행되었으며, 더 다양한 도메인으로의 일반화는 추가 검증이 필요합니다.

편집자 한 줄

하이브리드 MAS 설계에 대한 첫 체계적 분석이라는 점에서 의미가 있으며, 실제 배포 시 태스크별 튜닝이 필수적임을 수치로 보여준 점이 유용합니다.

#multi-agent
#hybrid-inference
#qualcomm
#on-device-ai

Qualcomm

원문 보기 →

Qualcomm, 온디바이스-클라우드 하이브리드 멀티 에이전트 시스템의 설계 공간 체계적 분석

핵심 결론

방법

한계·조건

Comments