Papers·1개월 전

IR3DE: Ridge Regression 기반 LLM 추론 라우터 — 도메인 전문가 모델 간 라우팅을 98.4% 성능으로

Gensyn 팀이 Ridge Regression 기반의 LLM 추론 라우터 IR3DE를 제안했습니다. 도메인 전문가 모델들 사이에서 각 프롬프트에 가장 적합한 모델을 선형 모델로 빠르게 선택하며, 추론 태스크에서 정규화 성능 98.4%를 달성했습니다. 라우터 재학습 없이 새 전문가 모델을 추가/제거할 수 있는 점이 특징이지만, CLM 설정에서는 기존 방법과 비슷한 수준입니다.

Gensyn 팀이 Ridge Regression 기반의 LLM 추론 라우터 IR3DE를 공개했습니다. 도메인 전문가 모델들 사이에서 각 프롬프트에 가장 적합한 모델을 선형 모델로 빠르게 선택합니다.

핵심 결론

태스크 — 도메인별 전문 LLM 중 프롬프트에 적합한 모델을 선택하는 라우팅.
성능 — 추론(reasoning) 설정에서 정규화 성능 98.4%로 기존 방법을 능가했으며, CLM 설정에서는 유사한 성능.
비용 — Ridge Regression 기반이라 학습과 추론이 매우 저렴하고 빠릅니다.

방법

모델 — 프롬프트 임베딩을 입력으로 받아 각 도메인 전문가의 점수를 예측하는 선형 Ridge Regression 모델.
동적 구성 — 라우터 재학습 없이 새 전문가 모델을 추가하거나 제거할 수 있어, 서빙 중인 LLM 집합을 유연하게 변경 가능.
두 가지 CLM 설정(모든 도메인이 다음 토큰 예측)과 하나의 추론 설정(도메인별 고유 추론 태스크)에서 평가했습니다.

한계·조건

성능 — CLM 설정에서는 기존 라우터(예: FrugalGPT, RouteLLM)와 비슷한 수준으로, 큰 우위를 보이지는 않습니다.
코드 — GitHub(github.com/gensyn-ai/IR3DE)에 공개되어 재현 가능합니다.
가정 — 각 전문가 모델이 특정 도메인에 특화되어 있다는 전제가 필요합니다.

편집자 한 줄

선형 모델로도 추론 태스크에서 좋은 성능을 낸 점이 인상적입니다. 다만 CLM에서는 큰 차이가 없어, 태스크 특성에 따른 적용이 중요해 보입니다.

#llm
#routing
#ridge-regression
#gensyn

Gensyn

원문 보기 →

IR3DE: Ridge Regression 기반 LLM 추론 라우터 — 도메인 전문가 모델 간 라우팅을 98.4% 성능으로

핵심 결론

방법

한계·조건

Comments