← Back to feed
Papers·6일 전

IR3DE: Ridge Regression 기반 LLM 추론 라우터 — 도메인 전문가 모델 간 라우팅을 98.4% 성능으로

IR3DE: Ridge Regression 기반 LLM 추론 라우터 — 도메인 전문가 모델 간 라우팅을 98.4% 성능으로

Gensyn 팀이 Ridge Regression 기반의 LLM 추론 라우터 IR3DE를 제안했습니다. 도메인 전문가 모델들 사이에서 각 프롬프트에 가장 적합한 모델을 선형 모델로 빠르게 선택하며, 추론 태스크에서 정규화 성능 98.4%를 달성했습니다. 라우터 재학습 없이 새 전문가 모델을 추가/제거할 수 있는 점이 특징이지만, CLM 설정에서는 기존 방법과 비슷한 수준입니다.

Gensyn 팀이 Ridge Regression 기반의 LLM 추론 라우터 IR3DE를 공개했습니다. 도메인 전문가 모델들 사이에서 각 프롬프트에 가장 적합한 모델을 선형 모델로 빠르게 선택합니다.

핵심 결론

  • 태스크도메인별 전문 LLM 중 프롬프트에 적합한 모델을 선택하는 라우팅.
  • 성능추론(reasoning) 설정에서 정규화 성능 98.4%로 기존 방법을 능가했으며, CLM 설정에서는 유사한 성능.
  • 비용Ridge Regression 기반이라 학습과 추론이 매우 저렴하고 빠릅니다.

방법

  • 모델프롬프트 임베딩을 입력으로 받아 각 도메인 전문가의 점수를 예측하는 선형 Ridge Regression 모델.
  • 동적 구성라우터 재학습 없이 새 전문가 모델을 추가하거나 제거할 수 있어, 서빙 중인 LLM 집합을 유연하게 변경 가능.
  • 두 가지 CLM 설정(모든 도메인이 다음 토큰 예측)과 하나의 추론 설정(도메인별 고유 추론 태스크)에서 평가했습니다.

한계·조건

  • 성능CLM 설정에서는 기존 라우터(예: FrugalGPT, RouteLLM)와 비슷한 수준으로, 큰 우위를 보이지는 않습니다.
  • 코드GitHub(github.com/gensyn-ai/IR3DE)에 공개되어 재현 가능합니다.
  • 가정각 전문가 모델이 특정 도메인에 특화되어 있다는 전제가 필요합니다.

편집자 한 줄

선형 모델로도 추론 태스크에서 좋은 성능을 낸 점이 인상적입니다. 다만 CLM에서는 큰 차이가 없어, 태스크 특성에 따른 적용이 중요해 보입니다.

  • #llm
  • #routing
  • #ridge-regression
  • #gensyn
Gensyn
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —