Ships·1개월 전

Hugging Face, Darwin-28B-Opus 공개 — GPQA Diamond 88.89%, 훈련 없이 가중치 재조합

VIDRAFT 연구팀이 Darwin Family 시리즈를 발표했습니다. 기존 체크포인트의 가중치 공간을 재조합해 단 한 번의 gradient 훈련 없이 GPQA Diamond 88.89%를 달성한 Darwin-28B-Opus가 주력 모델입니다. 기존 모델 병합(heuristic 또는 search-based)과 달리 14차원 적응형 게놈으로 Attention·FFN·MLP 등 구성 요소 단위의 재조합을 가능하게 했습니다. 훈련 비용이 없는 점은 매력적이지만, 추론 시 원본 모델 대비 latency나 메모리 영향은 아직 보고되지 않았네요. 논문은 현재 Hugging Face Daily Papers 3위입니다.

#hugging-face
#darwin-family
#model-merging
#zero-training
#reasoning

Hugging Face

원문 보기 →

Hugging Face, Darwin-28B-Opus 공개 — GPQA Diamond 88.89%, 훈련 없이 가중치 재조합

Comments