Papers·1개월 전

OCC-RAG: 1.7B 파라미터 SLM으로 6x 큰 모델과 동등한 멀티홉 추론

OCC 팀이 멀티홉 QA에 특화된 소형 언어 모델 OCC-RAG를 공개했습니다. 0.6B와 1.7B 두 크기로, 합성 데이터 300만 건 이상으로 학습해 HotpotQA, MuSiQue, TAT-QA 등에서 일반 목적 모델 대비 2~6배 큰 모델과 동등하거나 더 나은 성능을 냅니다. 핵심은 추론 과정에서 출처 인용을 생성하도록 설계된 점으로, 컨텍스트 충실도(ConFiQA)와 거절 능력(MuSiQue-Un)에서도 강점을 보입니다.

OCC 팀이 멀티홉 QA에 특화된 소형 언어 모델 OCC-RAG를 공개했습니다. 1.7B 파라미터로 6배 큰 모델과 경쟁합니다.

핵심 결론

벤치 — HotpotQA, MuSiQue, TAT-QA에서 2~6배 큰 일반 모델과 동등 이상의 성능.
충실도 — ConFiQA에서 컨텍스트 충실도가 높고, MuSiQue-Un에서 부적절한 질문에 대한 거절 능력도 우수.

방법

데이터 합성 — 멀티 컨텍스트, 멀티홉 QA 데이터를 대규모로 합성하는 파이프라인을 구축해 300만 개 이상의 예제 생성.
추론 구조 — 모델이 출처 인용을 포함한 구조화된 추론 과정을 생성하도록 학습.
컨텍스트에 충실하도록 설계되어, 파라메트릭 지식에 의존하지 않고 주어진 문단만으로 추론합니다.

한계·조건

규모 — 0.6B와 1.7B 두 크기만 공개, 더 큰 모델은 없음.
공개 — 모델 가중치는 Hugging Face에 공개되었습니다.

편집자 한 줄

소형 모델로도 충분히 강력한 추론이 가능하다는 점을 보여주는 사례네요. 다만 합성 데이터에 대한 의존도가 높아 실제 분포에서의 일반화는 추가 검증이 필요해 보입니다.

#rag
#small-language-model
#multi-hop-qa
#faithfulness
#occ

OCC

원문 보기 →

OCC-RAG: 1.7B 파라미터 SLM으로 6x 큰 모델과 동등한 멀티홉 추론

핵심 결론

방법

한계·조건

Comments