Papers·1개월 전

Zhejiang University, LLM이 스스로 데이터를 설계해 모델 성능 57% 향상 — Autonomous Agentic Data Engineering 제안

Zhejiang University 팀이 LLM이 스스로 데이터 엔지니어링 파이프라인을 수행하는 Autonomous Agentic Data Engineering 태스크를 제안했습니다. GPT-5.2가 에이전트로 동작해 반복적으로 학습 데이터를 생성·최적화한 결과, 학생 모델의 성능을 57.29% 개선했습니다. 다만 이는 특정 도메인에 국한된 결과이며, 코드는 GitHub에 공개 예정입니다.

Zhejiang University가 LLM이 스스로 데이터 엔지니어링을 수행해 모델을 특화시키는 Autonomous Agentic Data Engineering 태스크를 공개했습니다.

핵심 결론

성능 — GPT-5.2가 에이전트로 동작해 반복적 데이터 최적화를 통해 학생 모델 성능을 57.29% 향상시켰습니다.
태스크 — Autonomous Agentic Data Engineering은 LLM이 사람 개입 없이 데이터 계획, 생성, 최적화를 end-to-end로 수행하는 새로운 평가 태스크입니다.

방법

프레임워크 — 데이터를 최적화 가능한 구성 요소로 보고, LLM 에이전트가 post-training 성능 개선을 목표로 반복적으로 학습 커리큘럼을 설계합니다.
기존 데이터 큐레이션 방식은 사람이 설계한 워크플로우에 의존했지만, 이 연구는 LLM 스스로 파이프라인을 운영할 수 있는지 검증한 점이 새롭습니다.

한계·조건

범위 — 실험은 특정 도메인(예: 수학, 코딩 등)에 한정되어 있으며, 일반 도메인에서의 일반화는 추가 검증이 필요합니다.
코드 — GitHub에 공개 예정이며, 현재는 abstract와 figure만 확인 가능합니다.

편집자 한 줄

LLM이 스스로 데이터를 개선한다는 발상은 흥미롭지만, 57%라는 수치가 특정 벤치마크에 과적합된 것은 아닌지 후속 연구를 지켜볼 필요가 있습니다.

#data-engineering
#llm
#zhejiang-university
#agent

Zhejiang University

원문 보기 →

Zhejiang University, LLM이 스스로 데이터를 설계해 모델 성능 57% 향상 — Autonomous Agentic Data Engineering 제안

핵심 결론

방법

한계·조건

Comments