Papers·4일 전
Zhejiang University, LLM이 스스로 데이터를 설계해 모델 성능 57% 향상 — Autonomous Agentic Data Engineering 제안

Zhejiang University 팀이 LLM이 스스로 데이터 엔지니어링 파이프라인을 수행하는 Autonomous Agentic Data Engineering 태스크를 제안했습니다. GPT-5.2가 에이전트로 동작해 반복적으로 학습 데이터를 생성·최적화한 결과, 학생 모델의 성능을 57.29% 개선했습니다. 다만 이는 특정 도메인에 국한된 결과이며, 코드는 GitHub에 공개 예정입니다.
Zhejiang University가 LLM이 스스로 데이터 엔지니어링을 수행해 모델을 특화시키는 Autonomous Agentic Data Engineering 태스크를 공개했습니다.
핵심 결론
- 성능 — GPT-5.2가 에이전트로 동작해 반복적 데이터 최적화를 통해 학생 모델 성능을 57.29% 향상시켰습니다.
- 태스크 — Autonomous Agentic Data Engineering은 LLM이 사람 개입 없이 데이터 계획, 생성, 최적화를 end-to-end로 수행하는 새로운 평가 태스크입니다.
방법
- 프레임워크 — 데이터를 최적화 가능한 구성 요소로 보고, LLM 에이전트가 post-training 성능 개선을 목표로 반복적으로 학습 커리큘럼을 설계합니다.
- 기존 데이터 큐레이션 방식은 사람이 설계한 워크플로우에 의존했지만, 이 연구는 LLM 스스로 파이프라인을 운영할 수 있는지 검증한 점이 새롭습니다.
한계·조건
- 범위 — 실험은 특정 도메인(예: 수학, 코딩 등)에 한정되어 있으며, 일반 도메인에서의 일반화는 추가 검증이 필요합니다.
- 코드 — GitHub에 공개 예정이며, 현재는 abstract와 figure만 확인 가능합니다.
편집자 한 줄
LLM이 스스로 데이터를 개선한다는 발상은 흥미롭지만, 57%라는 수치가 특정 벤치마크에 과적합된 것은 아닌지 후속 연구를 지켜볼 필요가 있습니다.
- #data-engineering
- #llm
- #zhejiang-university
- #agent
Zhejiang University