Papers·2개월 전

AI 연구자가 LLM 정책 합성 파이프라인을 자동 재설계 — 사회적 딜레마에서 수동 설계 초월

Víctor Gallego 연구가 외부 AI 연구자 에이전트가 LLM 기반 다중 에이전트 정책 합성 시스템의 내부 파이프라인(시스템 프롬프트, 피드백 함수, 헬퍼 라이브러리, 반복 로직)을 자동으로 재설계하는 two-level autoresearch 프레임워크를 제안했습니다. Cleanup과 Gathering 게임에서 두 가지 정책 합성 LLM과 두 가지 복지 목표(효율, Rawlsian maximin)에 대해 수동 설계 기준선을 능가했으며, maximin 조건에서만 공정성 메커니즘이 자동으로 삽입된 점이 흥미롭습니다. 단, 실험은 두 게임에 국한되었고 코드는 공개되었습니다.

외부 AI 연구자가 LLM 정책 합성기의 내부 파이프라인을 자동으로 재설계하여 사회적 딜레마에서 협력을 유도하는 two-level autoresearch 프레임워크입니다.

핵심 결론

성능 — Cleanup과 Gathering 게임에서 효율과 maximin 복지 모두 수동 설계 기준선을 능가, 특히 run-to-run 분산이 크게 감소했습니다.
목표 의존성 — maximin 조건에서만 연구자가 명시적 공정성 메커니즘을 파이프라인에 주입했으며, 이는 자신의 시스템 프롬프트에는 없는 새로운 설계입니다.

방법

Two-level loop — 외부 연구자 에이전트 R(코딩 에이전트)이 내부 LLM 정책 합성기의 소스 코드를 읽고, 시스템 프롬프트, 피드백 함수, 헬퍼 라이브러리, 반복 로직을 편집한 후 평가하여 유지 여부를 결정합니다.
정보 설계 — 연구자가 제한된 합리성을 가진 합성기에게 복지 목표에 따라 무엇을 공개할지 선택한다는 정보 설계 관점에서 해석 가능합니다.

한계·조건

게임 범위 — Cleanup과 Gathering 두 게임에만 검증되어 일반화 가능성은 추가 연구가 필요합니다.
코드 — GitHub에 공개되어 재현 가능합니다.

편집자 한 줄

자동으로 발견된 공정성 메커니즘이 목표 의존적이라는 점이 특히 흥미롭습니다. 확장된 게임 및 LLM에서도 유사한 패턴이 나타날지 지켜볼 만합니다.

#autoresearch
#multi-agent
#social-dilemma
#llm
#alignment

Víctor Gallego

원문 보기 →

AI 연구자가 LLM 정책 합성 파이프라인을 자동 재설계 — 사회적 딜레마에서 수동 설계 초월

핵심 결론

방법

한계·조건

Comments