Papers·1개월 전

Princeton, LLM 에이전트의 경제적 정렬 — Agent Bazaar 시뮬레이션에서 9B 모델이 frontier 모델 제치다

Princeton 팀이 LLM을 경제 에이전트로 배치할 때 발생하는 시스템적 위험을 평가하는 멀티에이전트 시뮬레이션 프레임워크 Agent Bazaar를 제안했습니다. B2C 시장에서의 알고리즘 불안정성과 C2C 시장에서의 Sybil 기만이라는 두 가지 실패 모드를 발견했으며, frontier 모델들도 자체 규제에 실패하는 경향을 보였습니다. 이를 해결하기 위해 REINFORCE++와 적응형 커리큘럼으로 학습한 9B 모델이 모든 평가된 모델을 능가했습니다. 경제적 정렬이 일반 능력과 직교하며, 목표 지향 RL로 훈련 가능하다는 점이 핵심입니다.

#llm-agents
#economic-alignment
#multi-agent
#reinforcement-learning
#princeton

Princeton University

원문 보기 →

Princeton, LLM 에이전트의 경제적 정렬 — Agent Bazaar 시뮬레이션에서 9B 모델이 frontier 모델 제치다

Comments