← Back to feed
Papers·4일 전

Princeton, LLM 에이전트의 경제적 정렬 — Agent Bazaar 시뮬레이션에서 9B 모델이 frontier 모델 제치다

Princeton, LLM 에이전트의 경제적 정렬 — Agent Bazaar 시뮬레이션에서 9B 모델이 frontier 모델 제치다

Princeton 팀이 LLM을 경제 에이전트로 배치할 때 발생하는 시스템적 위험을 평가하는 멀티에이전트 시뮬레이션 프레임워크 Agent Bazaar를 제안했습니다. B2C 시장에서의 알고리즘 불안정성과 C2C 시장에서의 Sybil 기만이라는 두 가지 실패 모드를 발견했으며, frontier 모델들도 자체 규제에 실패하는 경향을 보였습니다. 이를 해결하기 위해 REINFORCE++와 적응형 커리큘럼으로 학습한 9B 모델이 모든 평가된 모델을 능가했습니다. 경제적 정렬이 일반 능력과 직교하며, 목표 지향 RL로 훈련 가능하다는 점이 핵심입니다.

  • #llm-agents
  • #economic-alignment
  • #multi-agent
  • #reinforcement-learning
  • #princeton
Princeton University

Comments

— 첫 댓글을 남겨보세요 —