Papers·2일 전
Macaron-A2UI: Generative UI 로 개인 에이전트 상호작용 혁신 — 754B 모델, A2UI-Bench 75.6 점

Mind Lab 팀이 개인 에이전트를 위한 Generative UI 모델 Macaron-A2UI 를 공개했습니다. 정적 텍스트 채팅 대신 동적으로 UI 요소(정보 수집, 선호도 확인, 다중 목표 정리)를 생성해 상호작용을 개선합니다. 30B/235B/754B 규모로 학습했으며, A2UI-Bench 에서 스키마 힌트 없이 75.6 점을 기록해 가장 강력한 full-schema baseline 을 넘겼습니다. 단, 754B 모델은 추론 비용이 크고, 평가 벤치마크가 특정 도메인에 편향될 가능성이 있습니다. 모델과 벤치마크는 공개되었습니다.
- #generative-ui
- #personal-agent
- #mind-lab
- #a2ui-bench
Mind Lab