Papers·2일 전
AI 공동-수학자, FrontierMath Tier 4에서 48% 달성 — 열린 문제 해결 지원

AI 공동-수학자는 수학자가 대화형으로 AI 에이전트를 활용해 개방형 연구를 수행할 수 있는 워크벤치입니다. 아이디어 발상, 문헌 검색, 계산 탐색, 정리 증명, 이론 구축을 비동기·상태 저장 방식으로 지원하며, 실패한 가설을 추적하고 수학적 아티팩트를 출력합니다. 초기 테스트에서 연구자들이 미해결 문제를 해결하고 새로운 연구 방향을 찾도록 도왔으며, FrontierMath Tier 4에서 48%를 기록해 기존 AI 시스템 중 최고 점수를 갱신했습니다.
- #ai-mathematician
- #theorem-proving
- #frontiermath
- #interactive-ai
Daniel Zheng