Papers·5일 전
GPT-4o 로 게임 코드 리팩터링은 잘 통했지만 새 기능 생성은 1/3만 성공 — Pygame 사례 연구

IU International University 연구진이 GPT-4o 를 Python/Pygame endless runner 에 적용한 사례 연구에서, 리팩터링 3건은 모두 기능적으로 성공했으나 새로운 게임플레이 기능 생성 3건 중 1건만 정상 통합되었습니다. 기존 시스템 간 상호작용이 필요한 생성 태스크에서 모델이 취약함을 보여주는 결과로, 단일 사례 연구이므로 일반화는 주의해야 합니다.
GPT-4o 가 기존 게임 코드베이스에 통합되는 실용적 능력을 Pygame 환경에서 평가한 탐색적 사례 연구입니다.
핵심 결론
- 리팩터링 — 3개 로컬 리팩터링 태스크 모두 기능적으로 성공 — 기존 구조 내 변경은 안정적.
- 기능 생성 — 3개 게임플레이 기능 생성 중 1개만 정상 통합, 나머지는 시스템 간 상호작용 실패.
방법
- 환경 — 커스텀 Python/Pygame endless runner 에 GPT-4o 로 생성한 코드를 직접 통합.
- 평가 — 소프트웨어 메트릭, 유닛 테스트, 수동 게임플레이 평가로 결과를 측정.
한계·조건
- 설계 — 단일 사례 연구로, 결과는 일반화 가능한 증거가 아닌 탐색적 관찰에 가깝습니다.
- 태스크 — 6개 태스크만 선정, 모델의 전반적 성능을 대표하기엔 표본이 작습니다.
편집자 한 줄
리팩터링은 잘 통했지만 새 기능 생성에서의 낮은 성공률은 LLM 기반 코드 생성이 실제 통합 시나리오에서 여전히 갈 길이 멀다는 점을 시사합니다.
- #gpt-4o
- #code-generation
- #game-development
- #refactoring
- #case-study
IU International University