[한국정경신문=변동휘 기자] 크래프톤이 AI 에이전트의 게임 수행능력을 평가하는 벤치마크를 만들었다.
크래프톤은 대규모 언어 모델(LLM)을 기반으로 한 벤치마크 ‘Orak’을 공개했다고 16일 밝혔다.
LLM 에이전트가 Orak의 게임을 수행하는 모습 (사진=크래프톤)
Orak은 ‘오락’에서 착안한 이름으로 게임 환경에서 AI의 상황 인식과 판단 및 행동 결정 과정을 정량적으로 분석할 수 있는 평가 체계다. 액션·어드벤처·RPG·시뮬레이션·전략·퍼즐 등 총 6개 장르의 대중적인 게임을 기반으로 설계됐다.
이 체계에는 크래프톤과 엔비디아가 공동 개발한 CPC(코플레이어블 캐릭터)를 통해 축적한 AI 설계 경험이 반영됐다. LLM 기반 AI 에이전트가 복잡한 게임 맥락 속에서 상황을 해석하고 결정하는 능력을 평가하는 것이다. 이를 통해 CPC를 포함한 AI 에이전트의 게임 능력을 반복적으로 검증할 수 있어 AI와 함께 플레이하는 게임 경험의 혁신을 가속화할 것으로 전망된다.
핵심 기술로는 MCP(모델 컨텍스트 프로토콜)가 있다. 게임 정보를 언어 모델이 이해할 수 있는 텍스트 기반의 정보로 전달하고 모델의 응답을 적용 가능한 행동으로 변환하는 역할을 한다. 이를 통해 LLM은 상태를 텍스트나 이미지로 받아들이고 최적의 행동을 선택할 수 있다. 액션 게임에서는 장애물의 위치를 인식한 뒤 이동이나 점프와 같은 판단을 수행하게 된다.
크래프톤은 Orak을 통해 AI 기술 연구의 새로운 기준을 제시하고 향후 게임 산업을 넘어 다양한 산업 분야로 연구를 확장할 예정이다. LLM 파인튜닝용 데이터셋도 함께 제공해 연구자들 사전 학습된 LLM을 실제 게임 환경에 맞게 적용하고 최적화할 수 있다.
크래프톤 이강욱 딥러닝본부장은 “Orak은 크래프톤의 선행 연구와 노하우가 집약된 게임 특화형 LLM 벤치마크로 이를 기반으로 향후 LLM 에이전트 설계 역량을 겨루는 대회도 기획 중”이라며 “앞으로도 게임 분야에 최적화된 LLM 기술을 지속적으로 고도화해 AI를 통한 게임 플레이 경험의 혁신을 주도해 나가겠다”고 밝혔다.