게임은 인공지능(AI)가 활동하는 주요 무대 중 하나다. 하지만, 게임 속 몬스터나 NPC로 구현되는 AI 만이 아닌, 게임 데이터를 분석하고 유저의 행동을 예측하는 AI는 잘 알려져 있지 않다.
오늘(26일), 서정민 넥슨 코리아 기획자는 자신의 NDC 17 강연 '데이터와 AI시대를 맞이하는 게임 기획자 이야기'에서 게임 기획자의 데이터 처리와 현재 AI의 추세를 다뤘다.
강연을 맡은 서정민 넥슨코리아 기획자
서정민 기획자는 AI를 공부한 이유에 대해 "보다 객관적으로 분석, 판단하기 위해서"라고 밝혔다. 알파고 붐과 "AI를 얻는 사람이 미래의 슈퍼파워를 가진다"는 AI 전문가 앤드류 응 교수의 말에도 영향을 받았다.
AI를 배우기 위해, 데이터를 수집해 정보화하기 시작했다. 시작은 엑셀이었다. <카운터 스트라이크 온라인 2> 유저 성향 데이터를 분석하는 일을 할 때, 엑셀은 익숙하고 직관적이며 다양한 데이터 분석 기능을 제공한다는 장점이 있었다.
하지만, 엑셀은 용량 한계와 긴 로딩 시간, 프리징 문제가 있었다. 그래서 서정민 기획자는 통계 프로그래밍 언어인 ‘R’을 선택했다. R은 엑셀에 비해 진입장벽은 높지만, 복잡한 문제를 해결하기 쉽고, 오픈 소스라 구글링으로 원하는 함수를 구하는 이점이 있다.
R을 배우면서 서정민 기획자는 본격적인 '머신 러닝'을 시작했다고 밝혔다. 하지만, <카운터 스트라이크 온라인 2>는 유저가 어떤 모드, 어떤 유저와 하는지에 따라 게임 경험 차이가 너무 달랐다. 유저들의 요구사항과 성향이 굉장히 다양해지자, 그는 머신 러닝 알고리즘을 도입해 유저들의 이탈 원인을 분석했다. 이탈하는 케이스와 이탈하지 않는 케이스로 데이터를 분류하면, 그 케이스에 맞춰 유저의 행동을 예측할 수 있기 때문이다.
과적합이 일어난 데이터(우) 이런 예측은 아무런 도움이 되지 않는다.
다만, 오차를 최소화하는 데이터 선택을 잘 하도록 주의해야 했다. 이것이 잘 되지 않을 경우, 과적합이 발생한다. '과적합(overfitting)'이란, 특정 데이터 샘플에 맞춰져 현실의 일반적인 상황에 안 맞는 상황을 말한다. 일례로 그는 타 게임의 머신 러닝기반 승률 예측 모델을 <카운터 스트라이크 온라인 2>에 훈련 시켜 써봤는데, 예측이 불가능한 결과가 나왔다고 말했다.
현재 넥슨은 <카운터 스트라이크 온라인 2>에서 인간적인 AI를 기존 AI와 융합하는 작업을 하고 있다. 일종의 '딥 러닝'을 응용한 경우다. 그는 딥 러닝이 인간처럼 실제 행동할 수 있게 되면서, ‘게임에서의 과제는 앞으로 딥 러닝 같은 고도의 AI를 어떻게 활용할 것인가에 달렸다고 전망했다.
마지막으로, 서정민 기획자는 "비록 콜럼버스(선구자)는 될 수 없지만, 신대륙의 바다에서 고기를 잡아보는 마음으로 AI 영역에서 계속 공부하고 있다. 많은 강연을 통해 AI 관련 내용이 다뤄지기를 바란다"라며 강연을 마무리했다.