로그인

회원가입 | ID/PW 찾기

취재

[NDC 16] 살아 움직이는 유저 통계를 만들자, 엔씨소프트 작업 과정 공개

우리 게임의 진성 유저는 누구인가? 데이터마이닝을 활용한 진성 유저 지표 만들기

장이슬(토망) 2016-04-26 22:21:31

우리 게임의 진성 유저는 누구일까? 게임을 개발하는 사람이라면 누구나 궁금해한다. 많은 게임사가 AU(Active User, 활동 유저)를 확인하지만 단순 숫자와 지표로는 유저의 행동 유형까지 파악할 수가 없다. 어떻게 하면 살아 움직이는 유저를 통계로 볼 수 있을까? 엄혜민 엔씨소프트 데이터분석 담당의 작업 과정을 살펴보자. / 디스이즈게임 장이슬 기자

 



 

■ AU가 높다고 다 좋은 것일까?

 

AU 수치가 평균이었다가 어느 시점에서 급격하게 상승한다. 과연 이것은 좋은 현상일까? 늘어난 유저가 과연 우리 게임을 계속 할지, 우리 게임의 어떤 면이 좋아서 게임을 하는지는 수치에서 알 수 없다. AU가 말해주지 않는 것을 찾아내기 위해 데이터분석 팀이 나섰다. 

 

먼저 어떤 유형의 유저 데이터를 수집할 것인지 용어를 정의하는 과정이 필요했다. 팀이 모여서 '진성 유저'가 무엇인지 토론했다. 엄 담당은 신라 시대 골품제처럼 게임 안에서도 부자이고, 권력을 누리는 유저라고 상상했다. 어떤 팀원은 유료 이용권과 아이템을 많이 사는 유저라 했고, 다른 팀원은 게임에 꾸준히 들어와서 모든 콘텐츠를 고루 즐기는 유저라고 했다. 

 

진성 유저에 대해 저마다 다른 이미지를 갖고 있었다. 진성 유저에 대한 기준을 세우기가 모호해졌다. 우선 게임 기록 데이터를 통해 유저의 행동을 파악해보기로 했다. 산발적인 데이터에서 통계적 규칙이나 패턴을 찾아내는 과정, 즉 데이터마이닝을 시작했다. 

 

 


 

 

■ 나무가 모여 숲, 유저가 모여 유형

 

여기서 케이민즈 클러스터링(K-Means Clustering)이라 불리는 군집분석 기법이 등장했다. 유저 한 명은 어떤 데이터를 갖고 있는 하나의 점이다. 비슷한 성향을 보이는 점이 모이면 비슷한 행동양식을 가진 유저 군집이 탄생한다. 계산을 반복하며 군집의 중심점을 찾는다. 

 

작업을 진행하면 더이상 변화가 없는 시점이 오는데, 이것이 최종적으로 클러스터링이 완료된 모습이다. 물론 평균값의 함정에 빠지지 않도록 다른 데이터를 만드는 것도 잊지 않았다. 특정 활동 수치가 높은 유저가 있으면 해당 군집의 평균값이 올라가므로, 따로 분포도를 만든 것이다. 

 

이번 작업의 경우, 유저 행동의 변화를 추적하기 위해 일주일 단위로 데이터를 수집했다. 이렇게 다섯 개의 유형 데이터가 도출되고 매주마다 유저 유형의 변화에 대해 통계를 낼 수 있게 되었다. 첫 주에 접속한 그룹을 6주 동안 추적해 지속적으로 접속을 하는지, 접속하여 어떤 콘텐츠를 즐기는지, 얼마나 유지가 되는지 살펴볼 수 있었다. 평균 결제 금액이나 아이템의 종류와 갯수도 볼 수 있었다. 

 

데이터가 세세한 만큼 수동으로 작업을 하는 과정도 만만치 않았다. 이를 위해 '의사결정나무'와 '랜덤 포레스트'가 도입되었다. 먼저 의사결정나무란 데이터마이닝에서 사용하는 예측 모델링 기법 중 하나다. 

 

어떤 사람이 골프를 치러 온 날에 대한 통계가 있다. 이 사람이 내일 골프장에 올까? 날씨가 그저 흐린 날에는 골프를 치러 왔지만, 비가 오고 바람이 강한 날에는 오지 않았다. 내일 날씨는 맑다고 하니, 올 확률이 높을 것이다. 이런 결과를 기반으로 의사결정나무가 생성된다. 

 

랜덤 포레스트는 의사결정나무를 여러 개 만드는 것이다. 여러 결과를 취합해 다수결로 선택된 값을 기반으로 랜덤 포레스트를 만들면 자동화 과정이 쉬워진다. 데이터를 입력하면 클러스터링을 통해 유저 유형을 만들고 랜덤 포레스트로 행동을 예측한다. 이런 과정을 반복하면 유저의 행동에 대한 통계가 만들어지는 것이다. 

 

비슷한 성향으로 유저를 분류했다고 하지만, 유저들의 행동에도 변화가 온다. 예컨대 처음에는 게임을 열심히 하다가 한동안 접속을 끊는 유저가 있다. 이 중에서도 어떤 유저는 특정 이벤트나 업데이트 시기에 잠깐 돌아오기도 한다. 이런 유저들의 행동을 수집하여 통계화 작업을 하면 변화 동향도 추적할 수 있다. 

 

 


 

 

■ 왜 이런 작업이 필요한가?

 

게임도 또다른 사회다. 통계를 보면 현실 사회가 어떻게 변화하는지 볼 수 있듯이, 유저의 동향을 통계로 내면 게임 세계의 흐름을 감지할 수 있다. 이벤트의 효과를 알아보거나 업데이트 방향을 기획하는 것에도 유용하게 사용할 수 있다. 하지만 AU만으로는 구체적인 변화를 추적하고 원인을 추론할 수 없기에 진성 유저 지표를 만들게 되었다고 엄혜민 담당은 설명한다. 

 

"유저 분석 외에도 다양한 분야에서 데이터마이닝이 활용되고 있습니다. 게임은 계속 변화하니까요. 이제는 지표를 활용할 때입니다. 구체적으로 어떤 인사이트를 얻어낼 수 있는지, 더 좋은 방법이 있는지는 고민 중에 있습니다."