로그인

회원가입 | ID/PW 찾기

NDC

[NDC 19] 유저들은 우리 게임을 언제까지 즐길까? 3개 함수로 추정하는 LT, LTV

김승현(다미롱) 2019-04-25 21:53:38

효과적인 마케팅이란 무엇일까? 간단하다. 유저를 끌어들이기 위해 쓴 돈보다, 유저가 게임에 들어와 쓴 돈이 더 크면 성공한 마케팅이다.

 

하지만 게임은 이 부분에서 셈이 조금 더 복잡해진다. 현재 한국에서 서비스되고 있는 대부분의 게임은 엔딩 없는 부분유료화 라이브 서비스형 게임이고, 유저가 이 게임을 하며 얼마나 돈을 쓸지 명확하게 알 수 없다. 그렇다면 마케터는 효과적인 마케팅을 위해 얼마의 돈을 써야할까?

 

데브시스터즈의 데이터 과학 그룹의 박주홍 그룹장과 장세진 과학자는 25일, NDC 2019 강연에서 이런 물음에 대한 답을 구할 수 있는 방법을 소개했다. 유저가 한 게임에서 쓸 돈의 총량(LTV)을 계산하는 방법, 이를 위해 유저가 얼마나 오래 게임을 할 지(LT) 추정하는 방법에 대한 강연이다. 두 사람의 이야기를 정리했다.

 

데브시스터즈 박주홍 데이터 과학 그룹장
데브시스터즈 데이터 과학자

 

 

박주홍 그룹장은 본격적인 강연에 앞서, LTV(Life Time Value)의 개념부터 소개했다. 부분유료 게임이 다른 콘텐츠 상품과 다른 점은 유저가 게임을 하며 '지속적으로 돈을 사용한다'는 점이다. 때문에 유저가 게임에 쓸 돈을 알아내기 위해선 그가 이 게임을 얼마나 하며, 그 동안 얼마나 돈을 쓸 수 있을지 추정해야 한다.

 

일반적으로 게임 같이 트렌드 변화가 빠른 산업에선 유저가 한 상품을 붙잡고 있을 시간을 1년으로 가정한다. 즉, 유저가 1년 간 게임에 쓸 돈을 추정할 수 있다면, 이에 맞게 손해 보지 않는 마케팅 비용을 산정할 수 있다는 얘기다.

 

하지만 문제는 이 지점에서 발생한다. 보통 마케팅을 추가로 집행할 땐 서비스 초기(보통 1달) 전후다. 이 시점에선 유저가 한 달 평균 돈을 얼마 쓸지는 예측할 수 있어도, 유저가 얼마나 오래 게임을 할 수 있을지는 예측하기 힘들다. 

 

이 유저의 지속 접속 시간(Life Time, 이하 LT)을 각종 공식을 통해 추정하고 예측하는 것이 바로 데이터 과학자들의 일이다.

 


 

# 유저들은 우리 게임을 얼마나 오래할까? LT 추정 모델 3가지

 

장세진 데이터 과학자는 <쿠키런 오븐브레이크>가 약 1년 반동안 쌓은 데이터를 바탕으로 추정한 LT 산정 방법과 공식을 소개했다.

 

결론부터 말하면, 데브시스터즈는 LT를 추정하기 위해 시도한 방법은 크게 멱·유리함수, shifted Geometry Beta(이하 sBG), 그리고 멱·유리함수에 가중치를 넣어 만든 독자 계산식이었다. 이 중 데브시스터즈에게 가장 효과가 좋았던 것은 독자 계산식이었지만, 다른 두 방법 모두 의미하는 바가 있어 함께 설명한다.

 

먼저 멱·유리함수다. 이 부분은 서비스 1달치 유저들의 LT를 그래프화한 것과 흡사한 함수를 찾는 과정에서 나온 방법이다. 유저들의 LT를 서비스 1일차에 1로 둔다면, 서비스가 지속될수록 이탈자가 발생하기에 점점 0에 가까워지게 된다. 이 곡선을 기존의 다른 함수와 비교하면 보통 멱함수, 유리함수가 나온다. 즉, 멱함수, 유리함수 공식을 사용해 1달 데이터를 1년 데이터로 환산하면 유의미한 LT가 나온다는 가정이다.

 

이 방법의 가장 큰 장점은 단순한 계산식으로 LT를 산정할 수 있다는 점이다. 다만 쉬운만큼 신뢰도가 높은 방법은 아니다. 데브시스터즈의 경우, 멱함수를 사용한 값은 실제보다 추정치가 높게 나왔고 반대로 유리함수는 실제보다 낮은 추정치가 나왔다. 그리고 오차값 또한 30~50% 정도로 크게 발생했다. 추세를 예측하긴 쉬워도 이 값을 바탕으로 섬세하게 마케팅 규모를 결정하긴 힘들다.

 

 

sBG는 '확률분포'를 활용해, X일차 접속 유저가 이탈할 확률과 잔존할 확률을 종합적으로 따지는 방법이다. 다만 이 경우 유저마다 다른 변수가 적용되기 때문에 '기하분포'까지 사용할 필요가 있다. 그러면 연구자는 유저가 T일차에 이탈할 확률을 구할 수 있다.

 

문제는 유저가 이탈할 확률을 어떻게 구하냐는 것. 이에 대해 장세진 과학자는 베타분포의 두 모수를 통해 이탈 확률을 추정할 수 있다고 설명했다. 또한 베타 분포를 사용할 때의 장점은, 베타분포의 4개 모델이 게임의 LT 증감 그래프와 유사한 모습을 보인다면 이를 바탕으로 의미 있는 사전 정보를 얻을 수 있다는 점이다. 

 

비록 데브시스터즈는 LT 그래프가 베타분포 형태와 달라 오차가 크게 나왔지만, 만약 LT 모델이 베타분포와 비슷하게 나오는 게임이라면 충분히 의미 있는 데이터를 얻을 수 있는 방법이다. (물론 sBG의 복잡성을 감당할 수 있어야 한다)

 

 

마지막으로 소개한 데브시스터즈의 독자 계산식은 처음 말한 멱·유리함수 방식의 계량 버전이다. 장세진 과학자는 <쿠키런 오븐브레이크>의 데이터 값을 분석하는 중, 비록 오차값이 크긴 하지만 LT 증감 그래프의 형태가 멱함수, 유리함수 그래프와 흡사하다는 것을 깨달았다. 이에 장 과학자는 두 함수에 임의의 가중치를 부여해 합칠 수 있다면 <쿠키런 오븐브레이크>에 최적화된 LT 계산식을 얻을 수 있을 것이라 가정했다. 

 

가중치를 뽑아내기까지 많은 실패가 있었지만, 결과적으로 데브시스터즈에겐 이 방법이 가장 효과적이었다. 다른 방법으로는 오차가 30~50% 나오던 것이 독자 계산식으로는 9.6%까지 오차가 줄었기 때문. 장세진 과학자는 이를 소개하며, 회사나 게임에 특화된 가중치만 산정할 수 있다면 이런 독자적인 방법이 가장 효과적이라고 설명했다.

 

마지막으로 장 과학자는 데이터 과학자란 '모델링을 통해 인사이트를 제공하는 사람'으로, 이게 마케팅에 의미 있게 쓰이기 위해선 과학자와 마케터의 협업, 그리고 데이터에 대한 올바른 가이드가 필요하다고 강조했다.

 


 

 

최신목록 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10