‘드록바’, ‘강화’, ‘10’ 그리고 ‘돈슨’까지. <피파온라인 3>(이하 피파3)팀이 매일 아침 받아보는 이 단어들은 무엇을 의미할까?
<피파3>에는 유저들의 반응을 체크하기 위해 소셜 분석을 진행하고 있다. 게임 운영자들은 업데이트 반응을 체크할 때 단순히 좋고 나쁨을 떠나 어떤 부분에 호응하고 거부감을 느끼는지 알고 싶어한다. 또 유저들은 평소 어떤 생각을 하고 있고 그들 사이에서는 어떤 이슈들이 발생하고 있는 체크해야 한다.
이를 위해 많은 운영자들이 소셜미디어와 각종 게시판을 모니터링하며 버즈 분석을 시도하고 있다. 하지만 수천, 수만 건의 게시글 중 가치 있는 데이터로 가공하는 일은 결코 쉽지 않다. NDC 14 강단에 오른 <피파3>팀의 김범주∙이유정 소셜 분석 담당자는 보다 객관적인 자료를 얻을 수 있는 통계프로그램 ‘R’을 소개했다.
오픈 소프트웨어인 ‘R’은 입력된 자료를 그래픽으로 한눈에 볼 수 있도록 해주는 통계 프로그램이다. 즉 유저의 게시글을 프로그램에 입력하면 어떤 단어가 가장 많이 사용됐는지 한눈에 볼 수 있다.
물론 기본 패키지를 사용하면 여전히 ‘가치 없는’ 데이터밖에 얻을 수 없다. 예를 들어, 많은 유저들의 의미 없이 사용하는 ‘ㅋㅋㅋㅋ’와 같은 단어가 가장 우선순위 단어로 뽑힐 수 있기 때문이다.
<피파3>팀은 문제를 해결하기 위해 우선 별도의 사전을 만들었다. 일정 기간 게시판에 올라온 유저의견에서 반복적으로 사용하는 게임관련 단어들을 모은 것이다. ‘패스’나 ‘수비’와 같이 게임과 관련된 용어도 있지만, 욕설을 비롯해 ‘쓰레기’, ‘돈슨’과 같은 부정적인 단어도 따로 정리했다.
이렇게 모인 단어만 총 707개. 사전을 이용하는 방법은 간단하다. 엑셀을 통해 유저 게시글을 입력만하면 사전에 기재된 단어들이 자동으로 필터링 되어 R을 보다 유용하게 사용할 수 있다.
공식홈페이지 내부커뮤니티뿐만 아니라 외부 커뮤니티 수만 건의 게시글을 모으기 위해서는 웹 문서 수집 기술인 ‘웹 크롤링’을 방식을 택했다. 웹 페이지 모아 HTML 태그값만 제거해 순수한 텍스트를 얻어냄으로써 일일이 게시물을 모으는 번거로움을 제거할 수 있었다.
그렇다면 <피파3> 사전은 어떻게 활용될까? 업데이트 후 유저들의 최대 관심 부분은 무엇인지, 어떤 선수가 있기 있는지 알아보기 위해서는 특정 단어의 빈도수를 체크한다. 또 A라는 단어가 나올 때 B라는 단어가 같이 나오는 확률 분석도 가능해 연계성도 알아볼 수 있다.
예를 들어 지난 4월 25일 임시점검 공지 후 부정단어를 살펴보면 ‘팅’이라든지 ‘돈’ ‘강화’ ‘렉’ 등이 등장해 유저들이 불안감을 느끼고 있음을 알 수 있다. 업데이트 이후에는 선수명만 따로 뽑아 어떤 선수에 가장 많은 관심을 받고 있는지도 확인할 수 있다.
김범주 <피파3> 담당자는 “유저들과의 쌍방향 커뮤니케이션을 위해 진행한 프로젝트지만 넥슨은 퍼블리셔다 보니 아직 분석하는 단계에 그치고 있다. 하지만 모든 자료를 개발사인 EA와 공유하고 있고 향후 게임에 반영할 수 있도록 노력하겠다”고 전했다.