"아, 아. 안녕하세요", "하나둘, 하나둘", "시스템 가동, 준비 완료, 인간 시대의 끝이 도래했다"...
간단한 설정으로 기자의 목소리가 여고생, 어린이, 프랑스인, 그리고 로봇으로 변조됐다. 기자는 신나서 한참을 이 프로그램을 가지고 놀았다. 게임을 체험할 시간도 모자른 지스타, 그것도 비즈니스 매칭을 위해서 마련된 B2B관에서 기자를 사로잡은 것은 <프로젝트 시프트>다.
<프로젝트 시프트>는 음악 기획사 하이브의 자회사 '수퍼톤'이 개발 중인 소프트웨어로 게임 유저가 자신의 목소리가 아닌, 다른 캐릭터의 목소리로 음성대화를 즐길 수 있도록 하는 서비스다. 유저는 본인과 캐릭터의 목소리 조합 비율을 조정하고, 목소리 스타일을 자유롭게 설정해 원하는 목소리로 실시간 변조할 수 있다. 약간의 연기를 가미하면 진짜 여고생이나 로봇처럼 들리도록 목소리를 바꿀 수 있다.
이미 음성 변환 기술은 '버츄얼 유튜버'는 물론 일반적으로 게임을 즐기는 유저까지 접근할 수 있다. 그러나 수퍼톤은 <프로젝트 시프트>를 "가장 진보한 실시간 음성 변환 기술"이라고 소개한다. "최소 지연시간과 높은 오디오 품질"을 자랑하고 있으며 "미리 정의된 목소리로 말하거나 노래할 수 있을 뿐만 아니라, 정체성을 유지하면서 일정 부분을 다른 목소리로 변환 할 수 있다"는 것.
<프로젝트 시프트>에 이용된 중추 기술 '낸시'(Neural Analysis & Synthesis, NANSY)는 유저의 목소리를 음색, 발음, 음높이, 음량으로 분해해 이 요소를 개별적으로 제어한다. 평범한 대화의 경우, 단 두 세 문장만으로 목소리 데이터를 얻어낼 수 있다고. 이밖에 음성합성 기술, 음성 효과 기술 등을 보유 중인데, 드라마 <카지노>에서 최민식의 목소리를 젊게 만들고(디에이징), 넷플릭스 <마스크걸>에서 '모미'의 목소리를 새롭게 생성한 것이 바로 이들이다.
함께 개발 중인 <프로젝트 스크린플레이>는 B2B를 대상으로 하는 보다 전문적인 프로그램이다. 게임 제작자가 다양한 게임 캐릭터의 목소리를 쉽고 빠르게 디자인할 수 있도록 돕는 스크립트 기반의 오디오 생성 소프트웨어로 텍스트를 음성으로 곧바로 변화시킬 수 있다. 지스타에서는 같은 계열사 하이브IM이 서비스하는 <별이 되어라 2>의 레온과 얀코가 대화하는 스크립트가 있는데, 간단한 조작으로 레온의 목소리를 TTS(Text-to-Speech)로 바꿀 수 있었다.
<프로젝트 스크린플레이>는 처음 접하는 프로그램이었지만, 대단히 편집이 쉬웠는데, 비정형의 형태로 스크립트에 대한 목소리를 계속해서 추출할 수 있었고 높이, 속도는 물론 연령대까지 그래프 바를 통해서 조절할 수 있었다. <프로젝트 시프트>에서처럼 특정 대사를 직접 녹음해서 그 결괏값을 프로그램에 바로 얹힐 수도 있었다. 따라서 게임 개발 뿐 아니라 인터넷방송에도 유용할 것으로 보였다.
수퍼톤은 <프로젝트 스크린플레이>에 대해서 "외래어가 혼재된 텍스트나 인용 문구 등은 더 자연스럽게 읽어내 콘텐츠에 몰입감을 높인다"며 "최근 K-팝과 K-컬쳐에 대해 인사이트를 제공하는 미디어인 ‘위버스 매거진’에 적용되어 콘텐츠 몰입감을 높이는 데 기여하고 있다"고 밝혔다. <프로젝트 스크린플레이>는 내년 출시될 예정이며, 이미 내부에서는 웹 버전 빌드에 대한 테스트를 거의 마쳤다. 판매 방식은 월정액 형태로 예상되고 있다.
이교구 수퍼톤 대표는 두 프로그램에 대해서 "게임에 등장하는 다양한 캐릭터들에게 생동감을 부여하고, 음성을 통한 상호작용을 가능하게 함으로써 게임 유저뿐만 아니라 게임 창작자와 개발자들에게도 새로운 지평을 열어줄 것"이라고 말했다. 또 "게임 영역까지 적용 가능한 기술을 확보해 엔터테인먼트 산업 전반에서 AI 오디오 기업으로서 독보적 입지를 구축하고, 콘텐츠 산업 내 보이스 기술의 퀀텀점프를 이끌 것"이라고 이야기했다.