게임 속 NPC들이 플레이어의 행동에 맞춰 자연스럽게 반응한다. 정해진 움직임이나 대화가 아닌 인공지능을 통해 구현되는 모습이다. 이와 관련하여 현재 엔비디아가 개발하고 있는 데모 게임<카이로스>의 영상도 공개됐다.
엔비디아의 CEO 젠슨 황은 Computex2023의 기조 발표에서 '생산형 AI'에 대해 발표했다. 그 중에는 '아바타 클라우드 엔진(Avatar Cloud Engine 이하 ACE)'의 게임용 버전도 포함되었다고 알려졌다. 해당 기술은 비디오나 오디오 입력을 기반으로 2D 및 3D 애니메이션을 구축하고, 자연스러운 음성을 합성하여 자율적인 아바타를 개발하는 서비스이다.
이를 통해 개발자들은 자신이 사용하는 소프트웨어와 게임에 맞는 맞춤형 음성, 대화, 애니메이션 AI 모델을 구축하고 배포할 수 있다.
영상은 디스토피아 세상 속 라멘 가게를 배경으로 그곳에서 일하는 NPC인 진과 플레이어의 대화가 주된 내용이다. 플레이어가 "이봐, 진, 오늘 기분이 어때?"하고 물으면, NPC는 "불행히도 좋진 않아. (Unfortunately, not so good)"이라고 답한다.
그 뒤로 "무슨 일이야? (How come?)", "나는 이 주변에서 일어나는 범죄들이 걱정돼. 최근에는 더욱더 심각해지고 있어. 내 라멘 가게에 피해를 주고 있다고. (I am worried about the crime around here. It's gotten bad lately. My ramen shop got caught in the crossfire.)"의 대화가 이어진다.
이번 데모는 Convai와 협력하여 제작되었다. Convai는 인공지능 캐릭터를 만들 수 있는 엔진이다. 사용자는 캐릭터의 이름과 목소리를 정한 뒤 적당한 서사를 부여해 주면 그것에 맞게 반응하는 캐릭터를 만들 수 있다는 것이 특징이다. 또한 제작한 캐릭터를 Unity, Unreal Engine, Roblox, Discord 등 다양한 플랫폼으로도 내보낼 수 있다. 실제로 이번 데모는 Unreal Engine 5로 제작되었다.
이에 엔비디아의 다양한 기술들이 동원되었다. '네모'는 생성형 AI의 개발을 돕는 클라우드 서비스로, 인공지능 언어 모델을 구축해 준다. 기업은 자사 언어 데이터를 네모에 입력해 언어 모델을 개발하고 추가 데이터를 정기적으로 입력해 업데이트할 수 있다.
'네모 가드레일'을 통해 비생산적이거나 안전하지 않은 대화를 예방할 수도 있다. '옴니버스 오디오투페이스'는 오디오 소스를 통해 감정을 추론하고 즉시 캐릭터의 얼굴에 표정을 적용하는 기술이며, '리바'는 음성 인식과 텍스트-음성 변환을 제공하여 실시간 음성 대화를 지원한다.
해외의 기술 관련 매체 엔가젯은 공개된 데모 시연 영상에 대해 "이 대화는 딱딱하다. 챗GPT가 더 좋은 기능을 수행하는 것처럼 보인다. 그러나, 플레이어가 헤드셋으로 직접 말하면 NPC들이 더욱 적절한 문맥으로 자연스럽게 상호작용할 수 있다는 가능성을 보여준다."고 전했다.
한편, 크래프톤도 비슷한 기술을 개발하는 중이라고 밝힌 바 있다. 지난 25일 CKL광장에서 진행된 '2023 콘텐츠 산업포럼'에서 크래프톤의 손윤선 버추얼 프렌드팀 팀장은 게임 개발에서 어떻게 AI가 사용되고 있는지에 대해 발표했다. 그 일환으로 사내 연구 차원에서 개발된 데모 게임 <파인드 뮤>의 플레이 영상을 공개했다.
영상에는 플레이어가 "너 왜 여기에 혼자 있어"라고 말하자, "내 형제들이 바람에 흩어져서 찾고 있다. 함께 모험을 떠나자"라고 대답하는 장면이 담겼다. 특히, 감정이 실린 TTS 인공지능 기술이 도입되어 더욱 실감 나는 플레이가 가능할 것으로 보였다. 손 팀장에 따르면 <파인드 뮤>는 마을에서 만난 '미유'라는 인공지능 캐릭터와 함께 진행하는 게임이다.