‘안한글’에 대응하는 ‘AI 번역?’…최근 사례 보니

플레이에 어려움 없을 정도의 패치 나와

방승언(톤톤) 2023-09-14 16:02:49

8월과 9월 연이어 출시한 <발더스 게이트 3>와 <스타필드>는 트리플A급 RPG라는 것 외에 씁쓸한 공통점이 하나 있다. 공식 한국어 지원이 이뤄지지 않았다는 사실이다.

두 작품 모두 막대한 텍스트량을 가진 게임이어서 ‘한국어 미지원’에 대한 국내 게이머들의 좌절은 더욱 컸다. 그간 유명 프로젝트성 번역팀 ‘팀왈도’를 비롯해, 많은 사용자의 노력으로 해외 유력 게임들의 현지화가 이루어져 왔지만, 두 타이틀의 경우 워낙 압도적인 텍스트 분량으로 인해 유저번역 완료에 많은 시간이 소요될 것으로 짐작됐기 때문이다.

이런 와중 들려온 ‘AI 번역’ 소식은 유저들에게 한 줄기 희망을 가져다줬다. 지난해 이른바 ‘AI 열풍’과 함께, 고성능의 AI 번역 서비스도 시장에 선을 보였던 바 있다. 그리고 이중 가장 호평받는 DeepL 서비스를 통해 실제로 두 게임의 1차 번역이 빠르게 완료되면서 유저들은 환호했다.

그렇다면 이렇게 AI가 생성한 번역물 만으로도, 정말 충분한 수준의 게임 경험이 가능할까? 유저들의 공동 노력으로 제작된 <스타필드>와 <발더스 게이트 3>의 AI 번역본을 통해 알아봤다.

<스타필드> 한국어 미지원에 항의하는 1인 시위도 있었다. (출처: 루리웹 희동구86)

# <스타필드>의 예시

<스타필드> 번역에 힘쓰고 있는 ‘팀왈도’는 본래 개별 게임 단위로 인원을 모아 번역 작업을 진행하는 프로젝트성 그룹에서 시작됐다. 현재는 일부 핵심 멤버들이 여러 프로젝트를 연속으로 이끌면서 다른 유저들과 함께 작업하는 형태로 운영되고 있다.

화제가 된 <스타필드> 임시 번역본은, 한 익명 유저가 무상 제공한 AI 번역 자료를 팀왈도가 패치로 제작한 사례다. 언급된 유저는 <스타필드>의 일본어 버전 파일에서 게임 전체 텍스트를 추출한 뒤, 이를 DeepL번역 서비스를 통해 한국어로 번역했다고 밝혔다.

DeepL은 동명의 독일 기업이 운영하는 인공신경망 기반 번역 서비스다. 고유의 신경망 아키텍처로 언어를 학습, 자동번역하는 기능을 제공하며, 동종 서비스에 비해 더 자연스러운 번역물을 만들어 내면서 화제를 모았던 바 있다.

DeepL은 주목받는 AI 번역 서비스 중 하나다.

# 왜 일본어를 활용했나

해당 유저는 원문인 영어가 아닌 일본어를 소스 텍스트로 활용한 이유를 명확히 밝히지 않았다.

중역(한번 번역된 내용을 다시 번역하는 것)은 원문의 의미에서 멀어지거나 오역이 발생하기 쉬워 통상 지양된다. 다만 일어는 영어에 비해 어순과 어휘에서 한국어와 공통점이 많아, 기계번역에 있어 더 유리하다는 것이 항간의 통념이 있어, 중역의 단점을 감수하고서라도 일어를 소스로 사용하는 사례가 있다.

물론 반대 시각도 강하다. 인공지능에 학습시킬 수 있는 예시문의 분량 측면에서는 영어가 일본어 등 타 언어보다 절대적으로 유리하기 때문이다. 이때문에 실제로 비슷한 난도의 번역에서 영어 번역이 일어 번역보다 매끄러운 경우도 많이 찾아볼 수 있다. 특히 DeepL은 영문 번역에 있어 영어와 국어 사이의 구조 차이를 극복하고 자연스러운 결과물을 보여주며 호평받아 왔다.

그러나 맥락 정보 없이 대량의 텍스트를 자동 처리해야 하는 게임 번역의 특수성을 고려할 때, 일본어는 여전히 영어에 비해 더 유리한 지점을 지닌다.

모든 번역 작업에서 마찬가지지만, 특히 게임 번역에서 맥락은 가장 큰 난점이 되는 요소다. 파일에서 추출해낸 텍스트 파일만으로는 대화가 이뤄지는(혹은 텍스트가 출력되는) 전후 사정이나 화자간 관계 등을 유추할 수 없는 경우가 많기 때문이다.

예를 들어 엑스트라급 NPC A와 B의 대화를 아무런 배경 정보 없이 번역하는 상황이라면, 가장 기초적인 국어 문법 중 하나인 ‘존댓말’의 적용도 지극히 어려운 일이 된다. 해외게임 오역에서 존댓말 오류가 빈번한 이유 중 하나다.

게임스컴에 출품한 <검은신화: 오공> 체험판에도 문제의 '한국인' 오역은 등장했다.

심지어 문장이 아닌 단어나 구절 단위로 이뤄지는 UI 번역이라면 이런 문제는 더욱 두드러진다. 영단어 ‘Korean’의 번역이 대표적이다. Korean에는 ‘한국어’와 ‘한국인’이라는 두 가지 의미가 있기에, 이 단어가 등장하는 정확한 시점이나 위치 정보가 주어지지 않을 경우, 혹은 기계번역을 사람이 제대로 검수하지 않을 경우 오역이 발생하기 쉽다. 실제로 해외 인디 게임에서 자주 볼 수 있는 오역이다.

따라서 UI를 자동번역 할 때는 어휘 체계가 우리말과 비교적 비슷한 일본어를 활용할 때 앞서와 같은 오류의 발생 가능성을 조금 더 줄일 수 있다. 의미 영역이 1대1로 대응하는 단어 쌍이 더 많기 때문이다. 단적인 예로 앞서 언급된 영단어 ‘Korean’은 우리말의 ‘한국어’와 ‘한국인’에 모두 해당하지만, 일본어 체계에서의 경우 각각에 1대1로 대응하는 ‘韓国語’와 ‘韓国人’이 별개 단어로 존재하는 식이다.

이런 점에 힘입어 현시점 배포된 <스타필드> 임시 번역본은 UI 및 시스템 관련 번역에서 특히 정확도를 발휘하고 있다. 아이템 설명이나 시스템, UI 등을 보면 자연스러운 우리말을 많이 발견할 수 있으며, 일부 어색한 번역문이 있더라도 본래 의미가 쉽게 유추되는 경우가 많다.

'옵션'이 '선택 사항'으로 옮겨진 것을 제외하면 정확히 번역됐다. 물론 인게임 시스템 용어/UI의 오역률은 훨씬 높다.

# 현재 버전의 한계

하지만 현재의 <스타필드> AI 번역 버전은 온전한 ‘한국어 패치’로 기능하고 있지는 못하다. 실제로 이를 이용해 게임을 플레이해 보면 생각보다 많은 어려움에 부딪히게 된다.

우선 앞서 언급된 UI 및 시스템 용어에서도 이해하기 어려운 번역이 다수 등장해 혼란이 있었다. 이에 유저들은 이미 발 빠른 수정을 적용한 상태다. 혼란을 주던 단어들이 명확하고 자연스러운 표현으로 대부분 고쳐졌다. 이를테면 ‘초기 기술’은 ‘스타팅 스킬’로, ‘포즈 메뉴’는 ‘일시 정지 메뉴’로 바뀌었다.

하지만 캐릭터 간 대화 및 시스템 설명 등에서는 여전히 난관들이 기다리고 있다.

먼저 대사의 경우, 상황의 대략적 파악에는 많은 도움을 준다. 표현이나 어휘는 비록 어색할지언정 캐릭터 간의 관계, 현재 벌어지고 있는 상황 등을 유추할 만큼의 정보는 충분히 제공할 때가 많다.

게임 튜토리얼에서 방문하는 실험실 컴퓨터의 로그. 이 실험실에서 진행한 우주 생물 무기화 시도가 어떤 경과를 거쳤는지 짐작할 수 있다. 다만 가독성이 떨어지는 편이다.

하지만 아직 모호하고 개략적인 전달도 잦으며 그 정확도에 기복이 있다. 번역된 자막을 영어로 출력되는 캐릭터 음성 대사와 비교해보면, 반대되는 이야기가 나오거나, 뉘앙스가 변질되는 경우를 찾아볼 수 있다. 추론을 거치면 의미를 알아낼 수는 있지만, 가독성이 부족해 피로도를 높이는 경우도 많다.

다른 장르의 게임이었다면 심각성이 덜했을 사안이지만, 대화 선택지가 다수 등장하는 RPG 특성상 걸림돌이 될 때가 많다. 예를 들어 주인공 대사 선택지가 의미하는 바가 분명하지 않거나, 어조가 텍스트상 잘못 표현되어 있어 예상치 못한(혹은 원하지 않은) 사태로 전개되는 상황을 자주 마주하게 된다.

더 나아가 문장 구조가 와해하여 있거나, 특정 단어가 이해 불가하게 번역되면서 전체 문장이 의미하는 바를 유추하기 힘든 경우도 있다.

첫 문장은 반대 뉘앙스로 번역되었어야 한다. 원문은 "겉보기보다 대단하다"는 의미를 지닌다. 만약, 대화 선택지 중 이렇게 의미가 뒤집힌 문장이 포함돼 있다면, 피곤해질 수 있다.

# <발더스 게이트 3>의 사례

그렇다면 AI를 통해 ‘플레이 가능한 수준’의 유저 패치가 신속하게 제작되는 상황은 아직 그저 요원한 꿈에 불과할까?

그렇지는 않다. <스타필드>의 패치는 현재까지 사람의 손길이 거의 닿지 않은 상태라는 점을 기억할 필요가 있다. AI와 번역 수작업이 병행될 경우 '플레이에 무리가 없을 정도'의 번역 패치는 기존과 비교해 훨씬 빨리 제작 가능한 것으로 보인다. <스타필드>보다 앞서 제작된 <발더스 게이트 3>의 AI 번역이 그 예시다.

우선 <발더스 게이트 3>은 3년간의 얼리액세스를 진행하면서 게임의 첫 번째 챕터를 대중에 먼저 공개했던 바 있다. 그리고 해당 분량은 유저들에 의한 직접 번역이 이뤄졌던 상황이다. 이 덕분에 본격적 번역에 있어 꼭 필요한 선행작업인 용어 통일 등이 어느 정도 완수된 상태였을 것으로 보인다.

번역팀은 구글 번역기와 DeepL로 나머지 분량을 자동 번역하고, 유저들에게서 중요한 오역을 피드백 받는 과정을 통해 후반부 텍스트까지 모두 커버하는 패치를 완성, 배포한 상태다. 별도의 AI모델을 사용해 1챕터의 번역분량을 학습시켜 텍스트를 개선한 버전도 존재한다.

자동 번역에 직접 수정을 거친 <발더스 게이트 3> 패치는 아직 초기 단계인 <스타필드>에 비해 더 정확한 내용 및 맥락 전달을 보여주며, 가독성도 더 높다. 물론 의미 모호, 오역, 부자연스러움 등의 문제를 종종 찾아볼 수는 있다. 하지만 게임플레이에 지나친 불편이나 장애를 느낄 정도는 아니다.

<발더스 게이트 3>는 '수동 번역'이 이뤄지지 않은 지점에서도 좀 더 높은 가독성과 전달력을 보여준다.

더 나아가 패치 제작진은 '수동 번역'이 이뤄지지 않은 텍스트에 원문을 병기하는 묘수까지 고안해 내면서 유저들의 혹시 모를 불편에 대비해 놓은 상태다. 완벽한 번역을 바라기보다는 인간 번역가들의 작업을 기다리며 게임을 일단 즐기려는 긴급한 니즈를 충족하기에는 부족함이 없어보인다. 열정적인 번역자들이 노력을 가속한 결과, 9월 13일까지 완료된 수동 번역 분량은 전체 44.4% 분량에 달하는 것으로 알려졌다.

이처럼 AI기술의 발달로 게임 번역에도 심상치 않은 패러다임 변화가 감지되고 있다. 상용 번역툴이 앞으로도 발달해나갈 것으로 전망된다는 점에서, 향후 게임 현지화 기업들, 그리고 유저 번역가들의 향방에도 피하지 못할 변화가 찾아올 것으로 보인다. <발더스 게이트 3> 번역팀은 번역가를 모집하는 게시글에서 다음과 같이 적었다.

"웬만한 문장은 기계번역이 자연스럽게 뽑을 수 있는 시대에 들어선 만큼, 인간의 고뇌와 창조가 고스란히 남는 손번역의 수준은 그보다 더 높아야 할 것입니다. 열심히 공들여 번역한 작업물이 기계번역과 동등하거나 못하다면 본인도 실망이 클테고 다른 번역자분들의 수고를 두 배로 만드는 허사가 되겠지요. 그렇기 때문에 어느 정도 프루프리딩, 검수, 윤문 실력이 있는 인재를 뽑을 방침입니다."

한편, 이러한 새로운 번역 방법론을 근거로 해외 개발사/퍼블리셔들이 자발적인 한국어 지원 노력을 기울이지 않는 트렌드가 우려되기도 한다.

앞서 언급된 프로젝트들은 오로지 자발적 번역팀들의 순수한 선의에 기대고 있다. 충분한 번역가가 모이지 못하거나, 핵심 멤버들이 피치 못할 사정으로 이탈하는 등의 사유로 불발될 가능성이 상존한다. 국내에서의 실적을 진지하게 목표하는 해외 기업이라면, 전통적인 방법으로 정식 현지화에 임하는 것이 여전히 이상적이다.