일상을 송두리째 바꿀 새 패러다임으로 주목받았다는 면에서는 이렇듯 한 데 묶이지만, 사실 같은 점보다 다른 점이 훨씬 더 많은 기술들이다. 특히 앞의 둘과 뒤의 하나 사이엔 유념할 차이가 하나 있다. 블록체인, 메타버스와 달리 생성형 AI에는 효용성이나 대세성을 의심하는 목소리가 거의 제기되지 않았다.
반대로 사회 각계의 논의 속도를 빠르게 추월해 현장에 먼저 뿌리내리는 현상이 자주 포착되고 있는 점에 주목할 만하다. 이로 인한 지각변동을 가장 격렬히 겪을 콘텐츠 업계 전반은 특히 더 명민하게 대책과 활용 방안 양쪽을 모두 강구할 필요가 있다.
지난 12일부터 14일까지 3일간 진행된 한국콘텐츠진흥원의 콘텐츠산업포럼은 해당 논의의 일선에 서 있는 현업자들 이야기를 들어볼 좋은 기회였다. 그중 게임 업계가 주목할 만한 내용을 간추려봤다.
AI의 발전 방향성을 전망하기 위해서는 각국 관련 정책을 먼저 살펴볼 필요가 있다. 현재 각국은 기반 기술 보유 현황에 따라 진흥 혹은 규제 중 한쪽으로 가닥을 잡는 모양새다.
‘글로벌 AI 거버넌스가 콘텐츠산업에 미칠 영향’이라는 아젠다로 첫 발제를 맡은 법무법인 린의 구태언 변호사는 “세계가 이렇게 규제에 빨리 나서는 것은 처음 본다. 생성형 AI 등장 이후 1년 반 만에 각국이 2번이나 모였다”고 이야기했다.
먼저 고삐를 틀어쥐려는 것은 빅테크 규제에서 자주 선봉에 서는 유럽연합이다. 2021년 4월에 이미 유럽 집행위원회는 ‘EU 인공지능법’ 초안을 발의했다. 2023년 12월 8일에는 유럽 의회, 이사회, 집행위원회 3자 간 협의를 거쳐 생성형 AI 규제를 포함한 EU 인공지능법 최종안에 합의했다. 법안은 2024년 5월 최종 승인 후 2026년부터 전면 시행 예정이다.
EU 인공지능법의 의의 중 하나는 AI를 명확히 정의해냈다는 점이다. 법안에 따르면 AI는 ▲다양한 수준의 자율성을 가지고 작동하도록 설계된 기계 기반 시스템 ▲배포 이후 적응성을 나타낼 수 있는 시스템 ▲명시적/묵시적 목적을 위해 수신된 입력으로부터 추론해 물리적 혹은 가상 환경에 영향을 미칠 수 있는 예측, 콘텐츠, 추천 또는 의사결정 등 결과물을 생성할 수 있는 시스템이다.
또한 EU 인공지능법은 AI의 위협 수준을 총 4개 수준으로 분류한 뒤 각각에 따른 의무를 부여, 규제 근거로 삼을 예정이다. ‘수용 불가능한 위협’은 EU 기본권에 명백한 위반이 되는 시스템으로서 원천적으로 금지된다. ‘고위험’ 시스템은 건강, 안전, 환경, 민주주의 등에 중대한 잠재적 해악이 있는 AI로서, 의무 요건을 준수해야 한다.
‘제한적 위험' 시스템은 챗봇, 생체인식에 따른 대상 분류, 딥페이크 생성 AI 등을 말하며, 기술 투명성 의무 준수가 요구된다. AI 적용 사실을 소비자에게 고지하는 의무 등을 말한다. 마지막 ‘저위험’은 아무런 의무가 부과되지 않지만 추후 위험 수준에 따라 제재 대상이 될 수 있다.
EU 인공지능법은 ▲EU내에서 AI 시스템을 출시/서비스하는 제공자 ▲EU 내 위치한 AI 시스템의 배포자 ▲AI 시스템의 수입자 및 유통자 ▲자신의 제품에 AI 시스템을 함께 제공하는 제품 제조자 ▲EU 외 제공자의 EU 내 대표자 ▲EU 내 위치한 AI 시스템의 영향을 받는 자연인 ▲제3국 소재 AI시스템 중 EU에 사용되도록 의도된 경우 등에 폭넓게 적용된다.
따라서 현재 글로벌 서비스를 제공 중인 AI 기업 상당수가 2026년 전 서비스를 재점검해야 할 상황이다. 금지의무 위반 시 최대 3,500만 유로 혹은 직전 회계연도 전 세계 연간 총매출액 7% 중 더 높은 금액의 과징금이 부과될 수 있다. 이외에 대규모 범용 AI(GPAI)에는 별도의 강화된 규제가 적용될 예정이다.
한편 미국의 경우 조 바이든 미 대통령의 행정명령 정도가 나와 있는 상황이다. 구 변호사는 “행정부 공무원에게 명령을 내려 무역 적국(중국 등)의 AI를 사용치 못하게 하는데 그 이유가 있다고 본다”고 전했다. 즉, 민간이 아닌 정부 규제에 초점이 맞춰져 있는 소극적 규제다.
미국이 AI 규제에 소극적인 이유는 자명하다. 현재 AI 패권을 미국이 일방적으로 주도하고 있기 때문이다. 반면 EU의 경우 그렇지 못하기 때문에 보수적 입법에 나선 것으로 보인다. 구 변호사는 “경제 전쟁에서는 이기지 못함으로, 궁여지책으로 법률 전쟁에 나선 것으로 보인다”고 설명했다.
한국 사정은 어떨까? 21대 국회에서 총 12건의 AI 법안이 발의되었고, 이 중 7개 법안을 통합한 ‘인공지능 산업 육성 및 신뢰 기반 조성에 관한 법률(안)’이 국회 과방위 법안2소위를 통과해 상임위 전체 회의에 계류 중이었으나 폐기됐다. 구 변호사는 “민주당은 EU(규제 노선), 보수정당들은 미국 및 영국(진흥 노선)을 따르고 있어 통과되지 못했다”고 설명했다. 22대 국회에서도 AI 관련 법안이 다시 발의될 것으로 전망된다.
구 변호사는 현재의 규제가 이른바 ‘AI 주권’ 확보에 걸림돌이 될 수 있다고 이야기하며 강연을 마쳤다. ‘AI 주권’은 각국 문화와 입장을 반영한 AI 만들어 가지는 일을 말한다. 이때 중요한 것은 텍스트 및 데이터 마이닝(TDM)의 규제 방향성이다.
일본의 경우 2018년 저작권법 개정안에서 원저작물의 사상과 감정을 직접 즐기거나 타인이 즐기게 하는 목적이 아니고 AI에 학습시키는 경우 TDM을 허용했다. 한국도 이에 보조를 맞춰 이른바 ‘디지털 금 모으기’ 운동을 해야 한다는 것이 구 변호사의 주장이다. 일단 데이터를 제공해 자체적 AI 학습시킨 뒤 그 이익을 다시 분배하는 방식이 되어야 한다는 것이다.
2021년 국내 저작권법 개정안에는 ‘적법하게 저작물에 접근할 수 있는 경우’ TDM을 허용하고 있다. 그러나 적법한 접근권한의 요건을 따지는 문제가 남아있다. 대량 데이터 수집 시 수록된 데이터의 적법한 접근권한 확인이 현실적으로 어렵기 때문에 산업 발전에 장애가 된다는 것이다.
더 나아가 우리나라는 저작권법 등 지식재산권법에 형사처벌 규정이 있다. 이를 어기는 기업은 고소 대상이며, 관련 AI 서비스는 당연히 성립할 수 없다. 구 변호사는 “적법한 접근권한을 따져 AI 산업의 도래를 막는 것은 디지털 음악시장을 막는 것과 동일한 일”이라는 주장과 함께 발표를 마쳤다.
포럼 이튿날 연단에 선 넷마블 AI센터의 박성범 컴퓨터비전 AI팀 팀장은 넷마블의 AI 활용 방법 및 AI 활용 콘텐츠 제작 경험을 공유했다.
박 팀장은 우선 게임 콘텐츠 제작에서 고려할 네 가지 중요한 조건을 설명했다. ▲사실적 콘텐츠 제작 ▲쉬운 콘텐츠 제작 ▲쉬운 콘텐츠 컨트롤 ▲감정 표현 가능한 콘텐츠 생성 등이다. 그리고 생성형 AI는 이들 조건 중 다수를 동시에 만족하는 수단으로서 현재 활발히 활용되는 중이다.
가령 3차원 정보와 색상정보를 캡쳐해 사실적 렌더링을 해내는 것은 AI 없이도 가능한 일이다. 하지만 300개 이상의 LED/IR 광원, 50개 이상의 RGP/IR 카메라가 동원되는 등, 개인 단위에서는 실현하기 어렵다. MX(혼합현실) 캡쳐 스튜디오를 통해 유사한 작업을 진행할 경우 120대의 RGB/RGB-D 카메라가 동원된다.
그러나 휴먼너프(HumanNeRF) AI 기술을 활용하면, 카메라 4대 정도로 100대 이상의 카메라가 동원되던 시절의 퀄리티로 사람을 캡처해 렌더링할 수 있다 가능하다. 사실적 콘텐츠를 더 손쉽게 제작할 수 있게 된 것이다.
다음으로 박 팀장은 각 콘텐츠 유형별로 활용되고 있는 AI 솔루션들을 소개했다. 첫째는 이미지 생성에 활용되는 스테이블 디퓨전이다. AI의 성능은 어떤 데이터를 통해 원하는 결과물을 뽑아낼 수 있는지에 의해 가늠되는데, 스테이블 디퓨전은 인간의 언어만으로 고품질의 이미지를 생성할 수 있다.
이것은 스테이블 디퓨전이 사람 언어에 대응하는 약 4억 장의 인스타그램 이미지를 학습한 덕분이다. 때문에 기계어가 아닌 자연어 텍스트만으로 콘텐츠를 컨트롤할 수 있게 됐다. 이것은 생성형 기술의 성숙을 의미한다.
다음으로 비디오 생성 역시 성숙한 단계라고 박 팀장은 전했다. 현재 영상 생성 AI는 인간의 동작을 그대로 2D 이미지에 적용해 같은 동작을 수행하도록 만들 수 있는 단계다. 이 또한 고품질 콘텐츠를 손쉽게 생성하고 컨트롤할 수 있는 생성형 AI의 장점을 보여주는 예시다.
AI는 더 나아가 3D 객체를 직접 조각할 수 있는 수준에 이르렀다. 대상의 모습을 여러 각도에서 담은 이미지 몇 장으로 3차원의 정보를 생성할 수 있다. 3D 에셋을 직접 만들거나, 캐릭터를 생성 혹은 복원하는 데 사용될 수 있다.
이러한 생성형 AI의 장점은 게임 개발 영역에서 실제로 어떻게 활용되고 있을까? 박 팀장은 몇 가지 예시를 들어 설명했다.
가장 먼저 인게임 경기장을 제작하는 과정을 살펴보자. 박 팀장이 이미지로 제시한 경기장은 원래 전체 윤곽을 잡은 뒤 약 2주 정도에 걸쳐 디테일을 채워 넣는 방식으로 제작되었다.
그런데 생성형 AI를 활용하면 경기장의 비주얼 퀄리티를 더 쉽게 올릴 수 있다. 경기장에서 고치고 싶은 영역을 지정한 뒤 AI로 리전 필(구역 채우기)을 실행하면 디테일이 자동으로 채워진다. 결과물이 마음에 든다면 그대로 사용하고, 아닐 경우 수작업으로 고치면 된다. 인간 작업자와 AI 조수가 협업하는 방식이다.
한편 개발자 간 논의를 빠르게 진전시키는 데에도 생성형 AI는 활용되고 있다. 콘셉트 설정용 배경 초안 등을 작성할 때 활용된다. 원화 작업을 할 줄 모르는 기획자의 러프한 스케치가 AI를 통해 콘셉트 아트로 탈바꿈한다. 1주일은 족히 걸리던 작업이 반나절 만에 완성될 수 있을 정도로 빠르고 간편하다.
물론 한 번에 원하는 결과가 나오지는 않는다. 새 요소를 추가하고 필요한 부분은 남기는 작업을 반복해야 한다. 인간이 AI에 지시하고, 결과물을 검수해 결과물을 완성해 내는 순서로 일처리가 이뤄진다.
박 팀장은 AI를 통해 디지털 휴먼에 리얼리티를 부여하는 기술들을 소개하면서 발표를 마쳤다. 첫째 예시로 메타가 공개한 ‘포토리얼리스틱 제스처 표현’ 기술은 음성에 드러난 감정 정보만을 바탕으로 현실적인 3D 아바타를 생성해 내는 기술이다. 그러나 발화자의 모델을 미리 캡처해 놓아야 하는 기술이어서 역시 큰 비용이 발생한다.
한편 게임 등에 활용될 수 있는 보다 현실적 기술로는 ‘발화 주도 안면 표정’(Speech-driven Facial Expression) 기술이 있다. 인간의 ‘대표적’ 표정 50여 개를 상징하는 ‘표정 코드’ 개념을 활용해 저렴하게 얼굴 아바타의 모션을 표현하는 기술이다. 음성에 담긴 감정을 분석, 걸맞은 표정 코드를 아바타에 적용함으로써 생동감 있는 아바타를 쉽게 만들 수 있다.
박 팀장은 “게임에서 영상, 이미지 등 콘텐츠의 중요성은 크다. 이러한 콘텐츠 제작에 있어 앞에서 말한 네 가지 조건을 추구하기 위한 수단으로 AI를 활용 중이다”며 강연을 정리했다.
발표 이튿날 발제에 나선 반지하게임즈 이유원 공동대표는 인디게임 업계에서의 AI 활용 현황을 설명했다. 이 대표에 따르면 현재 인디 업계의 AI활용은 크게 비용 절감 유형과 콘텐츠화 유형으로 나뉜다.
비용 절감 측면의 실사례로는 텍스트 번역을 꼽을 수 있다. 전문 번역가를 통한 기존의 게임 번역에는 외주비용이 크게 발생해 인디 개발사의 경우 지원사업에 의존하는 경우가 많았다. 그러나 AI툴은 인게임 ‘용어’들에 대한 학습을 통해 편리하고 값싸게 번역을 진행할 수 있다.
프로그래밍 단계에서는 MS의 ‘코파일럿’ 등 AI 비서를 이용한 코딩 보조 기능이 널리 활용된다. 현재 사용하지 않는 개발자가 많지 않을 정도다. 특히 반복노동을 획기적으로 줄여 작업 효율을 높여준다.
이미지 생성 AI의 경우 주로 기존 아트 인력의 대체 수단으로 여겨지는 경우가 많다. 하지만 제작 단계에서 개발자 간 커뮤니케이션 비용 절감에도 큰 도움이 된다. 콘셉트 아트 제작이나 아이디에이션 구체화 등에서 강점을 보인다. 업계에서 자주 사용되는 툴로는 Dall-E, Leonardo, Midjourney, Stabel Diffusion 등이 있다.
레벨 디자인에도 AI는 활용될 수 있다. QA와 레벨 설계에 도움을 얻을 수 있다. 대표 사례는 퍼즐게임 <캔디 크러시>다. 개발사 킹은 AI 솔루션을 통해 게임 배포 전에 레벨 상의 문제를 확인하는 것은 물론, 디자인 초기 단계에도 AI를 활용한다고 밝혔다.
한편 AI를 새로운 게임 메커닉 발명에 사용하는 사례들도 속속 등장하고 있다. 유저가 시스템과 능동적으로 상호작용할 수 있다는 점에 착안해 방탈출, 심문, 추리, 대화 등 테마를 접목한 AI 게임이 출시했다. 그 외 게임 난이도를 실시간으로 조절해 유저 경험을 향상하거나, 인게임에서 유저만을 위한 글/그림을 생성하기도 한다.
최근 스팀 플랫폼에 출시한 <도키도키 AI>가 하나의 예시다. ‘도키도키’는 ‘두근두근’이라는 의미의 일본어인데, 두근대는 마음은 ‘예측 불가능성’에서 촉발된다.
원래 게임에서 ‘예측 불가능성’은 인간 창작자가 직접 게임 메카닉 혹은 스크립팅을 통해 수작업으로 유도해야만 하는 요소였다. 그러나 창조적 텍스트를 만들어내는 생성형 AI의 등장은 이것을 시스템 단위에서 자동으로 구현할 수 있게 한다.
이어서 이 대표는 자사가 개발 중인 포인트 앤 클릭 텍스트 어드벤처 게임 <페이크북>의 사례를 통해 게임 제작에서의 생성형 AI 활용 방안을 소개했다. 해당 내용 및 <페이크북> 게임의 디테일과 개발 비화 등을 다음 인터뷰에서 확인할 수 있다.