로그인

회원가입 | ID/PW 찾기

취재

'알파고' 딥마인드 AI, 이제 규칙 몰라도 게임 마스터한다

새 AI 뮤제로(μZero)

에 유통된 기사입니다.
김재석(우티) 2020-12-24 14:53:29

우리에게 알파고로 익숙한 딥마인드. 딥마인드의 새 AI 뮤제로(μZero)는 게임의 규칙을 학습하지 않고도 스스로 승리를 위한 계획을 세울 수 있습니다.

 

딥마인드의 알파고 제로는 단순히 자신과의 대결, 즉 딥러닝을 통해 바둑을 마스터했습니다. 이 AI는 자신이 훈련해야 하는 게임의 규칙을 알고 있는 상태에서 자신과의 무수히 많은 싸움을 통해 매 수 매 수 더 나은 결괏값을 찾아 나갔죠.

 

 

딥마인드는 알파제로 성공 이후, 시뮬레이션을 관리하는 규칙을 알지 못하면서도 대결에서 승리하는 AI를 만들기 위해 노력해왔습니다. 그리고 그 결과가 바로 뮤제로입니다. 

 

뮤제로는 바둑이면 바둑, 체스면 체스 규칙을 배우고 시뮬레이션에 들어가지 않습니다. 뮤제로에겐 일반적인 규칙이 학습되지 않은 상태에서, 이전 결정의 결과, 현재의 위치, 그리고 그 결과 도출되는 최선의 행동 방침이 나옵니다.

 

뮤제로는 기존의 AI와는 달리 모든 수를 모델링하지 않고, 의사 결정에 중요한 요소만을 고려한다고 합니다. 스스로 대결의 규칙을 학습하고 게임을 마스터하는 경지에 오르는 것이죠. 딥마인드는 뮤제로가 이전의 어떤 AI보다 훌륭한 능력을 갖췄다고 홍보했습니다.

 

이렇게 딥마인드는 뮤제로에게 <팩맨> 등 아타리 게임을 시뮬레이팅했고, 타 AI보다 높은 성과를 거두었습니다. 이 모든 과정에서 뮤제로가 스스로 대결의 규칙을 학습해 결과를 도출했다고 합니다.

 

뮤제로는 아직 발표 초기 단계입니다. 뮤제로가 어떤 미래를 보여줄지 관심을 가지고 지켜볼 만합니다. 자세한 내용은 이 페이지에서 확인할 수 있습니다. (바로가기)