로그인

회원가입 | ID/PW 찾기

취재

엔비디아 ‘ISC’ 및 ‘HPC 서밋’서 최신 HPC 기술 공유

HPC 성능, 효율성 및 코로나19 퇴치를 위한 연구과정 소개

디스이즈게임(디스이즈게임) 2020-06-22 14:28:22

[자료제공: 엔비디아]

 

AI 컴퓨팅 기술 분야의 선두주자인 엔비디아는 각각 오늘(22일)부터 25일(현지시간)에 열리는 세계슈퍼컴퓨팅콘퍼런스 2020 디지털(이하 ISC)과 6월 29일부터 7월 2일(현지시간)까지 열리는 엔비디아 HPC 서밋 디지털(이하 HPC)에서 고성능컴퓨팅(이하 HPC)관련 최신 기술에 대해 소개한다.

 

두 행사는 모두 온라인을 통해 무료로 진행되며, 과학 연구를 도약시키는 HPC관련 최신 툴과 기술에 대한 노하우를 제공할 예정이다. 강의, 패널, 데모 형식으로 진행되는 두 행사에서는 새로운 가속 시스템과 네트워크, 그리고 이러한 기술이 천체 물리학에서 양자역학에 이르는 다양한 분야에서 어떻게 적용되는 지 논의될 예정이다. 이 외에도 코로나19관련 연구에 대해서도 중점적으로 다룰 예정이다.

 

ISC와 HPC 서밋은 4월 27일(현지시간) 엔비디아와 멜라녹스(Mellanox) 합병 이후, 해당 기업의 전문가들이 단일 기업체 소속으로 발표하는 첫 행사이다. 전문가들은 데이터센터 가속화와 고급 네트워킹의 결합이 HPC에 어떤 의미를 갖는지 의견을 공유할 계획이다.

 

ISC와 HPC 서밋에서는 HPC와 AI 융합을 위한 노력에 대해 다룰 예정이다. 이미 여러 슈퍼컴퓨팅 센터에서 활용되고 있는 HPC와 AI의 조합은 시뮬레이션을 가속화해 과학적인 연구 결과 도출 시간을 단축시키고 있다. 이는 HPC가 성능과 전력 효율성을 향상시키는 다양한 방법 중 하나다.

 

또한, 엔비디아 전문가들은 질의응답을 갖고, 두 가지 제품을 소개할 예정이다. 이는 지난 5월 14일(현지시간) 엔비디아 GTC 2020 기조연설서 발표된 엔비디아 암페어 아키텍처로, FP64 지원을 위한 텐서 코어가속과 과학 애플리케이션의 가속을 목적으로 하는 기능을 갖추고 있다. 또 다른 제품은 엔비디아 A100 GPU로, 관련 활용 사례, 파트너, 폼팩터와 함께 소개된다.

 

 

 

# 코로나19 연구에 협력하는 슈퍼컴퓨터센터

 

유럽의 연례 슈퍼컴퓨팅 행사인 ISC의 개막일에는 미국 백악관의 ‘코로나19 HPC 컨소시엄’ 회원인 아르곤 국립연구소의 소장을 포함해 유럽과 아시아 국가의 여러 인사들이 함께 코로나19 연구 관련 의견을 공유할 예정이다.

 

해당 컨소시엄은 5만 개 이상의 GPU가 탑재된 30개의 슈퍼컴퓨터에 대한 액세스를 제공하고, “우리 시대의 아폴로 프로그램은 달을 향한 경주가 아닌 인류를 위한 경주”라는 가치하에 운영되고 있다.

 

아르곤 연구소는 전세계 6개 슈퍼컴퓨팅 센터 중 처음으로 엔비디아 A100 GPU를 통해 코로나 바이러스의 백신과 치료법 개발을 시작했다. 또한, 오크리지 국립연구소 연구진은 최근 서밋 슈퍼컴퓨터에서 GPU 가속기를 활용했다. 이는 컨소시엄이 지원하는 63개의 활성 프로젝트 중 하나로, GPU 가속기를 통해 코로나바이러스를 중화시키기 위한 약물을 찾기 위한 24시간 동안 20억 개에 달하는 화합물 분석을 목표로 하고 있다.

 

ISC의 벤더 쇼다운 세션 및 전시 포럼에서는 엔비디아의 솔루션 아키텍처 및 엔지니어링 담당 부사장인 마르크 해밀턴(Marc Hamilton), 엔비디아의 멜라녹스 네트워킹 마케팅 담당 부사장인 길라드 셰니어(Gilad Shanier)을 포함한 연사들이 참여해 최신 DGX 슈퍼POD와 같은 신기술을 설명한다.

 

 

# 700페타플롭 성능의 DGX 슈퍼POD

 

DGX 슈퍼POD는 과거에는 상상하기도 힘들었던 700페타플롭(PF)급의 성능으로 AI 모델을 훈련한다. 이는 1,120개의 A100 GPU와 인-네트워크 컴퓨팅 엔진을 지원하는 170개의 엔비디아 멜라녹스 HDR 200G 인피니밴드 스위치가 탑재돼 있다.

 

6월 23일(현지시간) 진행되는 ISC 세션에서 엔비디아는 네트워킹 작업을 CPU나 GPU에서 인피니밴드 스위치 네트워크로 네트워크 작업을 오프로딩하기 위한 가속엔진인 샤프(SHARP)에 대해 소개한다. 이는 HDR 200G 인피니밴드를 이용한 시스템 테스트에서 파이토치(PyTorch) 기반으로 AI 성능을 향상시키면서도 포인트-투-포인트 대역폭의 약 96%를 제공했다.

 

 

# HPC 서밋 디지털

 

엔비디아가 주최하는 HPC 커뮤니티 포럼인 HPC 서밋 디지털은 6월 29일(현지시간)부터 진행된다. 쿠다의 개발자 겸 엔비디아 가속 컴퓨팅 그룹의 제너럴 매니저인 이안 버크(Ian Buck)와 멜라녹스(Mellanox)의 공동 설립자이자 엔비디아의 멜라녹스 네트워킹 사업부의 현재 CTO인 마이클 카겐(Michael Kagen)이 오프닝 세션에서 발표에 나선다.

 

이들은 모두 최초의 엔비디아 HGX A100 슈퍼컴퓨터뿐 아니라, 코로나19 연구 지원을 목표로 엔비디아 DGX A100 시스템을 사용하는 최초의 HPC 센터에 대해 설명한다. 둘째 날에는 GPU 및 소프트웨어 전문가들이 엔비디아 암페어 아키텍처에 대해 토론하기 위해 라운드테이블 및 질의응답 세션을 진행한다. A100과 플랫폼, 라이브러리, 개발자 툴, 그리고 HPC·AI·데이터 사이언스를 발전시키는 방법에 대한 상세한 정보를 제공하고, 질의응답 시간이 진행될 예정이다.

 

셋째 날 진행되는 개발자 포럼에서는 성공 사례, 교훈, 개발자들의 주요 요구사항에 관해 다루며, 엔비디아 전문과와의 질의응답 세션, 그리고 다음과 같은 주제로 가상 회의실에서 진행되는 라운드테이블 토론이 진행된다.

 

HPC 서밋의 마지막 날에는 HPC 데이터센터에 대한 세 개의 세션이 진행된다. 각각의 세션은 전문과와의 대화와 질의응답 시간이 포함된다. 첫 번째 세션에서는 네트워킹, 스토리지, 특히 새롭게 부상하는 HPC와 AI의 조합관련 사용 사례를 다룬다. HPC 클라우드 툴을 주제로 하는 두 번째 세션에서는 오하이오 슈퍼컴퓨터 센터의 센터장인 앨런 처커(Alan Chalker)가 이끄는 슈퍼 컴퓨터 액세스를 위한 오픈 온디멘드 프로젝트에 대한 토론이 진행된다.

 

세 번째 세션에서는 HPC에서 Arm 프로세서 기술에 대한 상황과 전망을 모색한다. Arm의 HPC 부문 수석 담당자인 브렌트 고르다(Brent Gorda)는 HPC의 Arm 생태계에 대한 연설을 하고 향후 방향에 대한 피드백을 받을 예정이다. 이는 작년 엔비디아가 Arm 아키텍처에 쿠다 지원을 발표하면서 공식적으로 시행한 이니셔티브로, 이를 통해 새로운 파트너들이 유치됐다.

 

HPC 서밋 디지털에 대한 자세한 일정은 해당 링크에서 확인할 수 있다.