로그인

회원가입 | ID/PW 찾기

실시간정보

엔비디아, RTX AI PC용 AI 파운데이션 모델 출시

디스이즈게임(디스이즈게임) 2025-01-08 09:49:03
디스이즈게임 (디스이즈게임 기자) [쪽지]
[소식]
/webzine/event/nboard/225/?n=204048 주소복사

엔비디아, RTX AI PC용 AI 파운데이션 모델 출시

[자료제공:엔비디아]


- 엔비디아 NIM 마이크로서비스로 제공되고 지포스 RTX 50 시리즈 GPU로 가속화

- RTX AI PC용 NIM 마이크로서비스 파이프라인 출시 예정

- 라마 네모트론 제품군 함께 발표… 다양한 에이전틱 작업에 높은 정확도 제공


AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(CEO 젠슨 황)가 디지털 휴먼, 콘텐츠 제작, 생산성, 개발을 강화하는 엔비디아(NVIDIA) RTX™ AI PC에서 로컬로 실행되는 파운데이션 모델을 발표했다.

엔비디아 NIM™ 마이크로서비스로 제공되는 이 모델은 초당 최대 3,352조 개의 AI 연산과 32GB의 VRAM을 특징으로 하는 새로운 지포스 RTX™ 50 시리즈 GPU(GeForce RTX™ 50 Series GPU)에 의해 가속화된다. 엔비디아 블랙웰(Blackwell) 아키텍처를 기반으로 구축된 RTX 50 시리즈는 FP4 컴퓨팅을 지원하는 최초의 소비자용 GPU이다. 이는 AI 추론 성능을 2배 향상시키고, 이전 세대 하드웨어에 비해 더 작은 메모리 공간에서 생성형 AI 모델을 로컬로 실행할 수 있도록 한다.

지포스™는 오랫동안 AI 개발자들에게 중요한 플랫폼이었다. 최초의 GPU 가속 딥러닝 네트워크인 알렉스넷(AlexNet)은 2012년에 지포스 GTX™ 580에서 훈련됐으며, 작년에는 발표된 AI 연구 논문 중 30% 이상이 지포스 RTX의 사용을 인용했다. 이제 생성형 AI와 RTX AI PC를 사용하면 누구나 개발자가 될 수 있다.

애니띵LLM(AnythingLLM), 컴피UI(ComfyUI), 랭플로우(Langflow), LM 스튜디오(LM Studio)와 같은 새로운 로우코드(low-code), 노코드(no-code) 툴의 등장으로, AI 모델에 관심이 있는 사람들은 복잡한 워크플로우에서 간단한 그래픽 사용자 인터페이스를 통해 AI 모델을 사용할 수 있게 됐다. 이러한 GUI에 연결된 NIM 마이크로서비스는 최신 생성형 AI 모델에 쉽게 액세스하고 이를 배포할 수 있게 해준다.

NIM 마이크로서비스에 기반한 엔비디아 AI 블루프린트(Blueprint)는 디지털 휴먼, 콘텐츠 제작 등을 위해 사용하기 쉽고 사전 구성된 참조 워크플로우를 제공한다. AI 개발자와 애호가들의 증가하는 수요를 충족시키기 위해, 모든 최고의 PC 제조업체와 시스템 빌더는 지포스 RTX 50 시리즈 GPU를 탑재한 NIM 지원 RTX AI PC를 출시하고 있다.

엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 "AI는 인식형 AI(perception AI)에서 생성형 AI, 그리고 현재는 에이전틱 AI에 이르기까지 빠른 속도로 발전하고 있다. NIM 마이크로서비스와 AI 블루프린트는 PC 개발자와 애호가들에게 AI의 마법을 탐구할 수 있는 구성 요소를 제공한다"고 말했다.

AI를 NIM으로 민첩하게 만들기

방대한 양의 원시 데이터로 훈련된 뉴럴 네트워크인 파운데이션 모델은 생성형 AI의 구성 요소이다. 엔비디아는 블랙 포레스트 랩스(Black Forest Labs), 메타(Meta), 미스트랄(Mistral), 스태빌리티 AI(Stability AI)와 같은 최고의 모델 개발자들이 만든 RTX AI PC용 NIM 마이크로서비스 파이프라인을 출시할 예정이다. 사용 사례는 거대 언어 모델(large language model, LLM), 비전 언어 모델(vision language model), 이미지 생성, 음성, 검색 증강 생성(retrieval-augmented generation, RAG)을 위한 임베딩 모델, PDF 추출, 컴퓨터 비전 등 다양하다.

블랙 포레스트 랩스의 CEO인 로빈 롬바흐(Robin Rombach)는 "FP4 컴퓨팅을 탑재한 지포스 RTX 50 시리즈 GPU는 이전에는 대규모 데이터 센터로 제한됐던 PC에서 실행할 수 있는 다양한 모델을 사용할 수 있게 해준다. 플럭스(FLUX)를 엔비디아 NIM 마이크로서비스로 만들면 더 많은 사용자가 AI를 배포하고 경험할 수 있는 속도가 빨라지고, 놀라운 성능을 제공할 수 있다"고 말했다.

한편, 엔비디아는 다양한 에이전틱 작업에 높은 정확도를 제공하는 오픈 모델인 라마 네모트론(Llama Nemotron) 제품군도 함께 발표했다. 라마 네모트론 나노(Nano) 모델은 RTX AI PC와 워크스테이션용 NIM 마이크로서비스로 제공되며, 지시 사항 수행, 함수 호출, 채팅, 코딩, 수학 등 에이전틱 AI 작업에 탁월하다.

NIM 마이크로서비스에는 PC에서 AI를 실행하는 데 필요한 핵심 구성 요소가 포함되며, RTX PC와 워크스테이션 또는 클라우드 등 엔비디아 GPU 전반에 걸쳐 배포할 수 있도록 최적화된다. 개발자와 애호가들은 윈도우(Windows) 11 PC에서 리눅스용 윈도우 하위 시스템(Windows Subsystem for Linux, WSL)를 통해 NIM 마이크로서비스를 신속하게 다운로드, 설정, 실행할 수 있다.

마이크로소프트(Microsoft)의 윈도우 부문 부회장인 파반 다불루리(Pavan Davuluri)는 "AI는 윈도우 11 PC 혁신을 빠른 속도로 주도하고 있다. 리눅스용 WSL는 윈도우 11에서 윈도우 코파일럿 런타임(Copilot Runtime)과 함께 AI 개발을 위한 훌륭한 크로스 플랫폼 환경을 제공한다. 윈도우 PC에 최적화된 엔비디아 NIM 마이크로서비스는 개발자와 애호가들이 윈도우 앱에 바로 통합할 수 있는 AI 모델을 제공해 윈도우 사용자에게 AI 기능을 더욱 빠르게 배포할 수 있도록 한다"고 말했다.

RTX AI PC에서 실행되는 NIM 마이크로서비스는 최고의 AI 개발과 에이전트 프레임워크와 호환된다. 이는 비주얼 스튜디오 코드(VSCode), 애니띵LLM(AnythingLLM), 컴피(ComfyUI), 크루AI(CrewAI), 플로와이즈 AI(Flowise AI), 랭체인(LangChain), 랭플로우(Langflow), LM 스튜디오(LM Studio)를 위한 AI 툴킷을 포함한다. 개발자들은 이러한 프레임워크를 기반으로 구축된 애플리케이션과 워크플로우를 업계 표준 엔드포인트를 통해 NIM 마이크로서비스를 실행하는 AI 모델에 연결할 수 있다. 이를 통해 클라우드, 데이터 센터, 워크스테이션, PC 전반에 걸쳐 통일된 인터페이스로 최신 기술을 사용할 수 있다.

애호가들은 곧 출시될 엔비디아 챗RTX(ChatRTX) 기술 데모를 통해 다양한 NIM 마이크로서비스를 경험할 수 있을 것이다.

에이전틱 AI에 얼굴을 입히다

엔비디아는 사용자의 손끝에 정보를 제공하고, 데스크톱 앱과 화상 회의 통화를 지원하고, 문서를 읽고 요약하는 등의 기능을 수행할 수 있는 비전 지원 PC 아바타인 프로젝트 R2X(Project R2X)를 미리 선보였다. 이는 애호가들과 개발자들이 NIM을 사용해 AI 에이전트와 어시스턴트를 구축할 수 있는 방법을 보여주기 위함이다.

아바타는 엔비디아 RTX 신경망 페이스(RTX Neural Face)를 사용해 렌더링된다. 이는 완전히 생성된 픽셀로 기존의 래스터화를 보강하는 새로운 생성형 AI 알고리즘이다. 그런 다음 입술과 혀의 움직임을 개선하는 새로운 확산 기반 엔비디아 오디오2페이스™-3D(Audio2Face™-3D) 모델로 얼굴에 애니메이션을 적용한다.

R2X는 크루AI, 플로와이즈 AI, 랭플로우와 같은 개발자 프레임워크를 통해 오픈AI(OpenAI)의 GPT4o, 엑스AI(xAI)의 그록(Grok)과 같은 클라우드 AI 서비스와 PDF 검색기 또는 대체 LLM 같은 NIM 마이크로서비스와 AI 블루프린트에 연결할 수 있다. 여기에서 프로젝트 R2X 업데이트를 등록할 수 있다.

AI 블루프린트, PC 버전 출시 예정

NIM 마이크로서비스는 AI 블루프린트를 통해 PC 사용자들도 이용할 수 있다. AI 블루프린트는 RTX PC에서 로컬로 실행할 수 있는 참조 AI 워크플로우이다. 개발자들은 이 블루프린트를 통해 PDF 문서에서 팟캐스트를 만들거나, 3D 장면을 따라 멋진 이미지를 생성하는 등의 작업을 할 수 있다.

PDF를 팟캐스트로 변환하는 블루프린트는 PDF에서 텍스트, 이미지, 표를 추출해 사용자가 편집할 수 있는 팟캐스트 스크립트를 만든다. 블루프린트에서 사용 가능한 음성이나 사용자의 음성 샘플을 기반으로 스크립트에서 전체 오디오 녹음을 생성할 수도 있다. 나아가 사용자는 AI 팟캐스트 진행자와 실시간 대화를 통해 특정 주제에 대해 자세히 알아볼 수도 있다.

블루프린트는 언어에 미스트랄-네모-12B-인스트럭트(Mistral-Nemo-12B-Instruct), 텍스트 음성 변환과 자동 음성 인식에 엔비디아 리바(Riva), PDF 추출에 네모 리트리버(NeMo Retriever) 마이크로서비스 컬렉션을 사용하는 NIM 마이크로서비스를 사용한다.

3D 가이드 생성형 AI를 위한 AI 블루프린트는 아티스트가 이미지 생성을 더 세밀하게 제어할 수 있도록 해준다. AI는 간단한 텍스트 프롬프트에서 놀라운 이미지를 생성할 수 있지만, 단어만으로 이미지 구성을 제어하는 것은 어려울 수 있다. 이 블루프린트를 사용하면 제작자는 블렌더(Blender)와 같은 3D 렌더러에 배치된 간단한 3D 개체를 사용해 AI 이미지 생성을 유도할 수 있다. 아티스트는 3D 애셋을 직접 만들거나 AI를 사용해 생성하고, 장면에 배치하고, 3D 뷰포트 카메라를 설정할 수 있다. 그런 다음, 플럭스 NIM 마이크로서비스로 구동되는 사전 패키지화된 워크플로우가 현재 구성을 사용해 3D 장면에 맞는 고품질 이미지를 생성한다.

엔비디아 NIM 마이크로서비스와 AI 블루프린트는 오는 2월부터 지포스 RTX 50 시리즈, 지포스 RTX 4090와 4080, 엔비디아 RTX 6000와 5000 전문가용 GPU에 대한 초기 하드웨어 지원과 함께 제공될 예정이다. 추후 추가적인 GPU가 지원된다.

NIM 지원 RTX AI PC는 에이서(Acer), 에이수스(ASUS), 델(Dell), 기가바이트(GIGABYTE), HP, 레노버(Lenovo), MSI, 레이저(Razer), 삼성(Samsung), 그리고 커세어(Corsair), 팔콘 노스웨스트(Falcon Northwest), LDLC, 메인기어(Maingear), 미프콤(Mifcom), 오리진 PC(Origin PC), PCS, 스캔(Scan) 등의 로컬 시스템 제작업체에서 구입할 수 있다.

CES에서 엔비디아와 함께 NIM 마이크로서비스, AI 블루프린트, NIM 지원 RTX AI PC가 어떻게 생성형 AI를 가속화하고 있는지 자세히 알아볼 수 있다.

최신목록 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10