엔비디아, 에이전트 AI 성능 강화하는 라마 네모트론 모델 제품군 발표

디스이즈게임(디스이즈게임) 2025-01-08 09:59:22

[자료제공:엔비디아]

- 라마 파운데이션 모델 기반으로 구축, 엔비디아 NIM 마이크로서비스로 제공

- 엔비디아 최신 기술과 고품질 데이터 세트 활용해 훈련 수행

- SAP, 서비스나우 등 선도적인 AI 에이전틱 플랫폼 제공업체에서 최초 도입

AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(www.nvidia.co.kr)가 엔터프라이즈급 에이전틱 AI(Agentic AI) 성능을 강화하는 라마 네모트론(Llama Nemotron) 제품군을 발표했다.

AI는 이제 에이전틱 AI라는 새로운 시대로 접어들고 있다. 에이전틱 AI 시대에는 전문 에이전트로 구성된 팀이 사람들이 복잡한 문제를 해결하고 반복적인 작업을 자동화할 수 있도록 돕는다. 맞춤형 AI 에이전트를 통해 다양한 산업의 기업들은 인텔리전스를 창출하고 전례 없는 생산성을 달성할 수 있다.

이러한 고급 AI 에이전트는 에이전틱 AI 기능과 역량에 최적화된 여러 생성형 AI 모델 시스템을 필요로 한다. 이러한 복잡성은 강력하고 효율적인 엔터프라이즈급 모델의 필요성이 그 어느 때보다 높아졌음을 의미한다.

엔비디아는 엔터프라이즈 에이전트 AI를 위한 기반을 마련하기 위해 오픈 거대 언어 모델(Large Language Model, LLM)인 라마 네모트론 제품군을 발표했다. 라마로 구축된 이 모델은 개발자가 고객 지원, 사기 탐지, 제품 공급망과 재고 관리 최적화 등 다양한 애플리케이션에서 AI 에이전트를 생성하고 배포하는 데 도움을 줄 수 있다.

많은 AI 에이전트가 효과적으로 작동하려면 언어 능력과 세상을 인식하고 적절한 조치로 대응할 수 있는 능력이 모두 필요하다. 엔비디아는 영상 검색과 요약을 위한 새로운 엔비디아 코스모스(Cosmos) 네모트론 비전 언어 모델(Vision Language Model, VLM)과 엔비디아 NIM 마이크로서비스를 공개했다. 개발자들은 이를 활용해 자율 머신, 병원, 상점, 창고는 물론 스포츠 이벤트, 영화, 뉴스의 이미지와 비디오를 분석하고 반응하는 에이전트를 구축할 수 있다.

또한, 엔비디아는 로보틱스와 자율주행 차량(AV)용 물리 기반 영상을 생성하려는 개발자를 위해 엔비디아 코스모스 월드 파운데이션 모델(World Foundation Model, WFM)을 별도로 발표했다.

AI 에이전트의 컴퓨팅 효율성과 정확도를 최적화하는 오픈 라마 네모트론 모델

엔비디아 라마 네모트론 모델은 AI 에이전트 개발을 위한 최적화된 구성 요소를 제공한다. 이는 6억 5천만 회 이상 다운로드된 가장 인기 있는 상용 오픈 소스 모델 컬렉션 중 하나인 라마 파운데이션 모델을 기반으로 구축됐다. 여기에는 현재 엔비디아 API 카탈로그를 통해 제공되는 라마 3.1 네모트론 70B와 같은 최첨단 모델을 개발하기 위한 엔비디아의 노력을 기반으로 한다.

라마 네모트론 모델은 향상된 에이전트 기능을 위해 엔비디아의 최신 기술과 고품질 데이터 세트를 사용해 가지치기와 훈련을 거쳤다. 이 모델은 지시 사항 따르기, 채팅, 함수 호출, 코딩과 수학 문제 해결에서 뛰어난 성능을 발휘하며, 광범위한 엔비디아 가속 컴퓨팅 리소스에서 실행되도록 크기가 최적화돼 있다.

메타(Meta)의 생성형 AI 부문 부사장 아흐마드 알-다흘레(Ahmad Al-Dahle)는 "에이전틱 AI는 AI 개발의 차세대 개척지이며, 이 기회를 활용하려면 효율적이고 정확한 AI 에이전트를 제공하기 위해 LLM 시스템 전반에 걸쳐 풀스택 최적화가 필요하다. 엔비디아와의 협업과 오픈 모델에 대한 공동의 노력을 통해, 라마에 기반한 엔비디아 라마 네모트론 제품군은 기업이 자체 맞춤형 AI 에이전트를 신속하게 개발할 수 있도록 지원한다"고 말했다.

SAP와 서비스나우(ServiceNow)를 비롯한 선도적인 AI 에이전트 플랫폼 제공업체들이 새로운 라마 네모트론 모델을 가장 먼저 사용할 것으로 예상된다.

SAP의 최고 AI 책임자인 필립 헤르지그(Philipp Herzig)은 "여러 비즈니스 부문에 걸쳐 복잡한 작업을 해결하기 위해 협업하는 AI 에이전트는 오늘날의 생성형 AI 시나리오를 넘어 완전히 새로운 차원의 기업 생산성을 실현할 것이다. SAP의 줄(Joule)을 통해 수억 명의 기업 사용자가 이러한 에이전트와 상호작용해 그 어느 때보다 빠르게 목표를 달성할 수 있다. 엔비디아의 새로운 오픈 라마 네모트론 모델 제품군은 비즈니스 프로세스를 혁신하기 위한 여러 전문 AI 에이전트 개발을 촉진할 것"이라고 말했다.

서비스나우의 플랫폼 AI 담당 부사장 제레미 반즈(Jeremy Barnes)는 "AI 에이전트는 조직이 더 적은 노력으로 더 많은 성과를 달성할 수 있게 해주며, 비즈니스 혁신의 새로운 기준을 제시한다. 엔비디아의 오픈 라마 네모트론 모델의 향상된 성능과 정확성은 모든 산업에서 여러 기능에 걸쳐 복잡한 문제를 해결하는 고급 AI 에이전트 서비스를 구축하는 데 도움이 될 수 있다"고 말했다.

엔비디아 라마 네모트론 모델은 엔비디아 네모(NeMo)를 증류, 가지치기, 정렬을 진행한다. 이러한 기술을 사용해 모델은 다양한 컴퓨팅 플랫폼에서 실행할 수 있을 만큼 충분히 작으면서도 높은 정확도와 향상된 모델 처리량을 제공한다.

라마 네모트론 모델 제품군은 다운로드 가능한 모델과 클라우드, 데이터센터, PC, 워크스테이션에 쉽게 배포할 수 있는 엔비디아 NIM 마이크로서비스로 제공될 예정이다. 이들은 기업에 신뢰할 수 있고 안전하며 원활한 통합을 통해 업계 최고의 성능을 지원한다.

엔비디아 네모로 비즈니스 지식 맞춤화와 연결하기

라마 네모트론과 코스모스 네모트론 모델 제품군은 AI 에이전트를 다양한 규모로 배포할 수 있는 옵션을 제공하기 위해 나노(Nano), 슈퍼(Super), 울트라(Ultra) 크기로 출시된다.

▲나노: 지연 시간이 짧고 실시간 애플리케이션에 최적화된 가장 비용 효율적인 모델로, PC와 엣지 디바이스에 배포하는 데 이상적이다.

▲슈퍼: 단일 GPU에서 탁월한 처리량을 제공하는 정확도가 높은 모델이다.

▲울트라: 최고 성능을 요구하는 데이터센터 규모의 애플리케이션을 위해 설계된 최고 정확도 모델이다.

기업은 엔비디아 네모 마이크로서비스를 통해 특정 사용 사례와 도메인에 맞게 모델을 맞춤화할 수 있다. 이를 통해 데이터 큐레이션을 간소화하고, 모델 맞춤화와 평가를 가속화하며, 응답이 적절하게 유지되도록 가드레일을 적용할 수 있다.

또한, 개발자는 엔비디아 네모 리트리버(Retriever)를 통해 검색 증강 생성(Retrieval Augmented Generation, RAG) 기능을 통합해 모델을 엔터프라이즈 데이터에 연결할 수 있다.

아울러 에이전틱 AI를 위한 엔비디아 블루프린트(Blueprint)를 사용하면 기업은 엔비디아의 고급 AI 툴과 엔드-투-엔드 개발 전문성을 사용해 자체 애플리케이션을 빠르게 제작할 수 있다. 실제로 엔비디아 코스모스 네모트론, 엔비디아 라마 네모트론, 네모 리트리버는 CES에서 별도로 발표된 새로운 영상 검색과 요약용 엔비디아 블루프린트의 성능을 강화한다.

네모, 네모 리트리버, 엔비디아 블루프린트는 모두 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼에서 사용할 수 있다.

이용 정보

라마 네모트론과 코스모스 네모트론 모델은 곧 호스트된 API로 제공될 예정이며, build.nvidia.com와 허깅페이스(Hugging Face)에서 다운로드할 수 있다. 개발, 테스트, 연구를 위한 액세스는 엔비디아 개발자 프로그램(Developer Program) 회원에게 무료로 제공된다.

기업은 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼을 통해 가속화된 데이터센터와 클라우드 인프라에서 라마 네모트론과 코스모스 네모트론 NIM 마이크로서비스를 실행할 수 있다.

모바일게임 아지트

실시간정보

엔비디아, 에이전트 AI 성능 강화하는 라마 네모트론 모델 제품군 발표

실시간정보 많이 본 기사

주간 많이 본 기사