
황런쉰, 2026년 GTC 타이베이 기조연설: AI 에이전트 시대의 도래 — 계산력이 곧 수익
정리 & 번역: TechFlow

출연자: 젠슨 황(Jensen Huang), 엔비디아 CEO
패러디 소스: 보니 블록체인(Bonnie Blockchain)
원제목: 젠슨 황, 2026년 GTC 타이베이 기조연설 7대 핵심 포인트 — 엔비디아 최신 전략 요약본! 【보니 블록체인】
방송일: 2026년 6월 2일
핵심 요약
2026년 GTC 타이베이 기조연설에서 젠슨 황은 엔비디아의 차기 전략을 하나의 핵심 판단에 집중시켰다. 즉, AI는 콘텐츠 생성 단계를 넘어 ‘작업을 수행하는 에이전트(Agent) 시대’에 진입했으며, 토큰(Token)은 더 이상 기술 지표가 아니라 수익·이익·GDP를 창출하는 실질적 생산 단위가 되었다는 것이다. 이러한 변화를 바탕으로 엔비디아는 베라 루빈(Vera Rubin), 베라 CPU, 기업용 에이전트 툴킷, 마이크로소프트와 공동 개발한 차세대 PC, 그리고 물리적 AI(Physical AI)를 위한 코스모스 3(Cosmos 3), 알파마요 2(Alpamayo 2), 아이작 GR00T(Isaac GR00T)를 발표했다. 황은 향후 10년간의 컴퓨팅 패턴이 ‘모델–에이전트 프레임워크–툴 스킬–런타임’의 네 가지 요소로 구성될 것이며, 이 패턴이 클라우드·기업 내부·로컬 PC에서 로봇·공장·위성·엣지 장치까지 확산될 것이라고 강조했다. 대만 공급망 입장에서는 AI 팩토리 구축, 전력 효율성, 인프라 구축 속도, 전 스택 협업 역량이 차기 산업 성장의 핵심이 될 것임을 의미한다.
주요 통찰 요약
AI 에이전트 시대의 도래
- “유용한 AI가 이미 도래했다. AI는 이제 수익 창출기이자 GDP 창출기이다. 그 이면에는 대규모 언어모델(Large Language Model, LLM)만 있는 것이 아니라, 완전히 새로운 컴퓨팅 패턴—즉, 에이전트가 있다.”
- “에이전트는 대규모 언어모델과 에이전트 프레임워크로 구성되며, 이 프레임워크는 메모리·툴·추론·계획·행동을 연결해 운영체제(OS)처럼 작동한다.”
- “에이전트 시스템의 돌파구는 대규모 언어모델이 사고·추론·계획·툴 활용 능력을 갖추게 된 데서 비롯되었고, 동시에 에이전트 프레임워크가 메모리 관리·프로세스 조정·툴 스케줄링을 가능하게 한 데서 비롯되었다.”
- “모든 기업은 에이전트 기업이 될 것이며, 각 기업 내부에서는 에이전트가 실행되고, 자체 에이전트 운영체제가 필요할 것이다.”
토큰, AI 팩토리 및 인프라 경제학
- “토큰은 이제 이익을 창출하는 수익 단위다. AI 기업들은 더 많은 토큰을 생산하기 위해 더 많은 AI 팩토리를 건설하게 되는데, 이것이 바로 대만의 컴퓨팅 수요가 폭증하는 이유다.”
- “컴퓨팅은 곧 수익이며, 컴퓨팅은 곧 이익이다. 수익과 이익이 없으면, 그것은 손실이다.”
- “AI 팩토리의 전력 용량이 1기가와트(GW)라면, 그 한계는 정확히 1GW다. 이 전제 하에서, 1와트당 처리량은 곧 수익이며, 모든 토큰은 가치를 지닌다.”
- “칩 가격이 저렴하다는 이유만으로 부적절한 아키텍처를 선택해도 실제 수익으로 이어지지 않는다. 당신이 확보해야 할 것은 ‘1와트당 수익’이다. 많이 살수록, 더 많이 번다.”
베라 루빈과 엔비디아의 인프라 전환
- “베라 루빈은 단순한 칩도, GPU도 아니다. 끝에서 끝까지 설계된 완전한 시스템이다.”
- “엔비디아는 과거 GPU 기업이었고, 이후 시스템 기업으로 진화했으며, 지금은 고객이 AI 팩토리를 구축하도록 지원하는 인프라 기업으로 한층 더 진화하고 있다.”
- “베라 루빈은 엔비디아 역사상 가장 야심 찬 엔지니어링 프로젝트로, 전사 4만 명의 엔지니어가 참여했으며, 대만 공급망도 이 시스템의 개발에 공동 참여했다.”
- “그레이스 블랙웰(Grace Blackwell)은 AI, 특히 추론(Inference)을 위해 설계되었고, 베라 루빈은 에이전트 실행을 위해 설계되었다.”
베라 CPU와 에이전트의 컴퓨팅 수요
- “지금까지 모든 CPU는 인간을 위해 설계된 것이었다. 이 CPU는 에이전트를 위해 설계된 것이다.”
- “에이전트는 인내심이 없다. 그들이 사는 세계는 초 단위가 아니라 나노초 단위다. 에이전트가 툴을 사용할 때는 응답 시간이 최대한 짧기를 원하며, 데이터베이스에 접근할 때는 결과를 즉시 반환받기를 원한다.”
- “베라 CPU는 에이전트를 위해 특화된 CPU로, 싱글 스레드 성능·클럭당 명령어 수(IPC)·코어당 대역폭·시스템 전체 대역폭을 중시한다.”
- “이 시장은 이전 시장보다 반드시 더 커질 것이다. 왜냐하면 에이전트의 수는 인간을 훨씬 초월할 것이고, 또 에이전트는 극도로 인내심이 없기 때문이다. 이것이 바로 엔비디아 베라 CPU다.”
차세대 개인용 컴퓨터(PC)
- “향후 에이전트 기반 컴퓨팅은 AI 클라우드·기업 내부뿐 아니라 당신의 PC에서도 실행될 것이다.”
- “차세대 운영체제는 기존 OS에 대규모 언어모델을 결합한 형태가 될 것이다. 대규모 언어모델은 여러 면에서 현대판 디렉트X(DirectX)이며, 컴퓨터의 지능형 확장이다.”
- “애플리케이션은 에이전트 런타임으로 대체될 것이며, 현대 애플리케이션은 하나의 에이전트가 될 것이다.”
- “엔비디아는 마이크로소프트와 함께 PC를 재정의하고, 데스크톱·노트북·워크스테이션을 아우르는 차세대 윈도우 기반 머신을 출시할 예정이다.”
물리적 AI, 자율주행, 로봇
- “언어모델은 인간 시각의 데이터로 훈련되지만, 로봇은 스스로의 시각에서 세상을 이해해야 한다. 물리적 AI의 최대 과제는 바로 데이터다.”
- “코스모스 3은 물리적 AI의 선도적 기반 모델로, 이해·추론·생성·폐루프 시뮬레이션은 물론 전략 자체가 될 수도 있다.”
- “AI가 등장함에 따라, 컴퓨팅 자체도 데이터가 된다. 코스모스 3을 통해 더 많은 AI 모델을 훈련시키고, 이를 자체 전용 모델로 고도화할 수 있다.”
- “클라우드 기반 에이전트든, PC 기반 에이전트든, 자율주행 시스템이든, 인간형 로봇이든, 그 이면의 컴퓨팅 패턴은 동일하다: 모델·프레임워크·툴 스킬·런타임이다.”
젠슨 황, 대만 간식을 AI 공급망으로 ‘지명’
젠슨 황:
대만 생태계가 오늘날 이처럼 거대한 규모로 성장한 것은 정말 믿기지 않을 정도다. 대부분의 사람들이 ‘생태계’라고 하면 먼저 생각하는 것은 우리의 소프트웨어 스택, 즉 엔비디아 컴퓨팅 시스템 위에서 활동하는 개발자 생태계일 것이다. 그러나 엔비디아의 생태계는 여기서 멈추지 않는다. 그것은 위로는 대만 공급망, 즉 모든 것이 시작되는 곳까지 확장되며, 아래로는 데이터센터, 궁극적으로는 최종 사용자까지 이어진다.
오늘 우리는 이 생태계의 거의 모든 단계에 대해 이야기할 것이다. 감사해야 할 사람이 너무 많다. 나는 이곳의 생태계를 사랑한다. 여기에는 수많은 기업이 있고, 내가 가장 좋아하는 생태계 파트너들도 많다. 대만은 전 세계에서 가장 풍부하고 우수한 공급망 생태계를 보유하고 있다.
AI 에이전트 시대의 도래
젠슨 황:
2년 전 제가 이 자리에 섰을 때, AI가 생성형 AI에서 다음 물결—즉, ‘에이전트형 AI’로 진화한다는 것을 말씀드렸다. 오늘 우리는 이렇게 말할 수 있다. ‘에이전트형 AI가 도래했고, 유용한 AI가 도래했다.’
산업적 관점에서 보면, 이는 토큰 수요가 극도로 급증하고 있음을 의미한다. 왜냐하면 AI가 실제로 일을 할 수 있게 되면, 사람들은 그런 능력을 더욱 많이 생산하려고 하기 때문이다. 토큰은 이제 이익을 창출하는 단위이며, 수익을 발생시키는 단위가 되었다. 그것이 돈을 벌 수 있다면, AI 기업들은 더 많은 토큰을 구축하고, 더 많은 토큰을 생성하며, 더 많은 AI 팩토리를 건설하려 할 것이고, 이것이 바로 대만의 컴퓨팅 수요가 폭증하는 이유다.
이것이 여러분이 모두 바쁘게 움직이고, 사업 실적이 매우 좋은 이유다. 사실, 일부 기업의 주가에도 이런 모습이 반영되어 보인다. 컴퓨팅 패턴이 완전히 바뀌었고, 모든 것이 변했다.
첫 번째 핵심 포인트는: 유용한 AI가 도래했고, AI는 이제 수익 창출기이자 GDP 창출기라는 것이다. 그 이면에는 완전히 새로운 컴퓨팅 패턴이 있다. 그것은 단순한 대규모 언어모델이 아니라, 에이전트다. 오늘 우리가 다룰 거의 모든 내용은 이 기반 위에서 전개될 것이다.
잠시 제 말을 설명드리겠다. 여기는 하나의 에이전트, 하나의 에이전트 애플리케이션이다. 과거에는 여기에 애플리케이션이 있었고, 코드가 있었고, 운영체제가 있었다. 즉, 애플리케이션 안의 코드가 운영체제 위에서 실행되었다. 오늘날, 그것은 에이전트이며, 하나 이상의 대규모 언어모델로 구성되어 있으며, 에이전트 프레임워크 안에 배치된다. 이 프레임워크는 에이전트가 작업을 조율하고, 실제로 생산적인 과제를 완수하도록 돕는다.
입력이 시스템에 들어오면, 에이전트는 이해·관찰·추론·행동을 수행하고, 툴을 활용해야 한다. 이 툴은 스프레드시트·웹 브라우저·데이터 처리 엔진 또는 데이터베이스 엔진일 수 있다. 맥락 처리·현재 상황 파악·다음 단계 결정·실행 가능한 계획 수립 등 정보 흐름의 모든 단계는 어떤 소프트웨어에 의해 조율되어야 한다.
따라서 에이전트의 본질은 바로 이런 시스템이다. 그것은 인간처럼 단기 기억(작업 기억)과 장기 기억을 모두 처리한다. 따라서 메모리 관리 시스템은 극도로 중요해진다. 이 전체 시스템을 ‘에이전트’라고 부른다. 대규모 언어모델은 사고를 담당하고, 에이전트 프레임워크는 모든 것을 연결해 운영체제처럼 작동한다.
이것이 바로 새로운 컴퓨팅 패턴이며, 에이전트가 놀라운 과제를 수행할 수 있는 이유다. 이는 중대한 돌파구다: 대규모 언어모델은 이미 사고·추론·계획·툴 활용 능력을 충분히 갖추었고, 동시에 우리는 메모리 관리·프로세스 조정·툴 호출 기능을 갖춘 에이전트 프레임워크도 확보했다. 그러므로 우리는 이제 과거에는 불가능했던 많은 일들을 해낼 수 있다.
AI 팩토리의 토큰이란 무엇인가?
젠슨 황:
토큰, DSX, GPU, CPU, 베라… 우리는 차세대 시스템 베라 루빈을 개발했다. 베라 루빈은 단순한 칩도, GPU도 아니다. 그것은 GPU에서 시작하지만, GPU를 넘어서는 것이다. 끝에서 끝까지 구성된 전체 시스템이 바로 베라 루빈이다.
그것은 GPU, 베라 루빈 NVLink 72, 그리고 제가 곧 소개할 베라 CPU로 구성된다. 또한 혁신적인 베라 스토리지 시스템, CX9, 우리 소프트웨어 스택 DOCA, 내장 보안 프로세서도 포함된다. 시스템 내 모든 데이터—정적 저장 상태, 전송 중, 혹은 사용 중—는 암호화된다. 전체 시스템이 안전한 이유는 AI 모델이 극도로 소중하기 때문이다. 그래서 이 전체 시스템은 기밀 컴퓨팅(Confidential Computing)을 준수한다.
이 시스템들 중 어느 하나라도 단독으로 충분히 혁명적일 만큼 강력하다. 베라 루빈은 엔비디아 역사상 가장 야심 찬 엔지니어링 프로젝트다. 전사 4만 명의 엔지니어가 베라 루빈 개발에 참여했으며, 여기 계신 여러분도 이 전체 시스템의 창조에 함께 참여했다. 베라 루빈은 정말 기적 같은 존재인데, 단순한 칩이 아니라 여러 구성 요소가 결합된 시스템이다.
그리고 이것으로 끝나지 않는다. 오래 전, 엔비디아는 GPU 기업이었다. 최근 몇 년간 우리는 점차 시스템 기업으로 진화해왔다. 여러분이 지금 보는 것은 우리가 처음부터 설계한 가장 복잡한 시스템이다. 그러나 결국 고객과 파트너가 사고 싶어 하는 것은 컴퓨터가 아니라 AI 팩토리다.
이것이 엔비디아가 다시 한 번 전환을 시작하는 이유다. 여러분도 보셨듯이, 우리의 기술은 이제 완전한 인프라 규모로 확장되었다. 우리의 파트너 역시 인프라 규모다: 발전소, 냉각 시스템, 전력망 공급업체, 그리고 많은 산업 기업들이 지금 우리 생태계의 일부가 되었다. 결국 우리는 GPU·그레이스 블랙웰·NVLink 72을 구축했던 것처럼, 완전한 스택 시스템을 구축하여 고객이 탁월한 AI 인프라를 건설할 수 있도록 해야 한다.
이 일을 잘 수행하고, 고객이 AI 팩토리를 효과적으로 구축·배포할 수 있도록 돕는 것은 극도로 중요하다. 그 이유는 단순하다: 컴퓨팅은 곧 수익이며, 컴퓨팅은 곧 이익이다. 수익과 이익이 없으면, 그것은 손실이다.
여러분은 다음 사실을 이해해야 한다. AI 인프라가 가동되면, 신속하게 온라인화될 수도 있고, 오랜 시간이 걸릴 수도 있다. 처리량은 높을 수도 있고 낮을 수도 있으며, 탄력성과 신뢰성도 좋을 수도 있고 나쁠 수도 있다. 유효 수명도 길 수도 있고 짧을 수도 있다. 왜냐하면 이는 500억 달러, 600억 달러, 심지어 1000억 달러에 달하는 투자를 의미하기 때문이다. 그러므로 이 곡선은 극도로 중요하다.
그래서 엔비디아는 훌륭한 파트너가 될 수 있다. 우리는 완전한 통합 능력을 갖추고 있으며, 단순히 프레젠테이션 한 장을 만드는 것이 아니라, 실제로 전체 인프라를 창조하고, 모든 것을 연결하며, 직접 대규모로 구축해 시스템이 잘 작동하도록 보장한다. 따라서 우리의 첫 번째 토큰 생성 시간, 첫 번째 추론 시간, 훈련 시작 시간은 모두 더 빠르다.
둘째, 우리의 1와트당 처리량, 즉 1와트당 토큰 수는 세계 최고 수준이다. 그 이유는 우리가 모든 것을 통합하고, 처음부터 모든 것을 설계하며, 전체 시스템을 시뮬레이션하고, 극한의 공동 설계(Co-Design)를 적용하기 때문이다. 방금 보여드린 베라 루빈 캐비닛처럼, 모든 설계는 놀라운 처리량을 실현하기 위해 이루어졌다.
만약 당신의 데이터센터나 공장이 1기가와트의 전력을 공급받는다면, 그 이상은 얻을 수 없으며, 그것이 당신이 확보할 수 있는 전력의 전부다. 1기가와트 전력 하에서, 1와트당 처리량은 곧 수익이며, 모든 토큰은 이익을 창출하고, 모든 토큰은 수익이다.
이것이 미래다. 컴퓨팅은 곧 수익이며, 1와트당 성능은 바로 당신의 수익이다. 칩 가격이 저렴하다는 이유만으로 잘못된 아키텍처를 선택해도 실제 수익으로 이어지지 않는다. 당신이 확보해야 할 것은 ‘1와트당 수익’이다. 많이 살수록, 더 많이 번다.
저는 지금 여러분 앞에 서서 말씀드릴 수 있다: 베라 루빈은 이미 전면 양산에 들어갔다. 베라 루빈을 위해 구축한 공급망 규모는 그레이스 블랙웰의 두 배다. 과거 그레이스 블랙웰 캐비닛 하나를 조립하는 데 2시간이 걸렸다면, 지금은 단 5분이다. 따라서 생산 능력뿐 아니라 생산 처리량도 훨씬 빠르며, 우리는 수요를 충족시키기 위해 이 모든 것을 필요로 한다.
이 생태계는 특별하다. 그레이스 블랙웰을 지원하고 베라 루빈의 양산 증가를 준비하기 위해 이미 수백만 평방피트 규모의 생산 능력이 가동되었다. 여러분께 진심으로 감사드린다. 베라 루빈은 이미 전면 양산에 들어갔다. 고맙습니다.
베라 루빈 시스템 소개
젠슨 황:
베라 루빈은 단순히 AI를 위해 만들어진 것이 아니다. 베라 루빈은 AI 실행을 위해 만들어진 것도 아니며, 에이전트 실행을 위해 만들어진 것이다. 이것은 에이전트 중심 시스템이다. 그 복잡성을 상상해 보라. 그래서 에이전트는 마지막 컴퓨터 과학 돌파구다. 오랜 세월이 흘러야 비로소 잠재력을 실현하고 유용해질 수 있었다. 그것을 실행할 수 있는 컴퓨터는 당연히 세계에서 가장 첨단이어야 한다.
바로 이것이 베라 루빈이다. 함께 보시자. 베라 루빈을 가져오십시오.
이것이 베라 루빈, 베라 루빈 NVLink 72이다. 이것은 차세대 시스템의 일부이며, 다음 GTC에서 더 자세히 설명드릴 예정이다. 오늘은 아직 다뤄야 할 내용이 많다. 이것은 베라 CPU 캐비닛으로, 256개의 CPU가 모두 액체 냉각 방식이다. 곧 베라에 대해 설명드릴 것이다. 이것은 베라 블루필드(BlueField) 스토리지 처리 시스템이며, 동시에 보안 시스템이기도 하다. 물론, 우리의 멜라녹스(Mellanox) 네트워크도 포함되는데, 이는 세계 최초의 CPO(Chiplet-based Photonic Optics)다. 이것이 베라 루빈이며, 놀라운 기술들이 결합된 것이다.
우리가 호퍼(Hopper)를 만들었을 때, 그것은 사전 훈련(Pre-training)을 위해 설계되었다. 당시 가장 중요한 애플리케이션이자 가장 큰 부하였던 사전 훈련을 위해 개발된 것이다. 이후 그레이스 블랙웰을 만들 때, 많은 분들이 “젠슨, 엔비디아는 사전 훈련에 능숙하지만, 추론은 간단하다”고 말씀하셨다. 기억나시나요? 당시 많은 분들이 “추론은 간단하다, 우리도 할 수 있다”고 하셨다.
그러나 여러분도 아시다시피, 추론은 곧 돈이다. 모델은 매우 복잡하며, 높은 응답 속도·빠른 상호작용·높은 처리량을 동시에 달성하는 것은 극도로 어렵다. 그래서 우리는 NVLink 72를 개발했다.
오늘날, 엔비디아의 토큰 비용은 세계 최저 수준이다. 10% 낮은 것이 아니라, 수 배, 심지어 수십 배 낮은 수준이다. 이 모든 것은 우리가 극한의 공동 설계를 했기 때문이며, 추론의 컴퓨팅 모델과 패턴을 깊이 이해하고 NVLink 72를 창조했기 때문이다.
베라 루빈 단계에 이르러서는, 이제 추론을 넘어서 에이전트 시스템 내부의 추론이 된다. 이것이 바로 베라 루빈이다. 케이블도, 호스도, 팬도 없다. 지난번 제가 이걸 처음 보여드렸을 때, 케이블이 어지럽게 흩어져 있었다.
베라 CPU: AI 에이전트를 위한 CPU
젠슨 황:
베라 CPU는 AI 시대를 위해 설계된 CPU다. 지금까지 모든 CPU는 인간을 위해 설계된 것이었다. 우리는 과거에 사용자이자 임차인이었다. 인간이 CPU를 사용하는 방식은 초 단위로 살아가는 세계에 기반한다. 우리는 클라우드에서 CPU를 임대하며, CPU 코어가 많을수록 임대할 수 있는 리소스도 많아진다. 기존 CPU의 사용 사례와 경제학은 에이전트와 완전히 다르다.
에이전트는 인내심이 없다. 그들이 사는 세계는 초 단위가 아니라 나노초 단위다. 에이전트가 툴을 사용할 때는 응답이 가능한 한 빨랐으면 하고, 데이터베이스에 접근할 때는 결과가 즉시 반환되기를 원한다. 에이전트는 순간이라도 기다리면 다음 단계·그 다음 단계·그 다음 단계로 진행되지 못한다. 따라서 우리는 CPU를 가능한 한 지연 시간이 짧고, 상호작용성이 뛰어나도록 설계해야 한다.
이것이 우리가 AI 시대를 위해 베라 CPU를 창조한 이유다. 우리 시스템 내에서 베라는 세 가지 용도로 사용된다. 첫 번째는 당연히 베라 루빈 내에서 사고를 담당하는 것이다. 베라 루빈 캐비닛 내에는 이미 두 개의 CPU가 있다. 우리가 수백만 대의 베라 루빈을 제조·판매하고 있으며, 이미 수백만 대의 그레이스 블랙웰도 판매했다는 것을 아실 것이다. 엔비디아는 이미 세계 최대의 CPU 제조사 중 하나가 되었다.
베라 루빈 캐비닛 내의 두 개 CPU 중 하나는 GPU 조율 및 관리, KV 캐시 관리, 캐비닛 내 다양한 소프트웨어 실행을 담당한다. 우리는 보안 및 격리용으로 그레이스 블루필드도 사용한다. 베라 계산 부분은 에이전트 프레임워크를 담당하며, AI 모델 조율·툴 사용·데이터베이스 접근을 담당한다.
여기 데이터 서버는 베라 블루필드로, 세계에서 가장 빠른 스토리지 서버이자 스토리지 시스템이다. 이것이 극도로 중요한 이유는 에이전트가 메모리에 극도로 빠른 속도로 접근하기 때문이다. 스토리지 서버와 CPU는 이제 데이터센터에서 가장 비싼 부분의 핵심 경로에 위치해 있다.
이 부분이 가장 비싼 이유는 충분하다. AI 팩토리의 경제학 핵심은 토큰이며, 토큰은 바로 여기서 창조된다. 따라서 당신은 당연히 가능한 한 많은 토큰을 제조하고 생성하기를 원할 것이다. 경제적 가치는 모두 여기에 집중되어 있으며, CPU와 스토리지 시스템은 절대로 병목이 되어서는 안 된다.
따라서 베라 CPU는 CPU 아키텍처에 큰 부담을 주었고, 이것이 우리가 처음부터 완전히 새로운 아키텍처를 설계한 이유다. 이것은 세계 어디에도 없던 CPU이며, 우리는 이를 베라라 부른다. 이것은 에이전트를 위해 설계된 CPU다. 지금까지 모든 CPU는 인간을 위해 설계된 것이었고, 이 CPU는 에이전트를 위해 설계된 것이다.
첫째, 베라의 클럭당 명령어 수(IPC)는 극도로 강력해야 한다. 왜냐하면 우리는 지연 시간과 처리 시간을 단축시키기 원하기 때문이다. 우리는 단순한 처리량이 아니라 싱글 스레드 성능을 원한다. 싱글 스레드 성능은 세계 최고 수준이어야 하며, 최고가 되어야 한다. 따라서 베라의 IPC는 세계 최고 수준으로, 클럭당 10개의 명령어를 가져오고, 디코딩하며, 실행한다.
둘째, CPU가 데이터를 입출력하는 데 필요한 대역폭은 세계 최고 수준이어야 한다. 여기에는 코어당 대역폭뿐 아니라 전체 대역폭도 포함된다. 앞서 말씀드린 바와 같이, 에이전트 시스템은 본질적으로 분리·분산형이다. 계산이 분리되고 분산 배치될 때, 네트워크가 문제가 된다. 따라서 우리는 CPU 코어 간, CPU와 스토리지 간, CPU와 GPU 간 데이터 이동을 가능한 한 빠르게 해야 한다.
CPU 코어 주변과 코어 내부의 대역폭도 모두 세계 최고 수준이어야 한다. 왜냐하면 CPU 코어들이 극도로 높은 대역폭으로 서로 통신하고 있기 때문이다. 코어는 하나씩 임대되는 것이 아니라, 모두 함께 협업한다. 베라의 횡단면 대역폭은 매우 놀랍다. 이는 세계 최초로 PCI Express Gen 6를 지원하는 시스템이며, LPDDR5를 최초로 채택해 초당 1.2~2TB의 대역폭을 제공한다. 이는 최고 성능 CPU의 2~3배 수준이다.
이것은 에이전트를 위해 설계된 CPU다. 이 시장은 이전 시장보다 반드시 더 커질 것이다. 왜냐하면 에이전트의 수는 인간을 훨씬 초월할 것이고, 에이전트는 극도로 인내심이 없기 때문이다. 이것이 바로 엔비디아 베라 CPU다.
향후 10년간 가장 중요한 컴퓨팅 패턴
젠슨 황:
이 페이지는 정말로 가장 중요합니다. 여기의 핵심 결론은: 이것이 바로 향후 10년간의 애플리케이션 패턴이며, 향후 10년간의 컴퓨팅 패턴이다. 에이전트, 에이전트 프레임워크, 그리고 프레임워크가 조율하는 대규모 언어모델—모든 기업이 이것을 실행할 것이다. 모든 기업은 에이전트 기업이 될 것이며, 모든 기업 내부에는 에이전트가 실행될 것이고, 모든 기업은 에이전트가 자신만의 운영체제를 필요로 한다는 것을 알게 될 것이다.
모든 기업이 우리에게 묻는다: “어떻게 안전하게 에이전트를 실행할 수 있나요? 어떻게 우리 작업 부하를 위해 에이전트를 구축할 수 있나요?” 그래서 우리는 NVIDIA 엔터프라이즈 AI 에이전트 툴킷(NVIDIA Enterprise AI Agent Toolkit)을 마련했다. 사실, 저는 여러분 앞에서 공개적으로 이 툴킷을 단계별로 구축해온 것을 보셨을 것이다.
엔비디아가 하는 거의 모든 일은 여러분도 아실 것이다. 제가 5년 전 또는 10년 전 GTC 연설을 돌아보면, 제가 오랫동안 오늘 이 내용을 이야기해왔다는 것을 알 수 있을 것이다. 왜냐하면 우리는 이 순간을 위해 오랜 시간 준비해왔기 때문이다.
기업이 ‘에이전트 서비스’를 구축하거나 운영용 에이전트를 구축하려면 네 가지가 필요하다. 첫째, 모델이 필요하다. 물론, 대규모 언어모델은 더 똑똑할수록, 더 저렴할수록, 더 빠를수록 좋다. 둘째, 전체 시스템을 조율할 프레임워크가 필요하다. 셋째, 이 모델들은 툴을 사용하고 싶어 하는데, 이 툴들은 기능(Skill)을 지닌다. 제가 방금 CUDA-X 라이브러리를 보여드렸는데, 이 라이브러리는 앞으로 에이전트의 강력한 툴이 될 것이다. 넷째, 모든 것을 연결하는 운영체제인 런타임(Run-time)이 필요하다.
이것이 바로 NVIDIA 에이전트 툴킷이다. 그것은 수정 가능한 모델, 즉 엔비디아의 세계 최고 수준의 오픈소스 모델을 포함한다. 더 보여드리고 싶다. 당신은 어디서든 가져온 에이전트를 실행할 수 있다. 클로드 코드(Claude Code) 같은 강력한 에이전트도 실행할 수 있고, 코덱스(Codex) 같은 강력한 에이전트도 실행할 수 있다. 당신은 이를 ‘오픈 쉘(Open Shell)’이라는 프레임워크 안에 넣어 기업 내부에서 고도로 안전하게 실행할 수 있다.
이 쉘은 에이전트를 보호하여 항상 보안 정책에 따라 작동하도록 한다. 프라이버시는 보호되며, 권한과 특권은 명확히 할당되고, 신원도 보호된다. 따라서 오픈 쉘은 전 세계적으로 채택되고 있다. NVIDIA 오픈 쉘은 오픈소스이며, 레드햇(Red Hat), 카노니컬(Canonical), 마이크로소프트 등 많은 기업이 이를 채택하고 있다. 전 세계적으로 광범위하게 채택될 것이다.
이는 중요한 런타임이며, 이 런타임은 보편적인 NVIDIA AI 플랫폼에 완전히 최적화되어 있다. 당신은 어떤 클라우드든, 로컬 환경이든, 심지어 디바이스 단말기에서도 오픈 쉘을 실행할 수 있다. 이제 당신은 에이전트가 사용할 수 있는 툴과 라이브러리, 수정하거나 바로 사용할 수 있는 모델, 그리고 에이전트 프레임워크를 모두 갖추게 되었다. 이러한 에이전트 프레임워크는 이제 로컬이나 다른 어디서든 실행될 수 있다.
제가 가장 좋아하는 에이전트 사례 중 하나는 반도체 설계자다. 이것은 엔비디아가 수행하는 가장 중요한 업무 중 하나다. 따라서 우리는 당연히 캐덴스(Cadence)와 협력해 반도체 설계 슈퍼 에이전트를 구축했다. 이는 코덱스 또는 클로드 코드가 조율하며, RTL·아키텍처 다이어그램·회로도·사양서를 입력으로 받아, 수정이 필요한 부분을 찾아 해결해준다. 우리는 공동으로 몇 가지 슈퍼 에이전트를 개발했으며, 이를 네모트론(Nemotron)을 통해 NVIDIA 런타임에 최적화했다.
엔비디아는 세계를 위해 개방형 모델을 구축하고, 여러분과 우리 모두가 자신의 에이전트를 창조할 수 있도록 하기 위해 노력하고 있다. 오늘, 우리는 네모트론 3 얼티메이트(Nemotron 3 Ultra)를 발표한다. 이것은 우리의 차세대 개방형 모델이며, 매우 똑똑하다. 네모트론 모델은 단순히 모델만 제공하는 것이 아니라, 우리가 모델을 훈련시키는 데 사용한 모든 데이터도 함께 제공한다.
우리는 강력한 파트너 연합을 보유하고 있으며, 여기 나열된 모든 파트너를 확인하실 수 있다. 우리는 공동으로 협력하고, 서로 데이터를 기여한다. 이러한 훌륭한 협력 관계를 통해, 모델에서 훈련 스크립트, 데이터에 이르기까지 모든 것을 완전히 여러분께 공개한다. 이것이야말로 개방형 모델의 최고 형태이며, 세계 최고의 개방형 모델 시스템 정책이다. 목표는 단순하다: 당신은 모든 것을 가져가서, 그것을 계속 확장하고, 더 나아지게 만들고, 그것이 당신만의 모델이 되게 할 수 있다.
네모트론 3 얼티메이트는 속도가 5배 빨라지고, 비용은 30% 감소했으며, 완전히 개방되어 있다. 우리는 이에 대해 매우 확고하다. 이것이 네모트론 3이며, 현재 우리는 네모트론 4도 개발 중이다. 바로 이 모델·프레임워크·툴 스킬·런타임으로 구성된 완전한 툴킷 덕분에, 전 세계 모든 기업은 캐덴스가 슈퍼 에이전트를 사용하는 것처럼, 자신만의 에이전트를 창조할 수 있다.
NVIDIA 차세대 개인용 컴퓨터(PC)
젠슨 황:
마이크로소프트와 엔비디아는 PC를 재정의할 것이다. 이것이 새로운 PC가 될 것이다. 내일 밤, 아마도 우리 지역 시간으로 내일 밤, 저는 사티아(Satya)와 함께 지난 3년간 함께 추진해온 작업에 대해 더 자세히 이야기할 예정이다. 마이크로소프트와 엔비디아는 PC가 작동하는 방식을 완전히 재고하기 위해 오랜 시간을 들였고, 바로 이 순간을 준비하기 위해서였다.
앞서 말씀드린 바와 같이, 에이전트 기반 컴퓨팅 모델은 AI 클라우드에서 실행될 것이며, 기업 내부에서 실행될 것이며, 당신의 PC에서도 실행될 것이다. PC가 자율 에이전트를 갖게 되면 무슨 일이 벌어질까? 그것은 당신을 도울 것이고, 당신을 이해할 것이다. 당신은 그것과 대화할 수 있고, 그것이 당신을 볼 수 있다. 당신은 그것에게 파일을 읽게 하고, 연구를 도와달라고 요청할 수 있다. 그것이 할 수 있는 일은 이것보다 훨씬 많으며, 곧 보여드리겠다.
새로운 운영체제는 당연히 기존 운영체제에 대규모 언어모델을 추가한 것이다. 많은 면에서, 대규모 언어모델은 현대판 디렉트X(DirectX)다. 그것은 입력과 출력을 가지며, 프롬프트를 이해하고, 컴퓨터 비전을 이해하며, 영상과 음성을 생성할 수 있다. 그것은 PC이자 컴퓨터의 현대적 지능 확장이다.
그 위에, 앞서 말씀드린 바와 같이, 애플리케이션은 에이전트 런타임으로 대체될 것이며, 현대 애플리케이션은 바로 에이전트가 될 것이다.
여러분, NVIDIA RTX 스파크 노트북입니다. 고맙습니다. 제 주머니에는 너무 많은 것이 들어 있습니다. 자, 이것은 세계에서 가장 놀라운 칩입니다. 이것은 우리가 미디어텍(MediaTek)과 공동 개발한 N1X입니다. 방금 릭(Rick)을 본 것 같네요. 이것이 N1X이며, 아름다운 칩입니다. 솔직히 말해, 이 칩을 만드는 데는 33년이 걸렸습니다.
그 이유는, NVIDIA의 100% 소프트웨어 스택이 여기서 실행될 수 있기 때문입니다. 당신이 디지털 생물학을 하고 싶다면 문제없고, 지진 처리를 하고 싶다면 문제없고, 천체물리학을 하고 싶다면 문제없습니다. CUDA와 관련된 모든 것, 모든 물리학·생물학·유전체학·AI, 그리고 모든 컴퓨터 그래픽도 문제없습니다.
엔비디아가 만들어온 모든 애플리케이션과 윈도우에서 실행된 모든 애플리케이션을 마이크로소프트와 엔비디아가 정밀하게 최적화하여, 이 컴퓨터가 세상이 만들어온 모든 것을 실제로 실행할 수 있도록 했습니다. 게다가 이제는 에이전트도 실행할 수 있습니다. 이것은 믿기지 않을 정도로 놀라운 컴퓨터이며, 저는 그것에 대해 매우 자랑스럽습니다.
이 컴퓨터는 로컬 네모트론 3 얼티메이트 모델 또는 네모트론 3 슈퍼 모델을 탑재할 수 있고, 클라우드의 클로드 코드·코덱스 또는 기타 모델과 연결할 수 있으며, 인터넷 상의 모델과도 연결할 수 있습니다. 이 컴퓨터는 작동하며 놀라운 일을 해낼 것입니다. RTX 스파크는 노트북의 재정의이지만, 사실상 마이크로소프트와 엔비디아는 전체 PC를 재정의하고 있습니다.
오늘, 우리는 완전히 새로운 제품 라인을 발표합니다: 데스크톱·노트북·워크스테이션을 아우르는 3가지 혁신적인 윈도우 기반 머신입니다. 이들은 100% 윈도우 호환, 100% CUDA 지원, 100% NVIDIA AI 텐서 코어 탑재입니다. 전 세계의 다양한 NVIDIA 플랫폼에서 실행 가능한 모든 것을 여기서 실행할 수 있습니다.
우리는 이를 위해 로드맵을 준비했습니다. 이것은 완전히 새로운 제품군입니다. 매 세대 아키텍처마다 데스크톱·노트북·워크스테이션이 있으며, 차세대에도 데스크톱·노트북·워크스테이션이 계속됩니다. 저는 전 세계 PC 산업의 100%가 우리와 함께 PC를 재정의하는 데 동참하게 된 것을 매우 기쁘게 생각하며, 이에 대해 큰 영광으로 여깁니다. 이것은 새로운 제품 라인이며, 새로운 시작입니다.
코스모스 3: 물리적 AI의 기반 모델
젠슨 황:
언어모델의 경우, 우리는 인터넷에서 수집한 영어 및 다양한 언어 데이터를 훈련에 사용하는데, 이는 모두 인간의 시각에서 출발한다. 그것들은 우리가 쓰고, 우리가 읽는 것이다. 그러나 AI 로봇을 위한 데이터를 창조하려면, 로봇의 감각과 시각에서 출발해야 한다. 세상의 대부분의 영상 데이터는 3인칭 시점이며, 1인칭 시점이 아니다.
따라서, 에이전트 시스템·로봇 시스템·물리적 AI의 경우, 데이터가 가장 어려운 문제다. 여러분은 우리가 이 계단을 따라 위로 올라가는 과정을 이미 보셨을 것이다. 우리는 원격 조작(Teleoperation)에서 시작했는데, 본질적으로 인간의 시범을 따르는 것이다. 이것은 강화학습에서 인간 피드백을 통한 돌파구와 다르지 않다. 이후 우리는 시뮬레이션을 사용했는데, 바로 여기서 옴니버스(Omniverse)가 역할을 한다. 이것은 강화학습에서 검증 가능한 보상과 유사하다.
우리는 이러한 시스템을 통해 AI 모델을 초기화하고, 물리적 AI 모델을 초기화한다. 결국 우리는 3인칭 시점에서 학습하고, 그것을 1인칭 시점으로 재투영할 수 있게 되었다. 이러한 초기화 과정을 통해, 우리는 물리적 세계를 어떤 시점에서든 이해할 수 있는 세계 기반 모델을 확보하게 되었다. 3인칭·1인칭·외부에서 내부로·내부에서 외부로—모두 가능하다. 이것은 정말 중대한 돌파구다.
오늘, 우리는 코스모스 3을 발표한다. 코스모스 3은 물리적 AI의 선도 기반 모델이다. 우리는 언어모델 분야에서도 선도적 위치에 있으며, 많은 사람들이 언어모델을 연구하고 있다. 그러나 물리적 AI 분야에서는 우리는 전 세계에서 확실히 최강이다. 팀이 이처럼 뛰어난 성과를 이뤄낸 것에 대해 나는 매우 자랑스럽다.
이것은 여러분의 모든 작업을 위한 기반 모델이다. 당신이 로봇을 만들고 싶든, 공장 로봇을 만들고 싶든, 공장에서 일하는 로봇을 만들고 싶든, 물리적 세계와 관련된 어떤 작업이든, 이제 당신에게 파트너가 있다: 코스모스 3. 그것은 이해하고 추론할 수 있으며, 생성할 수 있고, 폐루프 시뮬레이션을 수행할 수 있으며, 심지어 전략 자체가 될 수도 있다. 그것은 전 세계의 다양한 순위표에서 선두를 달리고 있다. 나는 코스모스에 대해 매우 자랑스럽다. 오늘, 우리는 코스모스 3을 발표한다.
과거에는 데이터 + 컴퓨팅 = AI였다. 이제 우리는 AI를 갖추었고, 컴퓨팅 자체도 데이터가 된다. 따라서, 코스모스 3을 사용해 수많은 AI 모델을 훈련시킬 수 있다. 코스모스는 매우 훌륭한 개방형 모델 시스템으로, 네모트론과 완전히 동일하다. 우리는 모델을 개방하고, 데이터를 개방하며, 심지어 훈련 방법까지 개방하여, 당신이 그것을 자신만의 전용 모델로 고도화할 수 있도록 한다. 코스모스를 당신만의 전용 모델로 만들 수 있다.
알파마요 2: 자율주행 차량을 위한 추론 모델
젠슨 황:
오늘, 우리는 자율주행 자동차를 위한 개방형 모델 알파마요 2를 발표한다. 우리는 전 세계 자동차 회사들과 협력하고 있다. 이미 NVIDIA 하이페리온(NVIDIA Hyperion)에 참여해 NVIDIA 하이페리온 자동차를 개발 중인 브랜드들을 보면, 이들은 전 세계 자동차의 약 80%를 대표한다. 즉, 이 제조사들은 전 세계 자동차의 약 80%를 차지한다.
향후에는 많은 NVIDIA 하이페리온 시스템이 등장할 것이며, 이 시스템들은 알파마요를 실행할 수 있고, 다른 어떤 자율주행 기술 스택도 실행할 수 있다. 우리는 또한 이동 서비스(Mobility Service)와도 연결되어 있다. 전 세계 이동 서비스의 약 97%가 우리와 연결되어 있다. 따라서 알파마요를 하이페리온 런타임 및 할로스(Halos) 운영체제에 배포할 때, 우리는 전 세계 이러한 서비스와 연결될 수 있다.
아이작 GR00T: 인간형 로봇
젠슨 황:
NVIDIA 아이작 GR00T는 우리 인간형 로봇 기술 스택으로, 모델·데이터 생성·시뮬레이션·런타임·운영체제를 포함한다. 이는 GR00T 플랫폼, 즉 아이작 GR00T 플랫폼을 대표한다.
여러분은 우리 각 시스템이 완전히 동일한 패턴을 따르는 것을 보실 수 있다: 클라우드 기반 에이전트 시스템이든, PC 기반 에이전트 시스템이든, 자율주행 자동차의 로봇 시스템이든, 인간형 로봇의 로봇 시스템이든, 모두 동일한 패턴이다.
물론, 각 사례에서 우리는 모든 것을 완전히 구축한다. 우리는 수직 통합을 하고, 철저한 통합을 하며, 공동 설계 및 극한의 공동 설계를 적용한 후, 이를 모두 개방하여 누구나 필요에 따라 그 일부를 사용할 수 있도록 한다. 당신이 무엇을 사용하고 싶은지, 우리는 심지어 그것을 수정하는 데까지 도와줄 것이다.
그러나 지금은 한 가지가 부족하다: 로봇 시스템은 참조 플랫폼(Reference Platform)이 필요하다. 이러한 로봇 시스템은 너무 복잡하고, 많은 모터와 센서를 포함하며, 매우 취약하다. 그러나 우리는 이러한 참조 플랫폼을 제공할 수 있는 방식이 필요하다. 우리가 PC·DGX·클라우드·자율주행 자동차를 위해 했던 것처럼, 이제 우리는 로봇을 위해 그것을 해야 한다.
오늘, 우리는 완전히 통합된 인간형 로봇 참조 플랫폼인 NVIDIA 아이작 GR00T를 발표한다. 이 로봇은 양손 각각 25개의 자유도를 가지며, 본체는 31개의 자유도를 가지며, 높이는 6피트, 무게는 150파운드이다. 저와 비슷하지만, 첫 번째 숫자는 제가 작고, 두 번째 숫자는 제가 크고, 나머지는 거의 같다.
이 플랫폼은 새로운 썬더(Thor)와 우리의 완전한 소프트웨어 스택·데이터 생성 스택·데이터 시뮬레이션 스택·런타임을 실행한다. 모든 것이 하나의 로봇 플랫폼에 통합되어 누구나 사용할 수 있다. 우리는 고등교육 및 대학 연구자들을 위해 이를 개발했는데, 그들에게는 스스로 이러한 플랫폼을 구축하는 것이 너무 어렵기 때문이다.
종합 정리
젠슨 황:
지난 6개월 동안, 컴퓨터 산업은 완전히 바뀌었다. 그 이유는 에이전트가 마침내 실현되었고, 최신 선도 모델과 결합되어 AI가 이제 실제로 유용한 일을 할 수 있게 되었기 때문이다.
이 컴퓨팅 패턴은 반복적으로 나타날 것이다: 에이전트는 모델과 프레임워크로 구성되며, 기능을 갖춘 툴을 사용하고, 어떤 런타임 위에서 실행된다. 런타임은 그것이 클라우드에서 실행되는지, 로컬 기업 환경에서 실행되는지, PC에서 실행되는지, 로봇에서 실행되는지에 따라 달라진다. 그러나 컴퓨팅 패턴은 완전히 동일하다.
당신은 자신의 선호에 따라 다른 프레임워크를 사용할 것이고, 다른 모델을 사용할 것이다. 당신은 자신만의 전용 목적에 맞게 그것들을 개선할 것이다. 당신은 슈퍼 에이전트를 창조하고, 그것을 다른 사람에게 임대하여 다른 사람이 일을 할 수 있도록 도울 것이다. 이러한 에이전트 플랫폼, 이러한 에이전트 패턴이 바로 NVIDIA 엔터프라이즈 AI 툴킷이 지원하려는 것이다. 여러분에게는 AI에 참여하는 훌륭한 방법이며, 우리에게는 거대한 성장 기회이다.
베라 루빈은 이미 전면 양산에 들어갔다. 그레이스 블랙웰은 AI, 특히 추론을 처리하기 위해 설계되었고, 베라 루빈은 에이전트 실행을 위해 설계되었다. 베라 루빈은 이미 전면 양산에 들어갔다. 그것은 단순한 GPU를 훨씬 넘어서는, 완전히 분리·분산된 에이전트 처리 시스템이다.
엔비디아는 이제 진정한 인프라 기업이 되었다. 단순한 GPU 기업도, 단순한 시스템 기업도 아닌, 인프라 기업이다. 우리의 목표는 여러분이 최대의 수익과 최대의 이익을 가능한 한 빨리 창출할 수 있도록 돕는 것이다.
에이전트 세상에서, 이러한 새로운 컴퓨팅 방식은 CPU도 인간이 아니라 에이전트를 위해 설계되어야 함을 의미한다. 에이전트를 위한 CPU는 자체 특수 요구사항을 갖는다. 우리의 NVIDIA 베라는 혁명이다. 저는 베라의 양산 증가 및 주문 상황을 매우 기쁘게 보고 있으며, 이는 엔비디아 역사상 가장 빠르고 가장 성공적인 제품 출시가 될 것이다.
NVIDIA와 마이크로소프트는 완전히 새로운 PC 제품 라인을 창조했다. 이것은 새로운 시작이다. 물론, 제가 방금 설명한 동일한 에이전트 기반 처리 모델·에이전트 기반 컴퓨팅 모델은 다양한 기기에서 실행될 것이다. 저는 PC를 언급했지만, 향후 그것은 로봇·위성·기지국·공장·클라우드·로컬·엣지 장치 등으로 확산될 것이다. 이러한 에이전트 기반 AI 시스템과 에이전트 기반 컴퓨팅 모델은 다양한 컴퓨터에서 끊임없이 복제될 것이다. 우리가 PC를 이해하는 방식은 아마도 크게 바뀔 것이다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News













