Nvidia는 OpenAI와 AI 에이전트를 위한 Groq 기술 기반 칩을 개발하며 추론 전쟁에 대비하고 있습니다
새로운 Nvidia 칩 – 더 빠른 AI 애플리케이션을 향한 한 걸음
Nvidia는 3월에 인퍼런스(이미 학습된 모델의 계산)를 가속화하도록 특별히 설계되고 OpenAI와 같은 고객을 겨냥한 새로운 프로세서를 공개할 계획이다. 이는 이전에는 주로 AI 시스템 교육에 집중했던 회사가 방향을 바꾸는 것이다.
무엇이 등장하는가
- 새 플랫폼은 GTC(그래픽스 기술 컨퍼런스) 개발자 회의에서 발표될 예정이다.
- 플랫폼 코어에는 인퍼런스를 위한 가장 빠른 솔루션 중 하나인 스타트업 Groq의 칩이 포함된다.
- 이 플랫폼은 이미 상당한 성과를 거둔 Google과 Amazon의 자체 가속기와 경쟁해야 한다.
왜 중요한가
'웨이브코딩'(텍스트로부터 AI 코드 생성)의 인기가 높아짐에 따라 빠르고 에너지 효율적인 인프라 수요가 증가하고 있다.
OpenAI에게 새 프로세서는 핵심 요소가 된다:
- 1월, 회사는 Cerebras와 인퍼런스 전용 칩에 대한 계약을 체결했으며, 그들은 이 칩이 경쟁사보다 빠르다고 평가한다.
- OpenAI는 Nvidia와의 대규모 거래를 발표했고, 이를 통해 '인퍼런스를 위한 전용 용량'을 확보하고 '녹색' 제조업체로부터 300억 달러를 투자했다.
경쟁 환경
| 회사 | 제품 | 초점 |
|---|---|---|
| Nvidia | Hopper, Blackwell, Rubin GPU 시리즈 | 교육 및 인퍼런스 |
| Google | TPU | 인퍼런스 |
| Amazon | Trainium | 인퍼런스 |
| Cerebras | 전문 칩 | 인퍼런스 |
| Groq | 언어 처리 블록이 포함된 칩 | 인퍼런스 |
Nvidia는 GPU 시장에서 90% 이상을 차지하지만, 그들의 칩은 종종 인퍼런스 작업에 비해 비싸고 에너지 소모가 크다. 이는 대안 찾는 기업의 관심을 끌고 있다.
핵심 애플리케이션
- 코드 생성: Claude Code(Anthropic)와 Codex(OpenAI)는 Amazon과 Google 클라우드 인프라를 사용하지만, Codex는 새로운 Nvidia 플랫폼으로 전환할 계획이다.
- 광고 타깃팅: Meta는 AI 시스템 인퍼런스를 위해 Nvidia와 협력하고 있으며, 이때 중앙 프로세서가 가장 효율적이다.
결론
Nvidia는 제품 라인업을 확장하는 동시에 산업 거인들과 직접 경쟁에 뛰어든다. Groq 스타트업과 통합된 새 칩은 AI 모델을 더 빠르고 경제적으로 처리하려는 기업에게 결정적인 요소가 될 수 있다
댓글 (0)
의견을 남겨 주세요. 예의를 지키고 주제에서 벗어나지 말아 주세요.
댓글을 남기려면 로그인