Nvidia는 OpenAI와 AI 에이전트를 위한 Groq 기술 기반 칩을 개발하며 추론 전쟁에 대비하고 있습니다

Nvidia는 OpenAI와 AI 에이전트를 위한 Groq 기술 기반 칩을 개발하며 추론 전쟁에 대비하고 있습니다

13 hardware

새로운 Nvidia 칩 – 더 빠른 AI 애플리케이션을 향한 한 걸음

Nvidia는 3월에 인퍼런스(이미 학습된 모델의 계산)를 가속화하도록 특별히 설계되고 OpenAI와 같은 고객을 겨냥한 새로운 프로세서를 공개할 계획이다. 이는 이전에는 주로 AI 시스템 교육에 집중했던 회사가 방향을 바꾸는 것이다.

무엇이 등장하는가
- 새 플랫폼은 GTC(그래픽스 기술 컨퍼런스) 개발자 회의에서 발표될 예정이다.
- 플랫폼 코어에는 인퍼런스를 위한 가장 빠른 솔루션 중 하나인 스타트업 Groq의 칩이 포함된다.
- 이 플랫폼은 이미 상당한 성과를 거둔 Google과 Amazon의 자체 가속기와 경쟁해야 한다.

왜 중요한가
'웨이브코딩'(텍스트로부터 AI 코드 생성)의 인기가 높아짐에 따라 빠르고 에너지 효율적인 인프라 수요가 증가하고 있다.
OpenAI에게 새 프로세서는 핵심 요소가 된다:
- 1월, 회사는 Cerebras와 인퍼런스 전용 칩에 대한 계약을 체결했으며, 그들은 이 칩이 경쟁사보다 빠르다고 평가한다.
- OpenAI는 Nvidia와의 대규모 거래를 발표했고, 이를 통해 '인퍼런스를 위한 전용 용량'을 확보하고 '녹색' 제조업체로부터 300억 달러를 투자했다.

경쟁 환경
| 회사 | 제품 | 초점 |
|---|---|---|
| Nvidia | Hopper, Blackwell, Rubin GPU 시리즈 | 교육 및 인퍼런스 |
| Google | TPU | 인퍼런스 |
| Amazon | Trainium | 인퍼런스 |
| Cerebras | 전문 칩 | 인퍼런스 |
| Groq | 언어 처리 블록이 포함된 칩 | 인퍼런스 |

Nvidia는 GPU 시장에서 90% 이상을 차지하지만, 그들의 칩은 종종 인퍼런스 작업에 비해 비싸고 에너지 소모가 크다. 이는 대안 찾는 기업의 관심을 끌고 있다.

핵심 애플리케이션
- 코드 생성: Claude Code(Anthropic)와 Codex(OpenAI)는 Amazon과 Google 클라우드 인프라를 사용하지만, Codex는 새로운 Nvidia 플랫폼으로 전환할 계획이다.
- 광고 타깃팅: Meta는 AI 시스템 인퍼런스를 위해 Nvidia와 협력하고 있으며, 이때 중앙 프로세서가 가장 효율적이다.

결론
Nvidia는 제품 라인업을 확장하는 동시에 산업 거인들과 직접 경쟁에 뛰어든다. Groq 스타트업과 통합된 새 칩은 AI 모델을 더 빠르고 경제적으로 처리하려는 기업에게 결정적인 요소가 될 수 있다

댓글 (0)

의견을 남겨 주세요. 예의를 지키고 주제에서 벗어나지 말아 주세요.

아직 댓글이 없습니다. 댓글을 남기고 의견을 공유해 주세요!

댓글을 남기려면 로그인해 주세요.

댓글을 남기려면 로그인