본문 바로가기
IT모든것/IT소식

엔비디아 블랙웰 GPU B200 H100 AI 모델 성능 칩

by godmulzu 2024. 4. 5.
반응형

 

 

엔비디아가 새롭게 선보인 블랙웰 B200 GPU는 AI와 컴퓨팅의 새로운 지평을 열 예정입니다. 

이 칩은 2080억 개의 트랜지스터를 탑재하고 있으며, TSMC의 4NP 공정을 통해 제조되었습니다.

 

블랙웰은 최대 10조 개의 파라미터를 지원하는 AI 모델을 구동할 수 있으며,

이는 기존 모델들을 크게 뛰어넘는 성능을 의미합니다.

젠슨 황 CEO는 블랙웰을 "세계에서 가장 강력한 칩"이라고 평가하며,

모든 산업에서 AI를 구현시키는 데 있어 중요한 역할을 할 것이라고 강조했습니다

경쟁사와 비교

엔비디아 블랙웰 B200 GPU는 이전 세대인 호퍼 H100에 비해 AI 훈련 성능이 4배 향상되었으며,

추론 성능은 30배 증가했습니다. 이는 경쟁사의 제품들과 비교했을 때 상당한 성능 향상을 의미합니다.

블랙웰은 두 개의 칩이 10TB/s NV-HBI 연결을 통해 하나의 CUDA GPU로 기능하도록 설계되었습니다.

스펙 현황

블랙웰 아키텍처 GPU는 2080억 개의 트랜지스터를 포함하고 TSMC의 4NP 공정을 사용하여 제조됩니다.

단일 GPU에서 20 페타플롭스의 AI 성능을 제공하며,

192GB의 HBM3 e 메모리를 탑재하여 8TB/s의 대역폭을 제공합니다.

엔비디아 GPU 비교

특징 블랙웰 B200 호퍼 H100
트랜지스터 수 2080억 개 800억 개 (블랙웰의 약 40%)
AI 성능 단일 GPU에서 20 페타플롭스 최대 4 페타플롭스
메모리 192GB HBM3 e, 8TB/s 대역폭 정보 미제공
제조 공정 TSMC의 4NP 공정 TSMC의 4N 공정
특징 두 개의 칩이 10TB/s NV-HBI 연결 -

 

가격 측정

엔비디아의 블랙웰 B200 AI GPU는 대략 $30,000에서 $40,000 사이의 가격으로 책정되어 있습니다.

블랙웰의 연구개발에는 약 100억 달러가 투입되었다고 합니다.

이는 세계 최고의 AI GPU 기술을 제공하기 위한 엔비디아의 대규모 투자를 반영하는 것입니다.

공정 방법

엔비디아의 블랙웰 GPU는 맞춤형 TSMC 4NP 공정을 사용하여 제조됩니다.

이 공정은 2080억 개의 트랜지스터를 포함하는 두 개의
리티클 제한 다이를 10TB/s의 칩 간 연결로 하나의 단일 GPU로 통합합니다.

블랙웰은 NVIDIA® NVLink®를 통해 강력한 하드웨어 기반 보안으로

민감한 데이터와 AI 모델을 보호하는 NVIDIA Confidential Computing을 포함합니다.

향후 전망 및 AI 사업과 LLM의 접목

엔비디아는 블랙웰 플랫폼을 통해 실시간 생성 AI를 트릴리언-파라미터 

규모의 대규모 언어 모델(LLM)에서 실행할 수 있게 하여, 

이전 세대 대비 최대 25배 낮은 비용과 에너지 소비로 운영할 수 있습니다. 

이는 AI와 컴퓨팅의 새로운 시대를 여는 것으로, 다양한 분야에서 혁신을 가능하게 할 것입니다.

 

반응형