‘추론 AI 시대’... 엔비디아의 세 가지 초격차 전략

reporter-profile
박원익 2025.03.18 21:54 PDT
‘추론 AI 시대’... 엔비디아의 세 가지 초격차 전략
젠슨 황 엔비디아 CEO가 18일 GTC 2025에서 기조연설을 하고 있다. (출처 : 더밀크 박원익)

GTC 2025 젠슨 황 기조연설
추론 컴퓨팅 수요 폭발 전망... 강력한 성능 ‘베라 루빈’ GPU 공개
①2028년 출시 예정 ‘파인만’ 아키텍처까지... 장기 로드맵 제시
②제품 포트폴리오 다양화... 포토닉스 스위치·DGX 스파크
③추론 소프트웨어·로봇 파운데이션 모델로 소프트웨어 생태계 확장

젠슨 황 엔비디아 CEO는 18일(현지시각) 엔비디아 연례 컨퍼런스 GTC 2025 기조연설에서 “훨씬 빠른, 강력한 계산 능력이 필요해지고 있다”며 이같이 말했다. 

AI 모델을 개발에 필요한 훈련(Training)에서 AI 모델 활용 영역인 추론으로 산업의 무게 중심이 이동함에 따라 더 강력한 AI 반도체가 필요하다는 점을 강조한 것이다. 

이는 오픈AI가 o1 모델 출시 이후 부상한 ‘추론 시간 계산(Inference-time compute or test-time compute)’ 확장 흐름과 궤를 같이한다. 더 많은 추론 시간, 즉 컴퓨팅 파워를 사용해 AI 성능을 개선하는 방식이 새로운 ‘확장 법칙(scaling law)’으로 자리잡고 있는 것이다. 

AI 컴퓨팅 수요 급증은 엔비디아의 고성능 칩 성장세를 유지하는 배경 중 하나다. 엔비디아에 따르면 AWS, 마이크로소프트, 구글 등 상위 네 개 클라우드 서비스 업체가 구매한 엔비디아 GPU(호퍼 아키텍처, H100 등)가 2024년 130만 개에서 2025년 현재 360만 개(블랙웰 아키텍처, 칩당 2개 GPU로 계산)로 3배가량 늘었다. 황 CEO는 이를 “1조 달러 규모의 컴퓨팅 변곡점”이라고 표현했다. 

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.