“AI 잠재력에서 실질 가치로”… 넥스트 25, 놓치지 말아야 할 10가지

reporter-profile
박원익 2025.04.18 23:07 PDT
“AI 잠재력에서 실질 가치로”… 넥스트 25, 놓치지 말아야 할 10가지
라스베이거스 만달레이 베이 컨벤션 센터에서 진행된 ‘구글 클라우드 넥스트 2025’ 기조연설 현장 (출처 : Google)

[구글 클라우드 넥스트 2025]
인프라부터 에이전트, 모든 것 제공한다… 6대 핵심 발표
넥스트 25에서 발견한 새로운 사실 4가지 & 트렌드

“지난해는 생성형 AI의 잠재력을 탐구했다면 올해는 구글의 AI를 통해 고객이 실질적인 가치를 얻을 수 있는 방법을 소개했습니다.”

앨리슨 왜건펠드(Alison Wagonfeld) 구글 클라우드 마케팅 부사장은 “많은 참석자들이 구글의 AI 혁신, 데이터 클라우드, 최신 인프라, 보안, 구글 워크스페이스(Google Workspace, 지메일, 구글 미트, 구글 독스 등을 포함한 업무용 도구)를 체험할 수 있었다”며 이같이 밝혔다. 

구글의 연례 클라우드 컨퍼런스 ‘구글 클라우드 넥스트 2025(Google Cloud Next 25)’가 생성형 AI의 가능성을 탐구하는 것에서 고객에게 실질적 가치를 제시하는 방향으로 진화했다는 주장이다. 구글은 4월 9일부터 11일(현지시각) 펼쳐진 이번 행사에서 총 229개의 새로운 발표를 쏟아내며 AI 강자로서의 면모를 과시했다.

라스베이거스 만달레이 베이 컨벤션 센터에서 진행된 구글 클라우드 넥스트 2025. 토마스 쿠리안 CEO가 기조연설을 하고 있다. (출처 : Google)

특히 올해는 구글의 자체 AI 칩인 차세대 TPU의 놀라운 성능, 클라우드 광역 네트워크(Cloud WAN) 등 하드웨어 인프라를 강조했다는 점이 돋보였다. 구글의 고성능 TPU와 구글 딥마인드의 개발한 강력한 자체 AI 모델은 구글 클라우드의 최대 강점 중 하나로 평가된다. 자체 하드웨어 인프라와 AI 모델을 기반으로 급증하는 추론 AI 수요에도 안정적인 서비스를 제공할 수 있기 때문이다. 

AI 에이전트(agent, 대리인)를 위한 새로운 프로토콜(protocol, 통신 규약)을 만들고, 더 쉽게 에이전트를 개발, 통합, 활용할 수 있는 환경을 제시한 대목도 주목할 만하다. 에이전트는 AI 기술 및 애플리케이션 활용 면에서 가장 빠르게 성장 중인 영역이다. 

10회 이상의 기조연설 및 스포트라이트 세션, 700개 넘는 일반 세션과 350개 이상의 파트너가 참여한 전시를 통해 소개된 구글의 제품 업그레이드, 새로운 발표 중 가장 큰 관심을 받은 10가지를 정리했다.

TPU 세대 별 전력 효율 개선 그래프 (출처 : Google)

인프라부터 에이전트, 모든 것 제공한다… 6대 핵심 발표

1. 새로운 인프라 = 추론 시대 더 나은 성능

구글은 이번 클라우드 넥스트 25에서 AI를 구동하는 엔진인 ‘AI 하이퍼컴퓨터’ 아키텍처를 대폭 업그레이드했다. 성능, 효율성, 비용 효율성을 개선했다는 게 구글 측 설명이다. 이는 구글이 경량 AI 모델 제미나이 2.0 플래시(Gemini 2.0 Flash)로 강조한 ‘달러당 더 많은 인텔리전스(intelligence, 지능)’를 제공할 수 있음을 의미한다. 

머신러닝(ML) 워크로드를 가속화하도록 설계된 7세대 AI 칩인 아이언우드(Ironwood) TPU가 대표적이다. 아이언우드 TPU는 전작인 6세대 TPU ‘트릴리움(Trillium)’ 대비 성능이 10배 개선됐다. 전력 효율 면에서도 아이언우드는 전작 대비 2배 높은 와트당 성능을 갖췄다. 

2. 버텍스 AI, 모든 모달리티(modality)로 확장

구글 클라우드가 제공하는 AI 모델 및 애플리케이션 개발·배포 플랫폼 ‘버텍스 AI(Vertex AI)’의 확장도 중요한 발표였다. 구글 딥마인드가 개발한 고성능 자체 AI 모델이 확장되며 사용자의 선택지가 넓어진 것이다. 

특히 텍스트-음악 변환 AI 모델인 ‘리리아(Lyria)’가 프리뷰(preview, 미리보기)로 추가되며 텍스트, 이미지, 영상, 음성, 음악 등 모든 모달리티(modality, 데이터 유형)를 커버할 수 있게 됐다. 최신 영상 모델인 ‘비오2(Veo 2)’는 고급 편집 기능(인페인팅, 아웃페인팅, 인터폴레이션)과 카메라 컨트롤을 제공하며 음성 모델 ‘처프3(Chirp 3)’는 10초의 음성으로 즉시 사용자 지정 음성을 생성하는 기능, 향상된 다중 화자 트랜스크립션(transcription, 전사) 기능을 제공한다. 이미지 생성 모델 ‘이마젠3(Imagen 3)’에서는 고품질 생성 및 개체 제거 같은 향상된 편집 기능을 사용할 수 있다. 자체 AI 모델에 워터마킹 기능인 ‘신스ID(SynthID)’를 탑재, 저작권 침해 혹은 안전 이슈를 예방할 수 있다는 점도 구글만의 장점이다.  

3. AI 에이전트의 전문화… 자동화 본격화

AI 에이전트는 점점 더 전문화되고 있으며 많은 기업이 적극적으로 도입하는 추세다. 구글은 일찌감치 분야별 AI 에이전트 구축 솔루션을 제공해 왔다. 버텍스 AI 플랫폼에서 고객 상담용으로 구축할 수 있는 고객 에이전트의 경우 현재 로우스(Lowe's), 웬디스(Wendy's)의 솔루션을 지원하고 있으며 데이터 에이전트는 웨이페어(Wayfair)와 AES가 활용 중이다. 코드 생성용 에이전트인 코드 에이전트는 구글의 내부 개발자 생산성을 높여주고 있다. 

이번 클라우드 넥스트에서는 에이전트 기반 사용자 인터페이스인 ‘에이전트 스페이스(Agent Space)’ 시연 및 업데이트도 발표했다. 에이전트 스페이스를 활용하면 구글 검색, 구글 AI 모델, AI 에이전트를 함께 활용해 사용자가 효율적으로 작업할 수 있다.

맞춤형 AI 에이전트를 구축할 수 있는 ‘구글 에이전트 스페이스’ (출처 : Google)

4. 멀티 에이전트 시대, A2A로 준비하라

60여 개에 달하는 업계 파트너와 협력해 A2A(에이전트2에이전트) 프로토콜을 도입한 것도 중요한 행보였다. 에이전트와 에이전트가 소통할 수 있는 최초의 개방형 표준을 통해 여러 공급업체 또는 서로 다른 프레임워크에서 구축된 AI 에이전트가 안전하게 통신하고 정보를 교환하며 작업을 조율할 수 있게 될 전망이다.

구글은 A2A와 함께 새로운 에이전트 개발 키트(ADK), 에이전트 샘플을 제공하는 에이전트 가든(Agent Garden)도 새롭게 발표, 에이전트 생태계를 더욱 강화했다. 

5. 클라우드 WAN, 전 세계 커버하는 구글의 인프라를 고객에게

모든 기업과 정부 기관이 구글의 고속, 저지연 사설 네트워크 ‘클라우드 WAN’를 사용할 수 있게 됐다는 점도 흥미로운 대목이다. 지메일, 사진, 검색 등 20억 명 이상의 사용자를 가진 서비스를 지연 없이 제공하려면 강력한 네트워크 인프라가 필요하며 이를 위해 구글은 200개 이상의 국가와 지역에 걸쳐 200만 마일이 넘는 광섬유 네트워크를 구축했다. 이를 구글 클라우드 사용 기업에 개방한다고 밝힌 것이다. 

구글에 따르면 클라우드 WAN 사용 시 네트워크 성능이 40% 개선되며 이로 인해 총 소유비용(total cost of ownership) 역시 40%까지 줄일 수 있다. 

6. 보안은 새로운 힘… 통합 솔루션 제공

구글은 이와 함께 위협 인텔리전스, 보안 운영, 클라우드 보안 및 안전한 엔터프라이즈 브라우징 기능을 모두 제미나이 AI로 구동할 수 있는 통합 솔루션 ‘구글 유니파이드 시큐리티(Google Unified Security)’를 발표했다. 

이 솔루션에는 사용자를 대신해 동적 조사를 수행하는 경고 분류 에이전트, 코드가 안전한지 유해한지 조사하는 멀웨어 분석 에이전트 같은 제미나이 기반 보안 에이전트가 포함된다. 더 강력한 보안 성능을 제공해 제공해 AI 기술 및 도구 활용을 안전하게 만든다는 목표다.

제프 딘 구글 수석 과학자가 11일 세바스찬 무가잠비 구글 클라우드 시니어 프로덕트 매니저와 인사를 나누고 있다. (출처 : 더밀크 박원익)

넥스트 25에서 발견한 새로운 사실 4가지 & 트렌드

이번 구글 클라우드 넥스트 2025 행사를 통해 공개된 새로운 사실도 적지 않았다. 구글이 첨단 기술 연구 및 개발을 거치는 과정에서 포착한 정보들을 통해 향후 AI 업계 트렌드를 예측해 볼 수 있었다. 

1. 최근 1년, 시간당 TPU 칩 사용량 8배 늘었다

제프 딘 구글 수석 과학자는 11일 세바스찬 무가잠비 구글 클라우드 시니어 프로덕트 매니저와 진행한 세션에서 “AI 추론 모델의 등장으로 컴퓨팅 수요가 증가할 것”이라며 “이런 수요에 대응하기 위해 AI 칩 설계 소요 시간을 줄이는 게 과제”라고 강조했다. 

구글이 더 강력한 성능의 칩을 더 빨리 개발하기 위해 집중할 것이라는 힌트를 던진 셈이다. 실제로 구글의 7세대 TPU인 아이언우드의 성능은 첫 번째 클라우드 TPU의 3600배에 달할 정도로 성능이 기하급수적으로 개선되는 추세다. 

무가잠비 프로덕트 매니저가 이날 공개한 바에 따르면 최근 1년 사이 구글 클라우드에서 시간당 TPU 칩 사용량은 8배 급증, 추론 수요의 폭발적 증가세를 보여줬다.

TPU 스펙 비교 (출처 : Google)

2. 추론 AI 시대, HBM 더 많이 필요해

추론 AI의 확산은 필수적으로 더 강력한 메모리 성능을 요구한다. 연산량 자체가 늘어나고 있고, 사용자들은 빠른 답변을 얻길 원하므로 더 많은 HBM(고대역폭 메모리), 더 성능이 개선된 HBM이 필요하다. 

실제로 아이언우드의 경우 HBM 용량이 크게 늘어 6세대 TPU인 트릴리움의 6배인 칩당 192GB를 제공한다. 더 큰 모델과 데이터세트를 처리할 수 있어 잦은 데이터 전송의 필요성을 줄이고, 성능이 개선된 것이다. SK하이닉스, 삼성전자 등 첨단 HBM을 제조하는 국내 반도체 업체들에도 기회가 더 생길 전망이다.   

3. ‘수직 전력 공급’ VPD의 과학 

구글이 최근 각광받고 있는 VPD(Vertical Power Delivery, 수직 전력 공급) 기술 적용으로 에너지 효율화를 달성했다는 점도 눈에 띄는 대목이다. 

VPD는 전원 모듈을 CPU나 GPU 바로 아래에 적층해 수직으로 전력을 공급하는 방식이다. 전력 전달 과정에서의 손실을 최소화할 수 있다는 장점이 있다. 전력을 보다 짧고 효율적인 경로로 전달함으로써 고성능 컴퓨팅 환경에 적합한 구조를 갖출 수 있는 것이다.

세바스찬 무가잠비 구글 클라우드 시니어 프로덕트 매니저는 “TPU 설계를 바꿔 효율적인 수직 전력 공급 방식을 활용하고 있다”며 “수직 전력 기술을 적용해 전력 손실을 70% 줄였다”고 밝혔다.

세바스찬 무가잠비 구글 클라우드 시니어 프로덕트 매니저가 TPU 아키텍처에 적용된 VPD에 대해 설명하고 있다. (출처 : 더밀크 박원익)

4. 구글과 엔비디아가 협업하는 방법… 분산 클라우드

최첨단 AI 모델을 활용할 수 있는 분산 클라우드 구축도 새로운 트렌드가 될 수 있을 전망이다. 보안, 규제, 소버린(Sovereign, 주권) AI 추구 등의 이유로 퍼블릭 클라우드가 아니라 자체 관리하는 데이터 센터(On-premise, 온프레미스)를 활용하려는 기업, 조직이 늘고 있기 때문이다.  

구글은 이런 기업 고객을 위해 엔비디아, 델 같은 파트너와 손잡고 구글 분산 클라우드(GDC)를 제공, 구글의 최첨단 제미나이 모델을 온프레미스로 서비스할 수 있다고 발표했다. 

엔비디아의 첨단 GPU 블랙웰 칩과 구글의 보안, 분산 클라우드 기술이 접목된 새로운 솔루션이다. 젠슨 황 엔비디아 CEO는 구글 클라우드 넥스트 2025 기조연설에 영상으로 등장해 “모든 회사, 모든 국가가 AI를 활용하고 싶어 하지만, 근본적으로 기밀과 보안이 보장돼야 한다”며 “구글 분산 클라우드는 전 세계 규제 대상 산업과 국가에 최첨단 AI를 제공한다”고 했다.

구글 클라우드 넥스트 2025 현장에 전시된 랙에 토마스 쿠리안 구글 클라우드 CEO의 서명, 젠슨 황 엔비디아 CEO의 서명이 쓰여 있다. (출처 : 더밀크 박원익)
이 기사와 관련있는 기사 현재 기사와 관련된 기사들 입니다.