생성AI 폰 시대가 왔다… 구글 픽셀8로 본 HW의 미래

reporter-profile
박원익 2023.10.05 20:30 PDT
생성AI 폰 시대가 왔다… 구글 픽셀8로 본 HW의 미래
플로리안 코닉스버거 구글 이미지 에쿼티 총괄이 AI 기반 사진 보정 기능 ‘베스트 테이크’에 관해 설명하고 있다. (출처 : 더밀크 박원익)

[구글 픽셀8 뉴욕 현장 발표] 하드웨어의 새 시대
최고의 컷 ‘베스트 테이크’ 체험… ‘메이드 바이 구글’ 현장
구글, 픽셀8 프로 출시... 구글 생성형 AI 모델 탑재된 첫 하드웨어
오디오 AI도 주목… 오디오 매직 이레이저·콜스크린 큰 호응
나 대신 일하는 AI 에이전트 … 스마트폰을 사용하는 방식 바뀐다

여러 명이 함께 사진을 찍으면 늘 이런 일이 생기죠? 친구는 잘 나왔는데, 내 표정은 마음에 들지 않는 상황. 이 기능을 사용하면 해결할 수 있습니다.
플로리안 코닉스버거(Florian Koenigsberger) 구글 이미지 에쿼티 총괄

사진작가이자 디지털 이미지 전문가인 플로리안 코닉스버거(Florian Koenigsberger) 구글 이미지 에쿼티 총괄은 4일(현지시각) 오후 더밀크와 만나 “AI(인공지능), 머신러닝(ML, 기계학습) 기술로 모두가 좋아하는 최고의 사진을 가질 수 있게 됐다”며 이같이 말했다. 

최고의 컷 ‘베스트 테이크’ 체험… ‘메이드 바이 구글’ 현장

구글 뉴욕 오피스 ‘피어57(Pier 57)’에서 진행된 이날 시연은 구글의 새로운 스마트폰 ‘픽셀8(Pixel 8)’ 시리즈 발표와 함께 이뤄졌다. 구글의 최신 스마트폰, 스마트워치, 무선 이어폰으로 경험할 수 있는 새로운 AI 기능을 설명하기 위해 전문가들이 나선 것이다. 

현장에서 본 구글 픽셀8은 전작인 픽셀7과 기능과 성능에서 크게 진보한 것은 없어 보였다. 하지만 애플 아이폰이나 삼성 갤럭시와 비교할 때 확실히 다른 게 있었다. 바로 생성AI 기능이 본격적으로 적용된 첫 하드웨어 기기라는 점이었다.

릭 오스텔로(Rick Osterloh) 구글 기기 및 서비스 담당 수석 부사장도 현장에서 "구글 픽셀8 프로는 기기 내(on-device)에서 구글의 생성형 AI 모델을 실행하는 최초의 하드웨어"라고 의미부여했다. 픽셀8 프로를 시작으로 생성 AI 하드웨어 시대가 본격적으로 열리게 된 셈이다. 

구글은 이날 개최한 하드웨어 제품 발표 행사 ‘메이드 바이 구글(Made by Google)’에서 픽셀8, 픽셀8 프로뿐 아니라 최신 스마트워치인 픽셀 워치2, 픽셀 버즈 프로 업데이트 등을 공개했다. 모든 하드웨어의 가장 중요한 기능이 머신러닝 및 생성AI로 귀결된다는 점이 이날 행사의 가장 큰 특징이었다. 

텐서 G3 칩 (출처 : Google)

픽셀8 프로, 구글 생성AI 모델 탑재된 첫 하드웨어

플로리안 코닉스버거(Florian Koenigsberger) 구글 이미지 에쿼티 총괄이 소개한 생성AI 기술은 ‘베스트 테이크(Best Take)’라는 신기능이었다.

픽셀8이나 픽셀8 프로를 이용해 단체 사진을 찍을 때 여러 장의 사진을 연달아 촬영하면 AI가 각 인물의 얼굴을 인식, 모두가 가장 잘 나온 최고의 사진을 합성해 제시해 준다. 

스마트폰 내에서 작동하는 얼굴 인식 ML 알고리듬을 활용해 얼굴을 바꿔끼는 방식이다. 픽셀이 제시한 ‘베스트 테이크’가 맘에 들지 않으면 사용자가 직접 수정할 수도 있다. 

실제 현장에서 모델을 촬영한 결과물을 확인해 봤는데, 조합된 이미지라는 걸 전혀 알아챌 수 없었다. 생성형 AI로 없던 것을 만들어 내는 게 아니라 실제 찍힌 사진을 활용하기 때문에 거부감, 이질감이 들지 않았다. 

픽셀8 프로에는 AI 작업을 원활하게 수행할 수 있는 칩 ‘텐서 G3’가 탑재됐다. 여기에 경량화한 구글의 텍스트, 이미지 생성 모델이 적용돼 스마트폰에서도 생성형 AI의 놀라운 기능을 활용할 수 있게 했다. 

‘매직 이레이저(Magic Eraser)’ 성능 개선이 대표적인 예다. 매직 이레이저는 불필요하게 찍힌 물체와 사람을 간편하게 삭제하는 사진 보정 및 후처리 도구인데, 픽셀8 프로에 탑재된 생성형 AI 모델 덕분에 더 좋은 결과물을 낼 수 있게 됐다. 

매직 이레이저는 사진에서 제거된 공간을 채우기 위해 새로운 이미지 픽셀을 생성하는 방식으로 작동한다. 이 과정에서 생성형 AI가 픽셀 생성을 도와 최종 결과물의 품질을 개선되는 것이다.

오스텔로 부사장은 픽셀 음성 녹음 앱이 회의 핵심 내용을 요약해주는 ‘녹음 요약’ 기능도 제공한다고 예고했다. 픽셀 스마트폰에 탑재돼 있는 키보드 ‘지보드(Gboard)’의 성능도 개선된다. 단어 자동 수정 기능을 넘어 높은 품질의 답장 제안을 생성하는 식이다. 피사체의 위치를 마음대로 바꿀 수 있는 매직 에디터도 적용됐다. 

생성형 AI 기술로 사진을 확대하는 ‘줌 인핸스(Zoom Enhance)’도 추후 적용될 예정이다. 구글은 오는 12월 업데이트를 통해 다른 생성형 AI 기능들을 제공할 계획이라고 밝혔다.

제이슨 브랜드너 구글 ‘바드(Bard)’ 및 어시스턴트 제품 전략 및 운영 총괄이 콜스크린을 비롯한 콜어시스트 기능을 설명하고 있다. (출처 : 더밀크 박원익)

오디오 AI도 주목… 오디오 매직 이레이저·콜스크린

오디오 AI 기능도 현장 시연에서 큰 호응을 얻었다. AI 기술 기반의 새로운 활용 사례를 제시해 줬기 때문이다. 

‘오디오 매직 이레이저(Audio Magic Eraser)’는 동영상에서 불필요하고 원치 않는 특정 소리를 제거할 수 있는 기능이다. 고성능 머신러닝 모델을 사용해 바람 소리 같은 소리를 쉽게 줄일 수 있다. 

말소리(Speech), 군중의 웅성거림(Crowd), 소음(Noise), 바람, 음악 등을 선택, 해당 사운드를 식별해 제거하는 방식이다. 예를 들어 뒤에서 시끄러운 웅성거림이 들리는 영상이라면 ‘군중’을, 개 짖는 소리가 들리면 소음을 누르면 된다. 

‘콜스크린(Call Screen, 전화 가려 받기)’ 시연도 화제였다. 걸려 온 전화를 직접 받지 않고 AI가 받게 해 나 대신 상대방과 간단한 통화를 이어가게 할 수 있다. 구글 측은 이 기능으로 픽셀8 사용자가 스팸 전화를 50% 덜 받게 될 것이라고 강조했다. 

실제 기능 시연을 체험해 보니 사람이라고 착각할 수 있을 정도의 자연스러운 목소리가 들려왔다. 물론 이 AI 통화 도우미는 스마트폰 소유자 대신 전화를 받고 있다는 사실을 고지한다. 수신자는 AI가 이어갈 대화 내용을 텍스트로 확인하며 어떤 대답을 할지 결정할 수 있다. 

예컨대 병원 예약 확인 전화 같은 간단한 통화의 경우 직접 대화하지 않고 AI에 맡길 수 있는 것이다. 시연을 맡은 제이슨 브랜드너 구글 ‘바드(Bard)’ 및 어시스턴트 제품 전략 및 운영 총괄은 “회의 도중 불가피하게 전화를 받지 못할 때, 택배 기사와의 간단한 통화 등에도 활용할 수 있다”고 했다.

더밀크의 시각: 스마트폰을 사용하는 방식이 바뀐다

픽셀8, 픽셀8 프로 스마트폰에서 구글 어시스턴트는 단순한 음성 비서가 아니었다. 바드를 통해 기능이 업그레이드됐기 때문이다.

텍스트를 음성으로 읽어주는 기능, 텍스트 번역 기능이 개선됐고 웹 페이지 요약 기능도 제공한다. 

스마트폰(하드웨어)을 사용하는 방식이 바뀐다

전문가들은 생성형 AI 기술 기반으로 구글 어시스턴트가 ‘나를 대신해 일하는 에이전트’로 진화할 것으로 관측하고 있다. 예컨대 지금은 콜스크린 기능을 사용자가 직접 스마트폰을 보면서 사용해야 하는데, 미래에는 구글 어시스턴트가 사용자를 대신해 줄 수 있다는 것이다. 실제로 구글은 이날 행사에서 구글 어시스턴트가 모르는 번호로 걸려 온 전화를 받은 후 스팸 전화인지 확인하기 위해 대화를 나누는 상황을 시연했다. 

오픈AI가 생성형 AI 기술을 탑재한 하드웨어 개발에 나서고, 메타가 생성형 AI 기술을 적용한 스마트 글래스를 선보인 것도 같은 맥락이다. ‘AI 기술을 활용하기 위한 도구’로서의 스마트폰, 하드웨어로 무게 중심이 이동하는 셈이다. 이렇게 되면 사람이 스마트폰 또는 하드웨어를 사용하는 방식이 바뀔 수 있다. 터치 스크린 방식도 점차 말이나 행동을 폰이 인식하는 UX로 이동하게 된다.

픽셀8은 가시적인 하드웨어 측면에서는 새롭지는 않았다. 하지만 앞으로 생성 AI가 하드웨어를 만나 할 수 있는 것의 단초를 줬다는 측면에서 앞으로 우리가 스마트폰을 사용하는 방식을 바꿀 수 있는 잠재력을 보여줬다는 평가다.

불쾌한 골짜기

픽셀8에서 보여준 생성AI를 적용한 사진 및 음성 편집 기능이 '불쾌한 골짜기(uncanny valley, 언캐니 밸리)'에 도달할 가능성도 제기된다.

불쾌한 골짜기란 로봇공학자 모리 마사히로의 이론으로 로봇이 사람의 모습과 흡사해질수록 인간이 로봇에 대해 느끼는 호감도가 증가하다가 어느 정도에 도달하게 되면 갑자기 강한 거부감으로 바뀌게 된다는 이론이다. 그러다 로봇이 인간과구별이 불가능할 정도가 되면 호감도가 증가해 '인간대 인간'으로 느끼는 감정에 접근한다.

픽셀8의 매직 에디터를 사용하면 스마트폰으로 쉽게 편집하고 현실과 다른 만들어진 사진을 '생성'하는데 처음에는 어색하지만 익숙해지면 마치 진짜처럼 느끼게 되며 결국 생성되지 않은 사진, 리얼한 현실을 반영한 사진, 맘에 들지 않는 사진이 가짜처럼 느끼게 될 수도 있다.

이 기사와 관련있는 기사 현재 기사와 관련된 기사들 입니다.