교육 혁신 vs 편집 영상?... 구글 ‘제미나이’ 이슈 총정리

reporter-profile
박원익 2023.12.08 12:55 PDT
교육 혁신 vs 편집 영상?... 구글 ‘제미나이’ 이슈 총정리
구글 차세대 AI 모델 제미나이(Gemini)의 특징 (출처 : Google)

[뷰스레터플러스]
구글 차세대 AI 모델 ‘제미나이’ 총정리
멀티모달 AI, 교육 산업 흔든다
‘광대광고’ 논란도... 세 가지 쟁점은?

“(포스트잇에 그린 그림을 보며) 새처럼 보이네요. (추가로 물결 표시를 그려 넣자) 새가 물에서 수영하고 있네요. 긴 목과 부리를 보니 오리가 틀림없어요!”

뷰스레터 구독자 여러분 안녕하세요. 박원익입니다. 

구글이 6일(현지시각) 공식 발표한 차세대 AI 모델 ‘제미나이(Gemini)’ 시연 영상 중 한 장면입니다. 더밀크는 구글의 공식 발표 하루 전날인 5일(현지시각) 오후 화상으로 진행된 글로벌 기자간담회에 참석, 이 영상을 처음 확인했는데요. 6분 남짓 진행된 시연을 보며 ‘정말 새로운 세상이 열리는구나’라는 생각을 하게 됐습니다. 

제미나이는 ‘쌍둥이 자리’를 뜻하죠. 인간과 AI가 쌍둥이(twins)란 의미를 담고 있습니다. 구글은 제미나이를 통해 인간을 닮은 AI를 만들려 합니다. 사람처럼 주어진 다양한 정보를 종합해 ‘연속적인 생각(Chain of Thought, CoT)’을 할 수 있다는 걸 보여줬습니다. 

제미나이 시연 영상 (출처 : Google)

인간의 뇌는 시각, 후각, 청각, 촉각 등 다양한 형태(modality)을 종합해 세상을 인지하고, 선행 정보와 후행 정보의 관계까지도 파악할 수 있는 능력을 갖고 있습니다. 구글이 이번에 공개한 제미나이는 이런 인간의 특성을 본뜬 ‘태생적 멀티모달 모델(natively multimodal model, 다중모드 모델)’입니다. 

구글은 AI 개발조직 딥마인드 웹페이지에 “제미나이 시대에 오신 걸 환영합니다(Welcome to the Gemini era)”라는 메시지를 내걸며 멀티모달 AI의 새 시대를 천명했습니다. 새로운 AI, 제미나이는 우리 삶에 어떤 영향을 미치게 될까요? 오늘은 구글 제미나이 특집으로 전해드립니다. 

사람닮은 AI, 구글 ‘제미나이’의 모든 것

구글이 공개한 제미나이 벤치마크 점수 (출처 : Google )

이번에 선보인 ‘제미나이 1.0’의 가장 흥미로운 부분도 멀티모달 기능입니다. 

개발 단계부터 멀티모달로 구축됐기 때문에 텍스트, 코드(컴퓨터 프로그래밍 언어), 오디오, 이미지, 동영상 등 다양한 유형의 정보를 일반화, 원활하게 이해하고 결합할 수 있습니다. 

제미나이 1.0은 가장 강력하고 규모가 큰 ‘제미나이 울트라(Gemini Ultra)’, 중간 규모의 ‘제미나이 프로(Gemini Pro)’, 경량화한 ‘제미나이 나노(Gemini Nano)’ 세 가지 버전으로 제공됩니다. 구글이 제시한 자료에 따르면 제미나이 울트라는 32개의 학술 벤치마크(benchmark, 성능 지표) 중 30개에서 오픈AI의 GPT-4를 능가했습니다.

👉멀티모달 AI, 무엇이 다른가

AI, 교육부터 흔든다

(출처 : DALL·E 3, 박원익 )

멀티모달 AI는 양질의 데이터가 필수입니다. 세계 최대 검색 엔진, 유튜브 등 방대하고 다양한 유형의 데이터를 확보한 구글의 강점이 여기에 있다는 게 AI 업계의 평가입니다. 

특히 교육 분야에서 제미나이의 활용 가능성이 무궁무진합니다. 이미지, 텍스트를 모두 인식할 수 있고, 맥락에 따른 고도의 추론 능력까지 갖췄기 때문에 학습에 활용하기 좋죠. 

제프 딘 구글 딥마인드 최고과학자(Chief Scientist)는 X(옛 트위터)를 통해 시연 사례 중 하나를 직접 언급하며 교육 혁신을 예고했습니다.

스키어가 경사면을 내려가는 물리학 문제 풀이 답안을 제미나이에 주고 “학생이 정답을 맞혔는지, 틀렸다면 왜 틀렸는지 설명해달라”고 하자 학생의 손글씨와 손으로 그린 그래프, 문제가 원하는 바를 정확히 인식, 잘못 추론한 부분을 정정해 주었습니다. 학교 현장이 어떻게 변할지 기대되기도 하고 두렵기도 합니다. 

👉누구나 AI 개인 교사 갖는다

‘광대광고’ 논란도... 세 가지 쟁점은?

구글 AI 모델 제미나이 시연 설명 이미지. 여러 이미지와 텍스트를 함께 제시하는 ‘멀티모달 프롬프팅(multimodal prompting)’을 사용했다. (출처 : Google)

새로운 AI 모델에 대한 기대감만 있을까요? 다양한 비판도 함께 제기됩니다. 특히 오픈AI의 GPT-4보다 제미나이의 성능이 앞선다는 구글의 주장이 ‘과대광고(hype)’일 수 있다는 지적이 지배적입니다.

구체적 쟁점은 크게 세 가지입니다. 제미나이의 가장 강력한 버전(Gemini Ultra, 제미나이 울트라)이 아직 공개되지 않았다는 점, 그리고 구글이 밝힌 벤치마크 점수 차이가 근소하다는 것과 데모 영상에 과장(일부 편집)이 존재한다는 사실입니다. 

제미나이를 둘러싼 3대 쟁점, 그리고 비판의 근거는 무엇일까요? 하나하나 살펴봤습니다.

👉[팩트체크] 제미나이, 세 가지 쟁점

구글 공동창업자 래리 페이지(왼쪽)와 세르게이 브린(오른쪽) (출처 : Gettyimages)

제미나이 론칭 이벤트를 취재하며 알게 된 또 하나의 흥미로운 사실은 구글의 설립자 세르게이 브린(Sergey Brin)이 이번 제미나이 AI 모델의 기술 문서(technical paper)를 작성한 핵심 기여자라는 점입니다. 

1061억달러(약 139조원)의 재산을 가진 억만장자 창업자가 거의 매일 코딩을 하며 새로운 프로젝트에 매달렸다는 사실에 많은 이들이 놀라움을 표했습니다. 세계 최대 테크 기업 중 하나인 구글에 여전히 기술 스타트업의 DNA가 남아 있다는 상징이기 때문입니다. AI 헤게모니를 쥐기 위한 선두 기업들의 경쟁이 그만큼 치열하다는 방증이기도 합니다. 

혁신하지 않으면 살아남기 어려운 시대입니다. 더밀크는 독자분들이 계속해서 혁신할 수 있도록 새로운 아이디어, 생생한 스토리와 깊이 있는 인사이트를 전하겠습니다.  

감사합니다. 

뉴욕에서
더밀크 박원익 드림

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.