AI 대전, 구글이 이겼다... 말로 NFT 만드는 시대 올까?
구글 이미지 생성 AI 모델 ‘이매진’ 공개...무엇이 다른가
언어 이해력에서 구글이 압도
일부선 “오픈AI 달리2가 앞선다” 의견도…NFT 아트 판도 바꿀까
위 그림을 어떻게 설명할 수 있을까? '초밥으로 만들어진 집에 사는 개' 정도로? 이런 사진을 왜 찍지? 저런 초밥 집이 가능한가? 개의 크기가 작은 것일까? 초밥 집을 크게 지은 것일까?
하지만 놀랍게도 ‘초밥으로 만들어진 집에 사는 귀여운 웰시 코기(A cute corgi lives in a house made out of sushi)’ 라는 문장을 입력하면 인공지능이 실제 촬영한 사진처럼 보이는 가상의 이미지를 만들어준 결과라고 하면 어떨까? 현실에 존재하지 않는 사물까지 AI가 인간처럼 ‘상상해’ 만들어 준다.
구글의 인공지능(AI) 연구조직 구글 리서치 브레인팀(Google Research, Brain Team)은 23일(현지시각) 46페이지 분량의 연구 논문을 발표했다. 이 발표에는 인간의 언어를 이해, 그 정보를 바탕으로 이미지를 만들어 내는 AI 모델 이매진의 성능이 자세히 기술돼 있다.
생성적 적대 신경망(Generative Adversarial Network, 이하 GAN)이라고 부르는 딥러닝(Deep Learning, 심층학습) 기술의 발전으로 이런 이미지 창조가 가능해졌다. 생성 모델(생성자, generator)과 판별 모델(감별자, discriminator)이 서로 경쟁, 실제와 가까운 이미지를 자동으로 만들어낸다.
가짜 지폐를 만드는 범인(생성자)과 위폐를 감별하는 경찰(감별자)이 경쟁하는 상황을 떠올리면 된다. 경쟁 과정에서 위폐가 발전해 진짜 지폐와 구별할 수 없는 수준에 이르게 되는 것이다. 여기에 텍스트, 사진 등 다양한 양식의 정보를 동시에 이해하는 ‘멀티모달(Multimodal, 다중모드)’ 학습이 더해져 말하는 대로 그려주는 똑똑한 AI가 완성됐다.
구글이 인공지능 전문 기업 ‘오픈AI’와 본격적인 경쟁 구도를 형성했다는 점도 흥미로운 부분이다. 오픈AI는 지난 4월 6일 텍스트 기반 이미지 생성 모델 ‘달리2’를 공개해 화제를 불러일으킨 바 있다. 구글은 불과 한 달여 만에 달리와 비슷한 이머젠을 공개, 차세대 AI 대전을 예고했다.