한국어 전면에 내세운 바드, 챗GPT 아성 흔든다

reporter-profile
Sejin Kim 2023.05.10 15:11 PDT
한국어 전면에 내세운 바드, 챗GPT 아성 흔든다
(출처 : 구글IO2023)

차별화 요소는 자체 LLM∙구글 검색 데이터
전면 개방...워크플레이스서도 사용 가능
영어 다음 지원 언어는 한국어∙일본어
대화 내용 훈련에 사용…개인정보는 입력 말아야

구글의 연례 대형 컨퍼런스 내 발표 화면에 “한국어”라는 글자가 전면에 나타났다. 인공지능(AI) 챗봇 바드(Bard) 전면 오픈 소식과 함께 일본어, 한국어도 지원한다는 소식을 밝히기 위해서다.

순다르 피차이 구글 대표(CEO)는 10일(현지시각) 미국 캘리포니아 마운틴뷰에서 열린 구글 연례 개발자 컨퍼런스 ‘구글 I/O2023’에서 "오늘부터 바드 이용을 위한 대기자 명단 운영을 종료한다"면서 전면 공개를 선언했다. 지난 3월 출시한 지 한 달 반만이다.

바드는 컴퓨터 코드, 엑셀 함수, 커버레터, 각종 과제 등을 질문하고 텍스트로 답을 받을 수 있는 AI 챗봇이다. 바드는 오픈AI의 GPT-4를 사용하는 마이크로소프트(Microsoft) 검색엔진 빙(Bing)과 직접적인 경쟁 구도를 형성하고 있다.

지난해 11월 챗GBT가 반향을 일으키면서 빙 점유율이 높아지자 구글은 질세라 바드를 출시했다. 하지만 시연 행사에서 바드가 오류를 일으키면서 그간 점유율에서 다소 뒤쳐지는 모습을 보였다. 하지만 이번 발표에선 구글의 강력한 검색 데이터를 바탕으로 챗봇 시장의 판을 흔들 발판을 보여줬다는 평가다.

시시 샤오 부사장이 바드로 엑셀 자료 제작을 시연하고 있다. (출처 : 구글IO2023 캡쳐)

가장 큰 차이는 최신 구글 데이터…사용자 주의사항은?

바드와 다른 AI 챗봇 간 가장 큰 차이는 수집하는 데이터 출처와 기간이다. 바드는 구글의 최신 검색 기록을 사용할 수 있지만 오픈AI의 챗GPT는 구글 검색 기록을 사용할 수 없고, 2021년 이전 정보에 대해서만 훈련받았다.

기반 기술도 다르다. 바드는 대부분 AI 챗봇이 사용하고 있는 기술인 GPT 시리즈 대신 람다(LaMDA, Language Model for Dialogue Applications)라는 자체 대형 언어 모델을 사용한다.

바드에는 구글의 최신 대규모언어모델(LLM)인 팜2(PaLM)가 탑재됐다. 팜2는 지난해 4월 선보인 팜의 업그레이드 버전으로, 100개 이상의 언어를 지원한다. 5300억개의 파라미터(매개변수)를 바탕으로 과학·수학에 대한 추론뿐 아니라 코딩 작업도 한다고 구글은 설명했다.

바드는 이제 구글 워크스페이스 계정에 연동해 사용할 수 있다. 워크스페이스 관리자가 관리자 콘솔(Admin Console)에서 바드 사용을 활성화하면 사용할 수 있다. 바드 답변은 바로 구글 G메일과 문서로도 내보낼 수 있다.

바드의 질문과 답변에는 시각적인 요소도 추가됐다. 이에 따라 이용자 질문에 이미지를 제시해 답할 수 있다. 바드에는 시각 분석을 통해 관련 정보를 가져올 수 있도록 구글 렌즈(Google Lens)가 결합한다. 눈의 피로를 줄이기 위해 다크모드(어두운 화면에 흰 글자) 기능도 적용됐다. 다음 주부터는 답의 출처 표기 기능도 추가된다.

영어 다음 지원 언어는 일본어∙한국어

그동안 영문만 지원해 온 바드는 이날부터 전 세계 180개국에서 한국어와 일본어를 지원하기 시작했다. 바드의 두 번째 지원 언어가 한국어인 것. 구글은 조만간 40개의 언어로 서비스를 지원할 예정이라고 밝혔다.

이날 행사에서 피차이 대표는 "서울에서 동료와 함께 일하고 있고 코드를 디버깅(오류 수정)하고 있다고 가정해 보겠다"며 '서울(Seoul)'을 언급했다. 이어 "코드에 '한국어'(Korean)로 된 코멘트를 추가해 버그를 수정하고, 동료를 도와달라고 요청할 수 있다. 수정의 배경에 대한 설명과 당신이 요청한 대로 한국어 코멘트를 추가할 수 있다"면서 그 결과를 한글로 제시했다.

시시 샤오 부사장도 바드가 한국어와 일본어로 지원된다는 점을 알렸다. 대형 스크린에는 '한국어'라고 쓴 한글이 그대로 나왔다. 다만 구글은 영어 이외에 한국어를 바드에서 먼저 지원하는 이유에 대해서는 언급하지 않았다.

사용자 대화는 훈련에 사용…개인정보 입력 말아야

다만 구글의 데이터를 사용하는 만큼 사용자는 개인정보 취급에 유의할 필요가 있다.

바드에 따르면 사용자와의 대화, 대략적인 위치 등을 수집, 최대 18개월간 정보를 저장한다. 정보는 제품, 서비스, 머신러닝 기술을 개선하는데 사용된다. 3개월에서 36개월간 자동삭제 옵션을 선택할 수 있다.

이용자 약관에는 “바드 대화에 본인 또는 다른 사람을 식별하는 데 사용할 수 있는 정보를 포함하지 마시기 바랍니다”라는 문구가 포함됐다. 피차이 대표는 바드가 실수할 수 있는 실험이라면서 사용자 피드백을 기반으로 계속 개선해 나갈 것이라고 거듭 강조했다.

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.