Tags
세계 경제는 산업화로 활력을 얻었다. 주요 기술과 플랫폼 변화로 지식과 정보에 기반한 전환이 가속화됐다. 1990년대에는 인터넷이 세상을 바꿨다. 2000년대는 클라우드 컴퓨팅이 시작됐다. 2010년대에는 스마트폰 시대가 열렸다. 플랫폼은 지식에 대한 접근을 확대했다. 사람들이 콘텐츠를 만들고, 소비하고, 소통하는 방식을 변화시켰다. 스마트폰 이후 시대를 이끌 기술은 무엇일까?베세머벤처파트너스는 차세대 플랫폼 전환을 이끌 핵심 기술로 '인공지능(AI)'에 주목한다.
김인순 2022.07.17 23:51 PDT
위 그림을 어떻게 설명할 수 있을까? '초밥으로 만들어진 집에 사는 개' 정도로? 이런 사진을 왜 찍지? 저런 초밥 집이 가능한가? 개의 크기가 작은 것일까? 초밥 집을 크게 지은 것일까? 하지만 놀랍게도 ‘초밥으로 만들어진 집에 사는 귀여운 웰시 코기(A cute corgi lives in a house made out of sushi)’ 라는 문장을 입력하면 인공지능이 실제 촬영한 사진처럼 보이는 가상의 이미지를 만들어준 결과라고 하면 어떨까? 현실에 존재하지 않는 사물까지 AI가 인간처럼 ‘상상해’ 만들어 준다. 구글의 인공지능(AI) 연구조직 구글 리서치 브레인팀(Google Research, Brain Team)은 23일(현지시각) 46페이지 분량의 연구 논문을 발표했다. 이 발표에는 인간의 언어를 이해, 그 정보를 바탕으로 이미지를 만들어 내는 AI 모델 이매진의 성능이 자세히 기술돼 있다.생성적 적대 신경망(Generative Adversarial Network, 이하 GAN)이라고 부르는 딥러닝(Deep Learning, 심층학습) 기술의 발전으로 이런 이미지 창조가 가능해졌다. 생성 모델(생성자, generator)과 판별 모델(감별자, discriminator)이 서로 경쟁, 실제와 가까운 이미지를 자동으로 만들어낸다.가짜 지폐를 만드는 범인(생성자)과 위폐를 감별하는 경찰(감별자)이 경쟁하는 상황을 떠올리면 된다. 경쟁 과정에서 위폐가 발전해 진짜 지폐와 구별할 수 없는 수준에 이르게 되는 것이다. 여기에 텍스트, 사진 등 다양한 양식의 정보를 동시에 이해하는 ‘멀티모달(Multimodal, 다중모드)’ 학습이 더해져 말하는 대로 그려주는 똑똑한 AI가 완성됐다.구글이 인공지능 전문 기업 ‘오픈AI’와 본격적인 경쟁 구도를 형성했다는 점도 흥미로운 부분이다. 오픈AI는 지난 4월 6일 텍스트 기반 이미지 생성 모델 ‘달리2’를 공개해 화제를 불러일으킨 바 있다. 구글은 불과 한 달여 만에 달리와 비슷한 이머젠을 공개, 차세대 AI 대전을 예고했다.
박원익 2022.05.24 23:45 PDT
지난 4월 6일 뉴욕 맨해튼 소호(SoHo) 지구. 디자이너숍, 아트 갤러리, 유명 브랜드 매장이 늘어선 쇼핑 중심지에 실리콘밸리 기업 ‘구글’의 로고가 등장했다. 최신 AI(인공지능) 기술로 구현된 새로운 검색 기능 ‘구글 멀티서치’를 체험해 볼 수 있는 오프라인 이벤트가 열린 것이다.의류 편집숍 형태로 꾸며진 행사장은 멀티서치가 쇼핑 경험을 어떻게 개선할 수 있는지에 초점이 맞춰져 있었다. 비치된 청바지, 운동화, 가방 등을 스마트폰으로 촬영한 후 검색어를 추가하면 비슷한 특성을 가진 다른 상품을 찾을 수 있었다. 예컨대 바둑판 패턴의 청바지를 발견했는데, 같은 패턴의 치마를 사고 싶다면 스마트폰 구글앱으로 그 제품을 촬영한 다음 ‘치마’라는 검색어를 넣는 식이다.실제 쇼핑 경험을 떠올려 보면 이 기능이 얼마나 유용한지 깨달을 수 있다. 마음에 드는 제품의 이름이나 브랜드를 모르더라도 이미지와 텍스트를 동시에 적용, 검색 결과를 좁힐 수 있기 때문이다. ‘이효리 가방’, ‘BTS 지민 스웨터’ 같은 검색어를 사용하지 않고도 원하는 상품을 찾을 수 있으며 원하는 결과를 찾지 못해 단어를 바꿔가며 여러 번 검색하는 번거러움도 줄일 수 있다. 멀티서치는 현재 베타(테스트) 버전으로 공개돼 미국에서 영어로만 사용가능한 상태다. 적용 국가 및 언어는 추후 확장될 전망이다. 구글 측은 “멀티서치 기능은 AI 기술 발전 덕분에 가능했다. 멀티서치를 사용하면 더 자연스럽고 직관적인 방식으로 주변 세계를 이해할 수 있다”며 “향후 이 기능을 더 발전시켜 상상할 수 있는 모든 질문에 대한 검색 결과를 개선할 것”이라고 밝혔다.
박원익 2022.05.01 09:08 PDT
인공지능(AI)에 대한 기업과 소비자의 관심이 높아지며 AI 기반 소프트웨어를 개발하는 회사도 크게 증가했다. 특히 기계가 인간의 언어를 처리하고 이해하는 것을 도와 반복적인 작업을 자동으로 수행하는 자연어처리(NLP, Natural Language Processing, 자연어 처리) 기술이 코로나 팬데믹 이후 기하급수적으로 발전했다. NLP 기술은 특정 단어가 주어졌을 때, 다음 단어가 나올 확률을 계산해 단어를 제시한다. NLP는 다양한 신경망으로 구동돼 단순 번역, 요약 외에도 문자에서 감정을 감지하는 감정 분석도 가능하다. NLP 기술은 각 기업이 기업 브랜드 이미지와 소셜 미디어 감성을 분석하고 즉시 대응해야 하는 긴급한 문제를 감지, 전반적인 고객 만족도를 모니터링할 수 있게 한다. 대표적인 NLP 모델은 오픈AI(Open AI)의 GPT-3(Generative Pre-trained Transformer 3)가 꼽힌다. GPT-3는 말로 코드를 생성할 뿐 아니라 레시피를 작성하고 인간이 할 수 있는 비유를 만들어낼 수 있다. 오픈AI의 논문에 따르면, GPT-3가 작성한 기사와 인간이 쓴 기사를 알아맞히는 과정에서 응답자 중 절반은 그 차이를 구분을 하지 못했다.지난 19일(현지시각), 케빈 스콧(Kevin Scott) 마이크로소프트 최고기술책임자(CTO)와 샘 알트만(Sam Altman) 오픈AI CEO는 인덱스 벤처스 AI 서밋에 출연, NLP의 현재와 미래에 대해 나눴다. 2019년, 마이크로소프트는 오픈AI에 10억달러를 투자하며 파트너십을 맺었다. 마이크로소프트 애저(Azure)를 사용하는 모든 사람은 GPT-3를 이용할 수 있다.알트만 CEO는 NLP를 설명하기 위해 “스타트렉 버전과 같은 컴퓨터”를 예로 들었다. 케빈 CTO는 "NLP는 프로그래머가 아닌 더 많은 사람들이 사용할 수 있는 기술이 돼야 한다"고 언급했다. 그는 “프로그래밍은 전문화된 특정 집단만 할 수 있는 일이다. 그러나 컴퓨터에게 어떤 일을 하도록 가르치는 것은 어린아이도 할 수 있는 일이다”라며 “컴퓨터에게 원하는 것을 정확히 말해 컴퓨터 스스로 행동하게 만드는 것은 매우 강력한 개념 전환”이라고 강조했다. 그는 NLP 플랫폼의 예로 오픈AI의 코덱스(Codex, GPT-3 기반으로 자연어를 코드로 변환하는 AI 시스템)와 깃허브의 코파일럿(GitHub Copilot, 코딩을 돕는 AI 프로그램)을 꼽았다.NLP의 10년 뒤 모습에 대해서 두 전문가는 “컴퓨터는 그 어떤 인간보다 당신을 더 잘 도울 수 있는 에이전트일 것"이라는 의견에 동의했다. 알트만 CEO는 “당신이 원하는 곳에서 원하는 모든 것을 슈퍼 인간의 속도로 처리해 내는 수천 명의 똑똑한 전문가가 있다는 느낌을 받을 것”이라고 전했다.GPT-3는 1750억 개의 매개변수(parameter)를 가지고 있다. 매개변수는 머신러닝 알고리즘의 핵심이다. 새로운 데이터에 대한 예측을 하기 위해 필요한 변수다. 오픈AI는 100조 개의 매개변수를 가진 GPT-4를 훈련하고 있는 것으로 알려졌다. 매년 새로운 GPT가 출시된 것을 감안했을 때, GPT-4는 2023년 상반기에 론칭할 것으로 예측된다.다음은 NLP에 대한 대담 전문이다.
박윤미 2022.02.08 17:36 PDT
순다르 피차이 구글 CEO는 5월 18일(현지 시각) “자연어(Natural Language) 이해 분야의 돌파구 ‘람다(LaMDA, Language Model for Dialogue Applications)’를 소개할 수 있어 흥분된다”며 이같이 말했다.람다는 이날 미국 캘리포니아 마운틴뷰 구글 본사에서 온라인으로 개막한 ‘구글 I/O(연례 개발자회의)’의 주인공이었다. 피차이 CEO는 기조연설 초반 직접 람다를 소개했고, 약 10분을 할애해 람다의 성능과 가능성을 강조했다. 스마트폰 운영체제(OS) ‘안드로이드’, 업무 도구 ‘워크스페이스(Workspace)’처럼 상용화된 제품이 아니라 개발 중인 AI(인공지능) 모델이라는 점을 고려하면 이례적인 일이었다.람다는 어떤 주제든 사람처럼 대화할 수 있는 AI 언어 모델이다. 예컨대 람다를 활용하면 명왕성, 종이비행기 같은 사물과 대화하는 경험을 할 수 있다. 기계가 일부 학습된 정보만 나열하는 것이 아니라 인격을 가진 사람처럼 자연스럽게 말을 건네기 때문이다. 이날 시연에 등장한 명왕성은 자존감이 높았고, 종이비행기는 재기발랄했다.
박원익 2021.05.30 13:09 PDT
대중은 지난 2016년 알파고와 이세돌의 바둑 대결로 AI의 위력을 피부로 느꼈다. 이후 AI는 전 산업 분야에 스며들고 있다. 최근 실리콘밸리의 화두는 알파고와 같이 바둑이나 음성 인식 등 특정 문제에 한해 좋은 성과를 보이는 좁은 인공지능(ANI, Artificial Narrow Intelligence)에서 나아가 사람과 같은 또는 그 이상의 지능을 구현하는 범용 인공지능(AGI, Artificial General Intelligence)이다. 즉, 인간이 그동안 발견한 적이 없던 새로운 아이디어를 고안하고 추론하는 AI다. 하지만 아직까지는 먼 미래이며 인간을 뛰어넘는 AI에 대한 기대감과 회의감이 공존한다. 실리콘밸리에서 범용 AI 개발은 어디까지 진행됐을까. 오픈AI의 샘 알트먼(Sam Altman) CEO에게 범용AI의 현재와 미래를 들었다. 샘 알트먼 CEO는 최근 디인포메이션이 개최한 <스타트업의 미래(Future of Startups)> 컨퍼런스에서 범용 AI가 아직 먼 미래의 일이지만, 분명 가능한 시나리오라 주장한다. 그는 “AI가 인간의 지식을 반복하고 재조립할 뿐 아니라 그 이상 무엇인가를 더할 수 있다면 위대할 것”이라며 “이런 기술이 가능한지 알아내기 위해 할 일이 많지만, 가능할 것으로 믿는다”고 말했다.샘 알트먼은 누구?오픈AI는 텍스트와 코드까지 작성 가능한 GPT-3(Generative Pre-trained Transformer)를 내놓으며 주목받은 기업이다. 샘 알트먼은 에어비앤비와 드롭박스, 핀터레스트 등 수많은 기업의 초기 투자를 진행했던 와이콤비네이터(Y Combinator) CEO를 역임했다. 1985년생인 알트먼 CEO는 스탠포드대 공학도 출신으로 2005년 초기 SNS 버전인 ‘룹트(Loopt)’ 공동 설립자·CEO를 거쳐 2011년 대형 벤처캐피탈 와이콤비네이터에 합류해 여러 테크 기업을 키워냈다. 에어비앤비, 인스타카트, 핀터레스트, 레딧 등이 모두 그의 손을 통해 탄생했다. 2015년 포브스가 선정한 30세 미만의 투자자, 비즈니스 부문 ‘최고의 젊은 기술사업가’ 중 한 명으로 선정됐다. 같은 해 일론 머스크 테슬라 CEO와 함께 비영리 AI 연구소인 오픈AI를 설립했다. 왜 범용 AI가 필요한가 오픈AI는 범용 인공지능(AGI) 체계 연구에 집중한다. 이 회사는 지난해 텍스트와 코드까지 작성 가능한 GPT-3(Generative Pre-trained Transformer)를 내놨다. 최근에는 이미지를 위한 클립(CLIP)과 달리(DALL·E)를 출시했다. 그는 “컴퓨터 프로그램이 실제 지능을 가질 수 있는 시스템을 만드는 데 무엇이 필요한지를 연구하고 있다”며 “이 것이 앞으로 위대한 기술혁명이 되고 어쩌면 그보다 더 큰 규모로 사회를 변화시킬 수 있다고 믿는다”고 확신했다.현재 AI는 일상생활에서 사용하는 자연어(natural language) 의미를 분석해 컴퓨터가 처리할 수 있는 작업으로 변환하는 ‘자연어 처리’ 분야는 상당한 수준에 이르렀다. 다음 단계는 언어를 이미지와 연결하는 과정으로 가고 있다. 이는 궁극적으로 새로운 지식을 발견하는 수준으로 가고 있다. AI가 어떤 인간도 발견한 적이 없던 새로운 아이디어를 내고 생각하고 추론하는 가치를 만들어 내는 것이다. 알트먼 CEO는 '오픈AI를 다른 사람들을 위한 플랫폼'으로 만들고 있다. 그는 “대규모 범용 AI를 진지하게 추구하는 것은 비용이 높아 학구적인 AI 실험실에서는 불가능하다. 다른 사람들이 혁신적인 일을 하도록 플랫폼을 구축하는 것이 오픈AI가 스스로 하는 것보다 더 큰 가치를 창출한다. 오픈AI는 강력한 범용 AI 모델을 만든다”고 강조했다. 아마존, 구글, 애플처럼 자사 서비스를 위한 AI를 개발하는 것이 아닌, 다른 회사도 사용하는 ‘범용’ AI를 만들겠다는 야심찬 목표다.
캐나다 인공지능(AI) 스타트업 '엘리먼트AI(Element AI)'에 대한 실리콘밸리 AI·소프트웨어 업계 관계자들의 평가다. 디지털 업무 솔루션 기업 서비스나우(ServiceNow)가 지난 2020년 11월 30일 엘리먼트AI 인수 소식을 발표하자 이런 반응이 나왔다. 서비스 나우의 엘리먼트 AI(Element AI) 인수는 AI 분야에서 상당한 충격으로 받아들여졌다. 엘리먼트 AI는 딥러닝의 아버지라 불리는 요슈아 벤지오(Yoshua Bengio) 몬트리올대 교수와 수석부사장 필립 보두앵 (Philippe Beaudoin), 장 프랑스와 가녜 (Jean-Francois Gagne) 최고경영자(CEO)가 지난 2016년 10월에 공동 설립한 AI 분야 최고 스타 기업 중 하나였기 때문. 지난 2016년부터 전세계적으로 AI 붐이 일자 너도나도 요슈아 벤지오, 필립 보두앵, 장 프랑수와 가녜 등을 만나고 싶어했다. 인공지능 기술로 글로벌 투자열풍을 이끌어낸 캐나다의 자존심으로 불렸다. 때문에 지난 2018년 캐나다 정부는 엘리먼트 AI를 '인공지능의 세계 리더'로 칭했다. 캐나다 연방정부로부터 500만달러 상환기여금을 받았고, 트뤼도 캐나다 총리는 싱가포르에서 엘리먼트AI 본사 개설 기념 연설을 했을 정도다. 특히 요슈아 벤지오 교수는 차세대 음성인식 성능 혁신을 위한 신경망 네트워크 (RNN, Recurrent Neural Network) 설계 및 학습 알고리즘 개발 분야의 권위자로 지난 2018년 컴퓨터 과학 분야의 노벨상이라 불리는 '튜링상(Turing Award)'을 수상했다. AI 분야 세계 4대 구루(Guru)로 꼽힌다. 이 회사는 설립하자 마자 글로벌 기업들이 앞다퉈 투자했다. 그런데 설립 4년도 안돼 기업가치가 깎이면서 매각된 것이다. 무슨 사연이 있었을까?
“이건 공상과학 소설이 아니다. 현실이다.”“비트코인 이후 가장 강력한 파괴력을 지닌 도구다.”“(프로그램 개발에서 다른 영역으로) 커리어 전환을 고민해야 할 때다." 오픈AI(OpenAI)가 최근 공개한 언어 생성기 GPT-3(Generative Pre-Training 3)가 전 세계 소프트웨어 개발자들을 깜짝 놀라게 했다. 오픈AI는 일론 머스크(Elon Musk) 테슬라 최고경영자(CEO), 샘 알트만(Sam Altman) 와이콤비네이터(Y-Combinator) 전 대표 등이 지난 2015년 12월 실리콘밸리에 설립한 AI(인공지능) 연구기업이다.GPT-3는 학습을 거쳐 언어를 생성할 수 있게 하는 기계다. GPT-3를 이용해서 뉴스 기사나 시, 소설을 쓸 수 있여러 AI 모델 중에서 자연어 처리(NLP) 모델로 분류된다. 특정 단어가 주어졌을 때 다음 단어가 나올 확률을 계산해 확률 높은 단어를 제시하는 방식으로 작동하는데, 모델의 성능이 뛰어날수록 단어들의 조합과 문장의 적합성이 높아진다.오픈AI는 지난 6월 5일 관련 논문을 발표했는데, 최근 일부 연구자, 개발자들에게 GPT-3의 API(Application Program Interface)를 공개하면서 큰 화제가 됐다. 논문에서 GPT-3가 작성한 기사와 인간이 쓴 기사의 저자를 알아맞히는 비율을 측정했는데, 약 절반 정도의 응답자는 이 기사를 기계가 썼는지 인간이 썼는지 구분하지 못 했다. 샌프란시스코에 본사를 둔 스타트업 창업가 애럼 사베티(Arram Sabeti)는 GPT-3를 테스트 해본 후 “미래를 보는 느낌”이라고 평가하기도 했다. MIT 테크놀로지 리뷰는 20일 “충격적일만큼 훌륭하다”고 치켜세웠다.
박원익 2020.07.21 01:40 PDT