인공지능(AI)에 대한 기업과 소비자의 관심이 높아지며 AI 기반 소프트웨어를 개발하는 회사도 크게 증가했다. 특히 기계가 인간의 언어를 처리하고 이해하는 것을 도와 반복적인 작업을 자동으로 수행하는 자연어처리(NLP, Natural Language Processing, 자연어 처리) 기술이 코로나 팬데믹 이후 기하급수적으로 발전했다. NLP 기술은 특정 단어가 주어졌을 때, 다음 단어가 나올 확률을 계산해 단어를 제시한다. NLP는 다양한 신경망으로 구동돼 단순 번역, 요약 외에도 문자에서 감정을 감지하는 감정 분석도 가능하다. NLP 기술은 각 기업이 기업 브랜드 이미지와 소셜 미디어 감성을 분석하고 즉시 대응해야 하는 긴급한 문제를 감지, 전반적인 고객 만족도를 모니터링할 수 있게 한다. 대표적인 NLP 모델은 오픈AI(Open AI)의 GPT-3(Generative Pre-trained Transformer 3)가 꼽힌다. GPT-3는 말로 코드를 생성할 뿐 아니라 레시피를 작성하고 인간이 할 수 있는 비유를 만들어낼 수 있다. 오픈AI의 논문에 따르면, GPT-3가 작성한 기사와 인간이 쓴 기사를 알아맞히는 과정에서 응답자 중 절반은 그 차이를 구분을 하지 못했다.지난 19일(현지시각), 케빈 스콧(Kevin Scott) 마이크로소프트 최고기술책임자(CTO)와 샘 알트만(Sam Altman) 오픈AI CEO는 인덱스 벤처스 AI 서밋에 출연, NLP의 현재와 미래에 대해 나눴다. 2019년, 마이크로소프트는 오픈AI에 10억달러를 투자하며 파트너십을 맺었다. 마이크로소프트 애저(Azure)를 사용하는 모든 사람은 GPT-3를 이용할 수 있다.알트만 CEO는 NLP를 설명하기 위해 “스타트렉 버전과 같은 컴퓨터”를 예로 들었다. 케빈 CTO는 "NLP는 프로그래머가 아닌 더 많은 사람들이 사용할 수 있는 기술이 돼야 한다"고 언급했다. 그는 “프로그래밍은 전문화된 특정 집단만 할 수 있는 일이다. 그러나 컴퓨터에게 어떤 일을 하도록 가르치는 것은 어린아이도 할 수 있는 일이다”라며 “컴퓨터에게 원하는 것을 정확히 말해 컴퓨터 스스로 행동하게 만드는 것은 매우 강력한 개념 전환”이라고 강조했다. 그는 NLP 플랫폼의 예로 오픈AI의 코덱스(Codex, GPT-3 기반으로 자연어를 코드로 변환하는 AI 시스템)와 깃허브의 코파일럿(GitHub Copilot, 코딩을 돕는 AI 프로그램)을 꼽았다.NLP의 10년 뒤 모습에 대해서 두 전문가는 “컴퓨터는 그 어떤 인간보다 당신을 더 잘 도울 수 있는 에이전트일 것"이라는 의견에 동의했다. 알트만 CEO는 “당신이 원하는 곳에서 원하는 모든 것을 슈퍼 인간의 속도로 처리해 내는 수천 명의 똑똑한 전문가가 있다는 느낌을 받을 것”이라고 전했다.GPT-3는 1750억 개의 매개변수(parameter)를 가지고 있다. 매개변수는 머신러닝 알고리즘의 핵심이다. 새로운 데이터에 대한 예측을 하기 위해 필요한 변수다. 오픈AI는 100조 개의 매개변수를 가진 GPT-4를 훈련하고 있는 것으로 알려졌다. 매년 새로운 GPT가 출시된 것을 감안했을 때, GPT-4는 2023년 상반기에 론칭할 것으로 예측된다.다음은 NLP에 대한 대담 전문이다.