‘AI 대모’ 칼 뽑았다... 나도 AI로 팟캐스트 시작?

reporter-profile
박원익 2024.09.18 09:32 PDT
‘AI 대모’ 칼 뽑았다... 나도 AI로 팟캐스트 시작?
월드랩스 공동창업자들. 가장 오른쪽이 페이페이 리 공동창업자 겸 CEO/ 마크 베니오프 세일즈포스 CEO가 드림포스 2024에서 기조연설을 하고 있다. (출처 : World Labs, Salesforce 유튜브 캡처/편집: 더밀크 )

[위클리AI브리핑] 2024년 9월 11일~9월 17일
AI 대모 “대규모 세계 모델 구축할 것”
‘박사급 AI’ 오픈AI 추론 모델 o1 활용법
문서가 팟캐스트로: 구글 오디오 오버뷰
이주의 인사이트: 드림포스 2024
➕더밀크가 주목한 뉴스

안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 AI 뉴스레터 [박원익의 AI인사이트]입니다. 매주 수요일 발행하는 ‘AI인사이트’를 통해 AI 리더들의 전략, 글로벌 테크업계 최신 흐름 및 중요 시그널을 놓치지 말고 확인하세요! 

“AI 분야에서 가장 연구하기 어려운 문제는 뭘까요? 저는 공간 지능(Spatial Intelligence)이라고 생각합니다.”

페이페이 리 스탠퍼드대 교수는 13일(현지시각) X(옛 트위터)를 통해 “대자연이 5억 년에 걸쳐 풀고 있는 이 문제를 해결하기 위해 ‘월드랩스(World Labs)’를 시작했다”라며 이같이 밝혔습니다. 올해 1월 자신이 설립한 AI 스타트업 월드랩스의 비전, 창업팀, 웹사이트를 이날 최초로 공개, 본격적인 활동에 나선 것입니다. ‘AI 대모(Godmother)’로 불리는 페이페이 리 교수는 생성 AI 분야에서 어떤 기회를 발견한 것일까요? 

🦸‍♀️AI 대모 “대규모 세계 모델 구축할 것”

월드랩스 웹페이지 (출처 : World Labs)

팩트 요약: 3D 세계 인식·생성… 대규모 월드 모델(LWM) 만든다  

1. 페이페이 리 월드랩스 CEO는 “공간 지능은 창작, 디자인, 학습, AR/VR, 로봇 공학 등 무수히 많은 사용 사례를 지원하고 가능케 하는 기술”이라고 강조했습니다.  

2. 인간의 지능에는 여러 측면이 있는데, 그중 하나가 언어 지능이며 이보다 더 근본적인 것은 공간 지능이라는 주장입니다. 

3. 월드랩스는 대규모 언어 모델(LLM)을 뛰어넘어 세계를 모델링하고, 3D 공간과 시간에서 사물, 장소, 상호 작용을 추론할 수 있는 공간 지능, ‘대규모 월드 모델(LWM)’을 개발한다고 밝혔습니다.

왜 중요한가: 

생성 AI 거품론이 부상하는 가운데, AI 석학, 관련 분야 최고 전문가들은 끊임없이 새로운 스타트업을 설립해 도전을 펼쳐가고 있습니다. 생성 AI 기술, 산업은 아직 시작 단계이며 미래에 창출할 수 있는 기회가 훨씬 더 크다는 신호로 읽힙니다.

👉더 알아보기: 헬로 월드랩스… 공간 지능이란?

🍓‘박사급 AI’ 오픈AI 추론 모델 o1 활용법

오픈AI 추론 모델 o1-프리뷰를 ‘컴퓨터 프로그래밍(coding)’ 도구로 활용할 수 있다. (출처 : OpenAI)

팩트 요약: 오픈AI, o1-프리뷰 공개… 과학, 코딩 성능 탁월

1. 오픈AI가 12일 공개한 새로운 추론 AI 모델 ‘o1-프리뷰(preview)’ 역시 새로운 가능성을 보여줬다는 평가입니다. 

2. 초거대 언어 모델(LLM) 성능 발전이 정체된 것 아니냐는 의구심이 나오던 차에 가장 높은 벤치마크(성능 평가) 점수를 기록한 모델을 선보였기 때문입니다. 

3CoT(Chain of Thought, 사고 사슬) 방식을 활용해 수학, 물리학, 코딩 등 까다로운 분야에서 박사급 추론 능력을 보여줬습니다.    

왜 중요한가: 

o1-프리뷰는 추론 능력을 강화함으로써 AI의 활용 범위를 한 단계 더 높은 수준으로 올렸습니다. 양자 물리학 같은 복잡한 학문을 AI로 연구하며 인류의 난제를 해결하려는 시도가 계속될 것입니다. 

다른 AI 모델과 비교할 때 훈련(Pre-training, Post-training)보다 활용(Inference)에 컴퓨팅 자원을 더 쓰는 최초의 추론 특화 모델이라는 점도 의미가 깊습니다. AI 모델 개발보다 AI 모델을 어떻게 활용하느냐, 목적을 달성하기 위해 어떤 모델을 선택하느냐가 점점 더 중요해집니다.

👉더 알아보기: 오픈AI ‘o1’ 어떻게 다른가(무료)

🎙️문서가 팟캐스트로: 구글 오디오 오버뷰

구글 오디오 오버뷰 (출처 : Google)

팩트 요약: 문서, 슬라이드, 차트를 음성 대화로 

1. 구글이 11일 ‘오디오 오버뷰(Audio Overview)’를 공개했습니다. 문서, 슬라이드, 차트 등 텍스트를 음성 대화로 쉽게 바꿀 수 있습니다. 

2. 두 명의 AI 진행자(host)가 주어진 텍스트, 자료를 기반으로 ‘심층 토론’을 시작하고, 농담까지 주고받으며 대화를 이어갑니다. 

왜 중요한가: 

구글은 제미나이 등 강력한 AI 모델, LLM 기술을 바탕으로 새로운 애플리케이션을 제공하는 데 집중하고 있습니다. 강력한 AI 모델을 확보하는 것도 중요하지만, 사용자들이 그 모델로 뭘 할 수 있는지가 더 중요하기 때문입니다. 

20억 명의 사용자를 확보한 안드로이드(스마트폰 운영체제), 10억 명 이상이 쓰는 지메일, 전 세계인의 여유 시간을 점유한 유튜브 등 다양한 구글 제품과 AI 기술을 연계, 데이터 플라이휠을 만들어 생성 AI 분야에서 우위를 지키려는 전략으로 풀이됩니다.

👉더 알아보기: 텍스트 넣으면 팟캐스트가 뚝딱

💡이주의 인사이트: 드림포스 2024

마크 베니오프 세일즈포스 CEO가 드림포스 2024에서 기조연설을 하고 있다. (출처 : Salesforce 유튜브 캡처)

오늘의 레터에서 다룬 세 가지 이슈에서 한발 더 나아가 더밀크만의 뷰(view)를 제공해 드리는 <이주의 인사이트> 코너입니다. 

오늘은 17일(현지시각) 샌프란시스코 기반 고객경험관리(CRM) 기업 ‘세일즈포스(Salesforce)’가 진행 중인 연례 컨퍼런스 드림포스 2024(Dreamforce 2024) 소식을 준비했습니다. 세일즈포스는 이날 고객사가 맞춤형 AI 에이전트를 쉽게 구축할 수 있도록 돕는 ‘에이전트포스(Agentforce)’를 선보였습니다.

💡이주의 인사이트: 맞춤형 AI 에이전트로 비즈니스 혁신(영상)

➕더밀크가 주목한 뉴스

픽스트랄 12B 벤치마크 점수 (출처 : Mistral)

➕더밀크가 주목한 뉴스

  • 미스트랄, 첫 멀티모달 모델 출시프랑스 AI 스타트업 미스트랄이 17일 이미지와 텍스트를 함께 처리할 수 있는 멀티모달(Multimodal) 모델 ‘픽스트랄 12B’를 출시. 미스트랄이 선보인 최초의 멀티모달 모델. 누구나 상업적 용도로 이용가능한 오픈 소스로 제공.

  • 마이크로소프트, 코파일럿 페이지 발표마이크로소프트는 16일 온라인 이벤트 ‘마이크로소프트 365 웨이브 2’를 열고 AI를 이용한 새 기능을 발표. 새롭게 선보인 코파일럿 페이지는 모든 코파일럿 상호 작용을 공동으로 편집할 수 있는 협업 공간. 앤트로픽 클로드 아티팩트와 유사.

  • 인텔 30억달러 정부 보조금 확보인텔은 16일 칩스법에 따라 바이든-해리스 행정부가 인텔에 최대 30억달러(약 3조9900억원)의 추가 보조금을 지원한다고 밝힘. ‘시큐어 인클레이브(Secure Enceval)’ 기술 보조금으로 인텔은 미국 국방부 요구사항에 맞춰 해당 기술이 적용된 반도체를 미국 내에서 생산, 국방부에 공급하게 됨.

더밀크 회원으로 가입하시면 실리콘밸리에서 나오는 혁신 비즈니스 트렌드와 자본의 흐름을 가장 먼저 파악하고 앞서갈 수 있습니다. 주 4회 뷰스레터를 무료로 제공합니다. 유료 회원으로 업그레이드하시면 더밀크 콘텐츠를 제한없이 보고 더밀크의 스페셜 리포트를 받아보고 이벤트에 참석하실 수 있습니다.
더밀크 회원 가입하기 

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.