Tags
A new AI-powered voice conversion tool is threatening to upend traditional models of content production across streaming, film, music, podcasting, and more. Supertone, a subsidiary of HYBE, a major South Korean entertainment company known for managing global K-pop sensation BTS, has unveiled the beta version of its AI voice conversion service called "Shift."The implications of Shift's capabilities are raising eyebrows. The technology stands to 'democratize' content creation by empowering individuals to produce diverse vocal outputs and narratives virtually. This eliminates the need for teams of voice actors, audio engineers, and creators."Youtubers often don't reveal their dual identities. Shift caters to that audience by enabling immersive role-play and disguised personas," Lee Kyo-gu, Supertone's CEO emphasized in an interview with The Miilk.At its core, Shift represents a significant move towards a future of near-zero marginal costs for content creation. AI voice synthesis like Supertone's also radically reduces the production costs and resources previously required. This cutting-edge technology could transform content production across K-pop, movies, YouTube, and beyond, ushering in an era of mass production that defies traditional constraints.
Sejin Kim 2024.05.22 14:22 PDT
안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 프리미엄 리포트 ‘위클리AI브리핑(Weekly AI Briefing)’입니다.한 주 동안 쏟아지는 AI 뉴스 홍수 속에서 놓치지 않고 꼭 챙겨봐야 할 정보를 선별해 드립니다. 핵심 요약으로 독자분들이 시간을 아낄 수 있도록 돕고 ‘실리콘밸리+실리콘앨리’ 현장에서 빅테크, 유망 스타트업의 움직임을 취재하는 더밀크만의 인사이트를 추가했습니다. 보다 자세한 내용은 더 알아보기 링크로 확인하실 수 있습니다.
박원익 2024.05.21 08:14 PDT
사티아 나델라 마이크로소프트(MS)가 비밀병기로 ‘온디바이스AI’를 내세웠다. 온디바이스AI 기기 자체에서 AI모델이 구동되는 기기다. 이때 퀄컴의 고성능 칩이 내장된 점을 강조하며 애플이 자체 개발 칩 M4를 장착해 판매하고 있는 맥북에어와 비교 효과를 노렸다. 20일(현지시각) 사티아 나델라 최고경영자(CEO)는 연례 개발자 회의 '빌드'(Build)를 하루 앞두고 미국 워싱턴주 레드몬드 캠퍼스에서 열린 미디어컨퍼런스와 월스트리트저널(WSJ)과의 인터뷰에서 새로운 PC '코파일럿+(플러스) PC'를 공개했다.코파일럿(Copilot)은 MS의 모든 제품에 탑재된 생성형 AI 모델을 말한다. 코파일럿플러스는 MS의 AI비서인 코파일럿의 유료 버전으로, MS의 365오피스프로그램과 연동, 워드·엑셀·파워포인트 작성을 도와주는 기능 등이 있다. '코파일럿플러스PC'는 생성형AI 구동에 최적화된 고성능 PC다. 자사 운영체제(OS)인 윈도우에 관련 기능이 내장된 형태라 서버와의 연결 없이도 AI 작업이 가능하다. 이른바 온디바이스 AI다. 나델라 CEO는 "지금까지 만들어진 것 중 가장 빠르고 AI를 지원하는 윈도우 PC"라며 "이제 컴퓨터가 우리를 이해할 뿐만 아니라 우리가 원하는 것을 예측할 수 있는 새로운 시대로 접어들고 있다"고 강조했다.
Sejin Kim 2024.05.20 19:03 PDT
“안녕 제미나이, 이 영화가 뭐지?”“닌자, 그리고 거북이를 그린 것 같네요. 영화 ‘닌자 거북이(Teenage Mutant Ninja Turtles)’인가요?”“맞았어!”15일(현지시각) 오전 캘리포니아주 마운틴뷰에 위치한 ‘쇼라인 앰피시어터(Shoreline Amphitheatre, 야외 원형 극장)’. 눈 부신 햇살 아래 형형색색의 부스들이 테마파크처럼 늘어선 야외 전시장에는 구글이 발표한 새로운 제품, 서비스, 기술을 체험해 보려는 개발자들로 가득했다. ‘AI 샌드박스’는 그중에서도 가장 많은 사람이 몰린 부스였다. 이번 ‘구글 I/O 2024(구글 연례 개발자 컨퍼런스)’에서 최초 공개, 큰 주목을 받은 ‘프로젝트 아스트라(Project Astra)’를 체험해 볼 수 있었기 때문이다.
박원익 2024.05.19 17:58 PDT
‘대작(大作)’이 가고 ‘다작(多作)’이 온다. 엔터테인먼트, 게임, 영화, 미디어 등 소위 콘텐츠를 제작하는 시스템은 거의 수공업에 가까웠다. K-팝 아이돌 한 팀을 양성하려면 연습생 모집부터 훈련, 데뷔에 5년 이상의 시간과 자원을 쏟아부어야 했다. 영화나 드라마, 게임 하나를 제작하는 데도 배우, 감독, 촬영 인원, 개발자, 장소 등 수많은 자원이 짧게는 수개월에서 수년 동안 필요했다. 인공지능(AI) 기술이 재편하는 그림은 명확하다. 이런 콘텐츠나 캐릭터 제작이 쉬워진다. 버추얼(가상)로 한 명이 다양한 버전을 만들 수 있다. AI 기업 수퍼톤(Supertone)은 AI 음성변환 서비스 ‘시프트(Shift)’로 이 제작 장벽을 낮추는 대표적인 회사다. 방탄소년단(BTS) 소속사 하이브(HYBE)가 이 수퍼톤의 대주주다. 👉 AI Voices Could Upend Economics of K-Pop Production하이브는 2021년 수퍼톤에 40억 원을 투자해 18.2%의 처음 지분을 취득한 후, 1월 450억원을 추가 투자해 보유 지분을 56.1%로 늘렸다. 이교구 수퍼톤 대표(CEO)는 더밀크와의 인터뷰에서 “지금도 정체성을 드러내지 않는 유튜버가 있지 않나”면서 “(시프트로) 다양한 역할을 몰입감 있게 전달할 수 있다”고 전했다. 이교구 대표는 1996년 서울대학교 전기공학부 학부를 거쳐 뉴욕대학교에서 음악기술 석사학위를, 스탠퍼드대에서 전기공학 석사 및 컴퓨터음악∙음향학 박사학위를 취득했다. 2009년 서울대학교 교수 부임 후 음성과 음악에 기계학습과 오디오 신호처리를 활용하는 연구를 수행하며 2020년 3월 수퍼톤을 창업했다.
Sejin Kim 2024.05.18 21:49 PDT
“인간이 AI(인공지능)와 사랑에 빠질 수 있다고 보시나요?”“먼저 아내에게 사랑한다는 말을 해야 할 것 같습니다.”(좌중 웃음)15일(현지시각) 캘리포니아주 마운틴뷰 구글 본사. 순다 피차이 구글 CEO의 답변에 취재진의 웃음이 터져 나왔다. 연례 개발자 컨퍼런스 ‘구글 I/O 2024’ 둘째 날 열린 글로벌 기자 간담회에서 이탈리아 기자로부터 예상치 못한 질문을 받자 피차이 CEO가 농담을 던진 것이다. 언뜻 엉뚱해 보일 수 있으나 전혀 맥락 없이 나온 질문은 아니었다. 이틀 전 오픈AI가 새로운 AI 모델 ‘GPT-4o’를 공개하자 “AI와 사랑에 빠지는 영화 ‘허(Her)’가 현실이 됐다”는 반응이 나왔기 때문이다. 오픈AI는 13일 GPT-4o가 스마트폰 카메라를 통해 사물을 인식, 인간과 관련 주제에 관해 실시간 음성 대화를 나누는 장면을 시연했다. 구글 역시 14일 진행한 구글 I/O 2024 기조연설에서 ‘프로젝트 아스트라(Project Astra)’를 공개하며 기술력을 뽐냈다. 시연에서 아스트라는 스마트폰 카메라를 통해 테이블 위에 놓인 사물을 인식하고 기억, 특정 사물(안경)의 위치를 알려달라는 사용자의 요청을 정확히 수행했다. 인간의 곁에서 인간을 돕는, 인간처럼 똑똑한 ‘AI 에이전트(agents, 대리인)’라는 미래 비전을 보여준 셈이다.
박원익 2024.05.16 03:11 PDT
세계경제포럼(다보스포럼·WEF)은 지난 1월 발간한 ‘글로벌 위험보고서 2024’에서 올해 세계가 직면할 위험 요인으로 ‘AI 생성 가짜 뉴스’를 지목했다. 전 세계에서 여러 선거가 진행되는데, AI로 만든 가짜 뉴스가 시민들의 잘못된 판단을 유도할 수 있다는 이유에서다. 올해 11월 대선을 앞둔 미국에서는 병원에 누워 있는 바이든 대통령, 감옥에 들어간 트럼프 전 대통령 등 악의적으로 조작된 이미지가 유포되기도 했다. 텍스트(text, 글) 역시 마찬가지다. 이미지, 동영상 못지않게 쉽게 생성이 가능하며 사람이 쓴 것과 구별이 어려울 정도로 정교해지는 추세다. AI로 만들어 낸 그럴듯한 허위 사실, 실체 없이 조작된 글을 구별하는 방법은 없을까? ‘신스ID(SynthID)’는 이런 문제를 풀기 위해 구글이 제시한 해결책이다. 구글은 14일(현지시각) 캘리포니아주 마운틴뷰에서 진행한 연례 개발자 컨퍼런스 ‘구글I/O 2024’에서 이미지, 오디오에 적용되던 신스ID 기술을 텍스트, 동영상으로 확장한다고 밝혔다.
박원익 2024.05.15 00:45 PDT
안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 프리미엄 리포트 ‘위클리AI브리핑(Weekly AI Briefing)’입니다.한 주 동안 쏟아지는 AI 뉴스 홍수 속에서 놓치지 않고 꼭 챙겨봐야 할 정보를 선별해 드립니다. 핵심 요약으로 독자분들이 시간을 아낄 수 있도록 돕고 ‘실리콘밸리+실리콘앨리’ 현장에서 빅테크, 유망 스타트업의 움직임을 취재하는 더밀크만의 인사이트를 추가했습니다. 보다 자세한 내용은 더 알아보기 링크로 확인하실 수 있습니다.
박원익 2024.05.14 05:06 PDT
요즘 ‘어린이’는 종이책을 넘기는 것보다 화면을 스와이프하는 게 익숙한 세대다. 알파세대로 대변되는 어린이는 코딩과 인공지능(AI) 교육을 받으며 자랐다. 알파 세대는 인스타그램과 아이패드가 출시된 해인 2010년부터 2020년대 중반까지 태어난 세대를 말한다. 기술과 가장 친숙하지만, 기술의 부작용에 대해 가장 취약할 수 있는 세대기도 하다. 알고리즘으로 시대는 점점 사실보다 감각이 중요해지고 있다. 인공지능(AI)으로 이 감각을 자극하는 허위, 가짜, 오류 정보는 더 정교하고 쉽게 생산되고 있다. 이들에게 소셜미디어(SNS)가 없는 세계는 상상할 수 없다. 앞으로도 평생을 기술과 함께할 세대기도 하다. 기술이 만든 세상이 전부인 어린이에게 어떻게 AI를 가르쳐야 할까?
Sejin Kim 2024.05.04 08:06 PDT
마이크로소프트(MS)가 범용 휴머노이드 로봇 개발을 위해 캐나다 소재 로봇기업 생츄어리AI(Sanctuary AI)와 파트너십을 맺었다고 밝혔습니다.지난 1일(현지시각) 테크크런치에 따르면 MS는 "인공지능(AI) 개발을 가속하고 하드웨어 설계에 필요한 파트너를 확보했다"라고 전했죠. 생츄어리AI는 MS와 AI 연구개발을 위해 기술을 제공하고 MS 애저 클라우드를 사용할 계획입니다.생츄어리AI는 대형언어모델(LLM)을 기반으로 로봇을 만들고 있으며 향후 실제 현실 세계에서 행동하는 '대형행동모델(Large Behavior Model)을 만드는 것을 목표로 하고 있습니다. 회사는 피닉스(Phoenix) 로봇의 AI 제어 시스템인 카본에 이러한 모델을 활용하고 있죠.조디 로즈 생츄어리AI 최고경영자(CEO)는 "인간처럼 생각하고 이해하는 시스템을 만드는 것은 인간이 직면할 가장 큰 문명 차원의 기술적 문제이자 기회 중 하나"라면서 "MS와 협력해 범용 로봇을 구동할 차세대 AI 모델을 개발할 수 있게 되어 기대가 크다"라고 밝혔습니다. 애슐리 로렌스 MS 리서치 기업 부사장 또한 "추론, 계획, 인간 에이전트와 같은 영역에서 AI 모델 혁신을 가속하는 연구를 구체화하기 위해 생츄어리AI와 협력하게 돼 기쁘다"라고 말했죠.👉 AI 만난 로봇공학에 돈 몰렸다최근 수개월 동안 휴머노이드 로봇 스타트업에 대한 투자가 늘고 있습니다. 상대적으로 업력이 짧은 데다 수익을 창출하지 않는다는 점을 고려했을 때 자금 규모는 상당합니다. 리서치 회사인 로봇 리포트의 데이터에 따르면, 2024년 1분기 로봇공학 스타트업은 32억달러의 자금을 조달했습니다. 1년 전 같은 기간의 17억달러에 비해 2배 많은 수치입니다. 투자는 소프트웨어와 하드웨어, 혹은 두 가지 모두를 개발하는 스타트업까지 가리지 않고 이어지는 양상이죠. 마이크로소프트는 최근 생츄어리AI 경쟁사인 피규어AI에도 투자했습니다. 2022년에 설립된 피규어는 올해 초 제프 베조스 아마존 창업자, 오픈AI, 엔비디아, 마이크로소프트 등으로부터 20억달러의 가치로 6억7500만달러(약 9000억원)를 모금했죠. 로봇용 AI 소프트웨어를 개발하는 스타트업 스킬드는 15억달러의 기업가치로 3억달러 규모의 자금 조달 계약에 임박한 것으로 알려졌고, 전 구글 직원과 스탠포드 대학, 캘리포니아 버클리대학 교수들이 설립한 피지컬인텔리전스는 약 4억달러의 기업가치로 7000만달러를 조달했습니다. 라시 그룸 피지컬인텔리전스 공동창업자는 “우리는 뇌(소프트웨어)를 만드는 데만 집중하고 있으며 신체에 구애받지 않는다”라고 말했습니다.
Sejin Kim 2024.05.03 18:52 PDT