Tags
안녕하세요 뷰스레터 구독자 여러분, 스핀오프 레터, [비저너리(Visionary)]의 김세진입니다.이번 주 기술 업계는 ‘목소리’가 지배했습니다. 배우 스칼렛 요한슨과 오픈AI의 목소리를 둘러싼 다툼이 계속되고 있습니다. 요한슨은 최근 내놓은 대형언어모델(LLM)GPT-4o에 기반한 챗GPT의 음성 서비스 5개 중 하나인 ‘스카이(Sky)’ 캐릭터가 자신의 목소리를 모방했다며 비판했습니다. 그는 샘 알트만 오픈AI 최고경영자(CEO)의 목소리 사용 제안을 거절했음에도 불구, 오픈AI가 챗GPT에 목소리를 장착했다는 의혹을 제기했죠. 이에 샘 알트만과 오픈AI의 행동에 실망했다는 목소리가 높아졌습니다. [주요기사]AI스타트업, 심판의 시간이 온다... 스트리밍은 스포츠로 눈귀 잡는다PC 아니라 AI 그 자체... 사티아 나델라 "맥북보다 58% 빠르다"'천비디아' 도달시킨 황의 법칙... 차세대 산업혁명 선포그러자 오픈AI는 23일(현지시각) 워싱턴포스트(WP)에 “사실이 아니다”라며 “전문 배우의 목소리”라고 반박에 나섰습니다. 스카이를 비롯한 챗GPT의 5개 목소리는 5개월에 걸친 섭외, 녹음을 거쳐 약 400개 가운데 선택된 것이라는 주장입니다. WP는 다수 인터뷰와 문건을 분석한 결과 오픈AI가 25∼45세의 따뜻하고 상냥하며 카리스마 있는 목소리를 요구했지만 요한슨과 똑같은 목소리를 요구하지는 않았다고 평가했습니다. 반박 보도에는 스카이가 내는 여자 음성을 만들 때 목소리 데이터를 제공한 성우의 성명도 담겼죠.
Sejin Kim 2024.05.24 12:29 PDT
‘대작(大作)’이 가고 ‘다작(多作)’이 온다. 엔터테인먼트, 게임, 영화, 미디어 등 소위 콘텐츠를 제작하는 시스템은 거의 수공업에 가까웠다. K-팝 아이돌 한 팀을 양성하려면 연습생 모집부터 훈련, 데뷔에 5년 이상의 시간과 자원을 쏟아부어야 했다. 영화나 드라마, 게임 하나를 제작하는 데도 배우, 감독, 촬영 인원, 개발자, 장소 등 수많은 자원이 짧게는 수개월에서 수년 동안 필요했다. 인공지능(AI) 기술이 재편하는 그림은 명확하다. 이런 콘텐츠나 캐릭터 제작이 쉬워진다. 버추얼(가상)로 한 명이 다양한 버전을 만들 수 있다. AI 기업 수퍼톤(Supertone)은 AI 음성변환 서비스 ‘시프트(Shift)’로 이 제작 장벽을 낮추는 대표적인 회사다. 방탄소년단(BTS) 소속사 하이브(HYBE)가 이 수퍼톤의 대주주다. 👉 AI Voices Could Upend Economics of K-Pop Production하이브는 2021년 수퍼톤에 40억 원을 투자해 18.2%의 처음 지분을 취득한 후, 1월 450억원을 추가 투자해 보유 지분을 56.1%로 늘렸다. 이교구 수퍼톤 대표(CEO)는 더밀크와의 인터뷰에서 “지금도 정체성을 드러내지 않는 유튜버가 있지 않나”면서 “(시프트로) 다양한 역할을 몰입감 있게 전달할 수 있다”고 전했다. 이교구 대표는 1996년 서울대학교 전기공학부 학부를 거쳐 뉴욕대학교에서 음악기술 석사학위를, 스탠퍼드대에서 전기공학 석사 및 컴퓨터음악∙음향학 박사학위를 취득했다. 2009년 서울대학교 교수 부임 후 음성과 음악에 기계학습과 오디오 신호처리를 활용하는 연구를 수행하며 2020년 3월 수퍼톤을 창업했다.
Sejin Kim 2024.05.18 21:49 PDT