Tags
설 연휴 시작부터 ‘딥시크(DeepSeek)’ 이야기를 몇 번이나 했는지 모르겠다. 명절 기간과 그 다음 주 동안 인터뷰 여섯 번과, 두 번의 내부 미팅, 두 번의 자문을 하고 나니 이제는 딥시크라는 단어만 들어도 도망가고 싶다. 기술적 배경을 포함해서 AI 업계가 앞으로 어떻게 변할지, 그리고 우리가 고민해야 할 방향이 무엇인지까지 묻는 내용들이 개발자 분들, 기자분들, 정책 담당하시는 분, 회사 구성원까지 다 다양한데, 겹치는 질문 내용들을 정리해 보면 몇 가지 가닥으로 요약이 된다. 이제 한 번의 광풍 지나갔으니 질문들을 요약한 것만 정리해 보려 한다. 크게 네 가지 질문이다. 아래 답변들은 짧게는 15분 길게는 두 시간씩 이야기하던 내용의 요약이다. 다른 분들이 많이 지식이나 견해 나눠주셔서 이제 많이들 아는 내용들은 다 빼고, 나머지 내용들 중에서 가능하면 프로그래머나 연구자가 아닌 분들에게도 익숙한 단어들을 사용했다.
신정규 2025.02.10 17:25 PDT
“딥시크(DeepSeek)의 R1 출시는 맛집 레시피가 공개된 상황과 비슷합니다.”신정규 래블업 대표는 6일 더밀크가 주최한 ‘딥시크 쇼크 & 포스트 CES 산업별 집중분석 웨비나’에서 “현재 가장 곤란한 회사는 오픈AI일 것”이라며 이같이 말했다. 지금까지 오픈AI는 AI 업계에서 ‘독보적인 레시피(AI 모델 개발 비법)를 가진 미슐랭 쉐프’ 같은 지위를 유지해 왔는데, 중국 스타트업 딥시크의 부상으로 상황이 바뀌었다는 설명이다. 특히 오픈AI가 지난 9월 놀라운 성능의 추론 모델 ‘o1’을 처음 공개한 후 업계에서는 “AI 모델로 오픈AI와 경쟁하기는 힘들다”는 시각이 팽배했다. 하지만 딥시크가 o1과 비슷한 성능의 추론 모델 R1을 ‘오픈 웨이트(open-weights, 개방형 가중치)’로 공개하면서 분위기가 반전됐다. 오픈 웨이트란 AI 모델의 성능을 좌우하는 가중치(weights, 변수 간 연결 강도) 값을 공개한 모델을 말한다. 모델 크기를 이야기할 때 주로 언급하는 ‘매개변수(parameters)’가 가중치 역할을 수행한다. 연구자들은 모델이 이렇게 정해진 값에 따른 계산을 거친 후 적절한 답을 도출하는지 확인하는 과정을 반복하며 AI 모델을 개발한다.예컨대 반만 그린 고양이 그림을 주고, 나머지를 완성해 달라고 요청했을 때 실제 고양이와 흡사한 그림이 완성된다면 모델 내 존재하는 수십, 수천억 개의 매개변수, 즉 가중치 값이 잘 조정됐다고 말할 수 있다. AI업계에서는 공개된 R1의 가중치가 오픈AI o1 모델의 가중치와 비슷할 것으로 추측한다. 맛집의 비밀 레시피가 공개되자 이 레시피를 활용한 다른 식당들이 생겨나는 상황인 셈이다. 실제로 o1과 비슷한 오픈형 추론 모델이 우후죽순 등장하고 있다.
박원익 2025.02.06 13:21 PDT
올해 글로벌 소매, 유통(Retail) 산업 최대 화두는 무엇일까? 역시 인공지능(AI)이었다. 그렇다면 소매 유통 기업들은 AI 기술을 어떻게 적용하려 할까? 지난 1월 12~13일 뉴욕에서 열린 세계 최대 소매·유통 박람회 'NRF 2025'에서는 전시 및 컨퍼런스 전반에 걸쳐 AI의 활용에 대한 아이디어와 사례가 쏟아졌다. 피치북은 ‘NRF2025에서 발견한 혁신 기술 리서치’ 보고서를 통해, 소매업계의 AI 활용이 생성AI를 넘어 자연어 처리(NLP)와 컴퓨터 비전 등으로 확장되고 있다고 분석했다.실제 일본 최대 홈쇼핑 사업자 QVC는 자연어 처리 기술을 활용해 라이브 스트리밍 중 잘 팔리는 제품을 분석하고 있으며, 패션 기업 H&M은 컴퓨터 비전과 저비용 전자태그(RFID)를 이용해 매장 내 상품과 고객 동선을 추적, 매출 확대를 시도하고 있다.RFID 기술은 이번 박람회에서 가장 주목받은 기술 중 하나였다. 딜라드(Dillard’s), 패블리틱스(Fabletics), 온(On) 등 여러 소매업체가 RFID를 활용해 공급망 가시성 개선, 재고 예측, 도난 및 분실 방지 등의 효과를 보고 있다. 보고서는 "칩 크기 축소와 정확도 향상으로 RFID 기술이 더욱 성장하고 있다"고 평가했다.
권순우 2025.01.30 05:20 PDT
안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 AI 뉴스레터 [박원익의 AI인사이트]입니다. 음력 정월 초하루에 인사드립니다. 새해 복 많이 받으세요. “오픈AI, 앤트로픽, 구글, 메타, 마이크로소프트, 아마존이 해내지 못한 일을 200명의 소규모 팀이 해냈다.” (디디 다스, 멘로벤처스 투자자)한국 설 연휴 기간 실리콘밸리는 중국 스타트업 딥시크(DeepSeek)가 개발한 추론 특화 AI 모델 ‘R1’으로 떠들썩했습니다. 실리콘밸리뿐만 아닙니다. 주식시장에서는 지난 27일(현지시각) 하루 만에 시가총액 5890억달러(약 846조원)가 증발한 엔비디아를 비롯해 브로드컴, 오라클이 각각 18.15%, 13.39% 하락하는 등 AI 관련 기술주 동반 폭락했습니다. 왜 이런 일이 벌어졌을까요? ‘딥시크 쇼크’ 속에서 어떤 교훈을 얻을 수 있을까요?
박원익 2025.01.29 09:24 PDT
중국 인공지능(AI) 스타트업 딥시크(DeepSeek)가 거센 파장을 일으키고 있다. 이미 딥시크의 애플 앱스토어 무료 다운로드 순위 1위 기록은 챗GPT의 지위를 위협하고 있다. 딥시크의 등장에 실리콘밸리와 월가 전역이 큰 충격을 받고 있는 모양새다. 딥시크가 천문학적 비용을 들여 개발 중인 오픈AI의 최신 모델을 구식으로 보이게 만들만큼 성능과 비용면에서 뛰어난 결과를 나타냈기 때문이다. 특히 딥시크가 기존 모델 개발에 필요한 막대한 비용을 극적으로 절감한 새로운 접근 방식을 선보인 것에 충격을 더하고 있다. 적은 비용과 최소한의 컴퓨팅 자원으로도 경쟁력 있는 AI 모델을 개발할 수 있음을 보여준 사례로 평가받는다. 실제 딥시크는 R1 모델 개발에 약 560만 달러를 투입했으며, 이는 오픈AI의 GPT-4 모델 개발에 소요된 약 6억 달러와 극명한 대조를 이룬다. 이 차이는 단순한 비용 절감의 문제를 넘어, AI 산업의 새로운 패러다임 전환을 암시한다.업계 관계자들은 "딥시크가 미국 경쟁사들의 1%에도 못 미치는 비용으로 AI 모델을 개발했다면, 이는 미국 AI 산업 전반의 비효율성과 과잉투자 문제를 드러낸 것"이라며 우려를 표명하고 있다.포브스도 "딥시크로 인해 미국이 최근 발표한 5000억 달러 규모의 '스타게이트 프로젝트'가 무의미해질 가능성이 제기되고 있다"고 분석했다.
권순우 2025.01.27 16:01 PDT
“딥시크(DeepSeek)의 추론 특화 모델 ‘R1’은 이미 같은 비용으로 오픈AI의 o3보다 나은 성능을 냅니다.”실리콘밸리 유명 벤처캐피털 멘로벤처스의 AI 분야 투자자 디디 다스(Deedy Das)는 27일(현지시각) “o1 모델 대비 25배 저렴하기만 게 아니다”라며 이같이 밝혔다. 자신의 X(옛 트위터) 계정에 오픈AI의 o3 성능 그래프 사진을 올리며 R1과 직접 비교한 것이다. 그가 공개한 그래프는 AI 모델의 코딩 실력을 평가하는 ‘코드포스(Codeforces)’ Elo 점수 차트. 저비용 환경에서 o3-미니(low) 대비 높은 성능을 발휘할 수 있다는 게 디디 다스의 설명이다. 1월 20일 R1 발표 직후 AI 업계는 R1이 저렴한 비용으로 오픈AI의 첫 번째 추론 특화 모델 ‘o1’과 대등한 성능을 기록했다는 점에 주목했다. 한데 그로부터 단 일주일 만에 R1이 o1의 후속 모델 o3를 능가한다는 분석이 나왔다. 오픈AI의 추론 특화 모델 o3는 지난 12월 20일에 공개된 것으로 아직 정식 출시도 되지 않은 모델이다.2023년 중국 항저우에 설립된 신생 스타트업이 실리콘밸리 프론티어(frontier, 최첨단) 기업 오픈AI를 능가했다는 소식은 업계를 깜짝 놀라게 하기 충분했다. 오픈AI 출신의 AI 전문가 아라빈드 스리니바스 퍼플렉시티 CEO가 “정말이냐?”는 댓글을 달며 놀라움을 표시했을 정도다. R1의 성능이 o3를 능가한다는 구체적 근거는 무엇일까. R1 벤치마크 점수의 의미, R1의 핵심 기술과 쟁점을 살펴봤다.
박원익 2025.01.27 14:19 PDT
김덕호 존스홉킨스대 의생명공학과 교수는 15일(현지시각) “활성화 기술(enabling technology)이 부상하고 있다”며 이같이 말했다. 신약 발견에 AI 기술을 활용하거나 디지털 트윈 기술 기반 시뮬레이션으로 임상 시험 효율을 높이는 형태의 ‘활성화 기술’이 제약·바이오·헬스케어 분야에서 부상하고 있다는 설명이다. 김 교수는 “과거 주먹구구식으로 진행되던 실험을 로봇 등 첨단 IT 기술을 활용해 자동화하는 랩 오토메이션도 활성화 기술 트렌드 중 하나”라며 “전통적인 제약, 바이오 연구에 이와 같은 플랫폼 기술이 융합돼야 혁신이 이뤄질 수 있다”고 했다. 그는 이어 “새롭게 부상하는 기술을 선점하면 한국도 북미, 유럽을 앞설 수 있다”며 “IT, 제조 기술에 강한 한국 기업들이 이 분야에서 많은 기회를 찾을 수 있을 것”이라고 했다. 헬스케어 분야는 내수 시장이 아닌 글로벌 시장을 공략해야 한다는 점도 강조했다. 실제로 시가총액 1위 테크 기업 엔비디아가 세계 최대 헬스케어 투자 행사 ‘JP모건 헬스케어 컨퍼런스’에 참여, AI 기술의 활용 및 융합을 강조해 화제가 되기도 했다. 젠슨 황 엔비디아 CEO는 JP모건 헬스케어에서 “AI의 추론, 계획, 행동 능력은 우리가 앞으로 나아갈 방향의 기초가 될 것”이라며 유전체 분석 기업 ‘일루미나(Illumina)’, 의료센터 ‘메이요 클리닉(Mayo Clinic)’, 임상 시험 기관 ‘아이큐비아(IQVIA)’와의 파트너십을 발표했다. 더밀크는 1월 13~16일 열린 JP모건 헬스케어 컨퍼런스 참석을 위해 샌프란시스코를 방문한 김 교수를 현장에서 만나 인터뷰를 진행했다. 다음은 인터뷰 전문
박원익 2025.01.24 17:12 PDT
오픈AI와 소프트뱅크가 초대형 AI 인프라 벤처 ‘스타게이트(Stargate)’에 380억달러(약 54조6000억원)를 투자한다. 전날 도널드 트럼프 미국 대통령이 백악관에서 손정의 소프트뱅크 그룹 회장, 래리 엘리슨 오라클 설립자, 샘 알트만 오픈AI CEO와 발표한 스타게이트 설립 구상과 관련, 구체적 숫자가 등장한 것이다. 스타게이트는 AI 인프라가 되는 대규모 데이터센터 구축 프로젝트다. 디인포메이션은 22일(현지시각) 오픈AI와 소프트뱅크가 각각 합작 벤처에 190억달러(약 27조원)씩 투자할 것이라고 보도했다. 샘 알트만 CEO가 오픈AI 일부 직원들에게 이와 같은 내용을 공유했다는 내용이다. 오픈AI가 스타게이트의 지분 40%를 보유하는 계획으로 알려졌다.트럼프 대통령은 스타게이트 설립을 발표하며 “역사상 가장 큰 AI 인프라 프로젝트로 10만 개 이상의 일자리를 창출할 회사가 등장할 것”이라며 향후 4년에 걸쳐 최대 5000억달러(약 718조원)를 투자할 것이라고 밝힌 바 있다.
박원익 2025.01.22 20:48 PDT
안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 AI 뉴스레터 [박원익의 AI인사이트]입니다. 매주 수요일 발행하는 ‘AI인사이트’를 통해 AI 리더들의 전략, 글로벌 테크업계 최신 흐름 및 중요 시그널을 놓치지 말고 확인하세요!“엔비디아 ‘젯슨 오린(Jetson Orin)’ 칩이 탑재돼 있습니다.”CES2025 기간 만난 중국 휴머노이드 로봇 개발사 ‘유니트리(Unitree Robotics)’ 직원은 “로봇의 실시간 제어가 어떻게 가능하느냐”는 질문에 이렇게 답했습니다. 자율주행차, 로봇 등에 탑재하는 엔비디아 반도체를 기반으로 ‘임바디드 AI(Embodied AI, 물리 장치에 내장돼 동작하는 AI)’를 구현한다는 설명이었습니다. 시연은 사람이 개입해 진행하지만, 개발은 로봇이 스스로 환경에 적응하고 대응할 수 있는 방향으로 진행되고 있다는 것입니다. 실제로 현장 곳곳에서 그런 트렌드를 확인할 수 있었습니다. 유니트리 외에도 중국 로봇 스타트업 ‘갤봇(Galbot)’이 개발한 휴머노이드가 전시돼 있었는데, 이 로봇은 인간의 조작 없이 카운터에서 고객의 주문을 받은 후 해당 상품을 뒤편 진열대에서 찾아 건네주는 행동이 가능했습니다. 이 회사 역시 엔비디아 칩을 사용하고 있었습니다.
박원익 2025.01.22 10:15 PDT
조 바이든 미국 행정부는 13일(현지시간) 인공지능(AI)을 구동하는 데 필요한 첨단 컴퓨터 칩의 수출을 제한하기 위한 조치를 발표했다. 중국의 'AI 굴기'를 겨냥한 조치였다고는 하나 퇴임을 불과 일주일 앞둔 시점에서 그의 행보에 의문 부호가 붙는다. 반도체 업계에서조차 "의견이 전혀 수렴되지 않았다"고 주장한다. 바이든 행정부의 급박한 AI칩 수출통제 조치와 관련, 타임 매거진은 "크리스마스 연휴 동안 AI 업계를 흔든 두 가지 주요 사건이 발단이 됐다"고 분석했다. 첫 번째 사건은 오픈AI가 새로운 모델 ‘o3’을 발표한 것이다. 이 모델은 기존 AI 시스템이 5% 이상 점수를 받은 적이 없는 고난도 추론 테스트에서 88%라는 경이적인 점수를 기록했다. 이와 관련 프랑수아 숄레 구글 전직 AI 연구원은 “AI의 역량에 대한 모든 직관을 재조정해야 할 것”이라고 말했다. 그는 “인공지능 일반지능(AGI, Artificial General Intelligence)이 조만간 실현될 것"이라는 주장에 회의적이었던 인물이다.
권순우 2025.01.14 13:25 PDT
조 바이든 미국 행정부가 임기를 일주일 앞두고 인공지능(AI) 개발을 위한 '최첨단 반도체 수출 규제'를 13일(현지시간) 발표했다. 이는 중국의 AI 반도체 공급망을 옥죄고, 동맹국을 중심으로만 첨단 반도체를 공급하기 위한 조치로 풀이된다.이날 미 상무부는 한국을 포함한 20개 '동맹국 및 협력국'을 지정하고, 해당 국가와 이에 속하지 않은 국가에 대한 AI 반도체 수출 규정을 발표했다. 이에 따르면 AI 연산을 처리하는 데이터 센터에 사용되는 반도체에 대해 3단계 허가 시스템을 도입하게 된다. 한국, 호주, 뉴질랜드, 대만, 네덜란드, 벨기에, 캐나다, 핀란드, 덴마크, 프랑스, 독일, 아일랜드, 이탈리아, 일본, 스페인, 스웨덴, 대만, 영국 등은 AI 반도체 판매에 제약이 없다. 구체적으로 최신 AI 칩을 최대 1700개까지 획득할 수 있으며, 추가 칩 획득, 미국 기술로 초대형 데이터 센터를 구축하는 일 등이 허용된다. 와이어드는 "반도체 설계, 제조, 저장 등 공급망 활동은 이번 조치의 적용을 받지 않는다"며 "메타(Meta)의 라마(Llama)와 같은 오픈 소스 AI 모델은 제한되지 않는다"고 설명했다. 반면 중국, 러시아, 북한 등을 포함한 20개국은 '우려 국가'로 지정하고, 기존 수출 통제를 유지하도록 했으며 두 그룹에 속하지 않은 국가들은 미국에서 수입할 수 있는 반도체 수량에 상한선을 설정할 예정이다. 이번 정책은 중국이 다른 국가를 통해 기존 미국의 제한을 우회하고, 핵무기 모델링부터 극초음속 미사일까지 다양한 기술에 활용될 수 있는 기술을 확보하려는 것을 막는 것을 목표로 하고 있다.제이크 설리번 미 국가안보보좌관은 “이 조치는 국제 파트너와 산업계에 더 큰 명확성을 제공하고, 미국의 첨단 기술을 악의적으로 활용하려는 우려 국가 및 악성 행위자들을 차단해 국가 안보 위험을 방지하려는 목적이 있다”고 밝혔다.
권순우 2025.01.13 14:17 PDT