Tags
“그록3(Grok 3 Beta Think)는 SOTA(State Of The Art, 최첨단) 모델의 영역에 있는 것 같습니다. 오픈AI의 가장 강력한 모델(o1-pro)과 비슷하고 딥시크(DeepSeek) R1 및 구글 제미나이 2.0 플래시 씽킹(Gemini 2.0 Flash Thinking)보다 약간 나은 느낌입니다.” 오픈AI 창업 멤버 출신인 AI 전문가 안드레 카파시는 “엑스AI(xAI) 팀이 최첨단 영역에 도달하는 데 걸린 시간은 전례가 없을 정도로 놀랍다”며 이같이 평가했다. xAI가 19일(현지시각) 공개한 AI 모델 그록3의 우수한 성능, 특히 짧은 기간에 성과를 냈다는 점이 놀랍다는 반응이었다. AI 모델 평가 업체 아티피셜 애널리시스가 21일 발표한 분석 결과도 비슷하다. 2024년 GPT-3.5 터보와 비슷한 성능의 ‘그록1’을 처음 선보였던 xAI는 단 1년 만에 최첨단 성능의 그록3를 출시, 오픈AI와 대등한 수준에 올라섰다. 일론 머스크 테슬라 CEO가 이끄는 AI 스타트업 xAI는 어떻게 이런 성과를 낼 수 있었을까. 그록3 출시에서 배울 수 있는 세 가지 교훈을 정리했다.
박원익 2025.02.27 14:58 PDT
‘답변 엔진(answer engine)’을 표방하는 AI 스타트업 퍼플렉시티(Perplexity)가 오픈AI가 선보인 것과 유사한 ‘딥 리서치(Deep Research)’ 기능을 출시했다.오픈AI의 딥 리서치는 월 200달러를 내야 하는 ‘챗GPT 프로’ 사용자만 사용할 수 있는 반면, 퍼플렉시티의 딥 리서치는 누구나 무료료 사용할 수 있다는 게 차이점이다. 퍼플렉시티 무료 사용자는 하루 5개 쿼리(query, 요청)를 사용할 수 있으며 유료인 ‘퍼플렉시티 프로’ 사용자는 하루 최대 500개 쿼리가 가능하다.
박원익 2025.02.14 21:23 PDT
오픈AI의 라이벌로 평가되는 미국 AI 스타트업 앤트로픽이 정중동(靜中動) 행보를 걷고 있다. 오픈AI와 비교할 때 상대적인 고요함을 유지하면서도 비용 절감 및 매출 증대를 동시에 달성하는 뛰어난 효율을 보여주고 있다는 평가다. 앤트로픽의 이런 움직임은 이미 지난 연말 발표된 멘로 벤처스의 데이터를 통해 한 차례 확인된 바 있다. 실리콘밸리 VC 멘로벤처스가 공개한 자료에 따르면 기반 모델(foundation model) 시장에서 앤트로픽은 24% 점유율을 기록, 2023년(12%) 대비 가장 큰 폭(12%포인트)의 성장을 기록했다. 오픈AI의 점유율이 50%에서 34%로 하락한 가운데, 점유율을 배로 늘리며 오픈AI의 강력한 대체재로 자리 잡은 것이다. 구글, 메타 등 기반 모델을 제공하는 빅테크도 제친 성과다.12일(현지시각) 디인포메이션의 보도에 따르면 2027년 앤트로픽의 API 기반 매출(애플리케이션 프로그래밍 인터페이스로 AI 모델을 제공해 올리는 매출)은 최대 345억달러(약 49조8300억원)에 달할 전망이다. 2027년 오픈AI의 매출 전망치 440억달러(약 63조6000억원)를 바짝 뒤쫓는 수치다.
박원익 2025.02.13 14:07 PDT
1. 오픈AI, GPT-5에 o3 통합해 출시... 로드맵 업데이트👉주요 내용:샘 알트만 오픈AI CEO는 12일(현지시각) X(옛 트위터)를 통해 GPT-5에 ‘사고 연쇄(chain-of-thought)’ 기능을 포함할 계획이라고 밝혔습니다. 이 기능은 추론 모델인 o1, o3에 적용됐던 기능으로 사고의 흐름을 단계별로 드러내 AI가 더 정교한 답변을 생성할 수 있게 도와줍니다. 원래 차기 모델로 계획됐던 o3 출시는 취소됐습니다. 향후 몇 주 안에 출시될 예정인 GPT-4.5가 오픈AI의 마지막 비 CoT 적용 모델로 남게 됩니다. 알트만 CEO는 몇 달 후 GPT-5가 공개되면 챗GPT 무료 사용자에게도 무제한 채팅을 제공할 것이라고 밝혔습니다. 📍의미 및 전망:이 결정은 일반 AI 모델과 추론 모델로 나뉘어 있던 제품 종류를 통합해 단순화하는 효과를 낳을 것으로 예측됩니다. 단순 답변을 생성하는 것을 넘어, 더 복잡한 사고 과정을 활용하는 방향으로 AI 서비스가 진화하고 있음을 보여줍니다. 사용자들은 앞으로 더 심도 있는 질의, 문제 해결을 기대할 수 있을 전망입니다. 2. DOGE, 미국 재무부 시스템 침해 우려 제기👉주요 내용:포린폴리시 보도에 따르면 정부효율부(DOGE)가 미국 재무부(Treasury) 시스템 및 기밀 데이터에 접근한 사례가 드러났습니다.포린폴리시는 이번 사건을 미국의 핵심 보안 원칙을 위협한 중대 위험으로 규정했습니다. 적대국들이 데이터 탈취 및 백도어 설치 공격에 악용할 가능성이 제기된다는 설명입니다.📍의미 및 전망:이번 침해 사건은 정부 기관 및 관련 기업들이 보안 체계를 재점검하고 강화할 필요성을 키습니다. 국제 사이버 보안 환경에 대한 경각심도 높이고 있습니다.3. 트럼프 행정부, CIO 전면 교체… 실리콘밸리 인재 영입👉주요 내용:와이어드에 따르면 최근 트럼프 행정부는 관리예산실(OMB), 연방인사관리처(OPM), 에너지부(DOE) 등 주요 정부 기관의 최고정보책임자(CIO)를 팔란티어(Palantir), 스페이스X(SpaceX) 등 실리콘밸리 출신 경영진으로 교체했습니다.이런 변화는 정부 IT 전략, 보안 정책 등에 민간의 혁신적 접근법을 도입하려는 의도로 해석됩니다.📍의미 및 전망:정부와 민간 기술 기업 간의 경계가 재정의되면서 IT 및 보안 정책에 실리콘밸리의 혁신적 요소가 반영될 것으로 보입니다. 향후 정부 IT 운영 방식에 큰 변화를 예고합니다.4. 사이버 범죄자-인질 스왑, 미국 교사 마크 포겔 석방👉주요 내용:뉴욕타임스 보도에 따르면 트럼프 행정부는 사이버 범죄자로 알려진 알렉산더 비닉을 러시아에 인도하는 대신, 미국 교사 마크 포겔을 석방하는 인질 교환 거래를 진행했습니다.뉴욕타임스는 이 거래가 사이버 보안과 외교 전략의 경계를 모호하게 하며 국제 관계 및 보안 정책에 중대한 영향을 미칠 수 있다고 평가했습니다.📍의미 및 전망:이러한 인질 스왑 거래는 국가 간 신뢰와 외교 관계에 대한 재고를 요구하고 있습니다. 사이버 범죄와 국제 정치가 복합적으로 작용하는 현대 보안 환경을 반영하는 사례입니다.5. 어도비, 파이어플라이 베타 공개… 5초 영상 생성 기능👉주요 내용:어도비는 새로 개편한 파이어플라이(Firefly) 웹 앱을 통해 1080p 해상도의 5초 영상 생성 기능을 공개 베타로 제공하기 시작했습니다.이번 업데이트로 어도비는 이미지 생성, 텍스트 번역, AI 크레딧 구독 등 다양한 AI 기반 콘텐츠 제작 기능을 함께 선보였습니다. 창작자들에게 혁신적 도구가 될 것이란 평가입니다.📍의미 및 전망:이번 파이어플라이 업데이트는 AI를 활용한 콘텐츠 제작의 새로운 표준을 제시했다는 평가를 받습니다. 크리에이터와 디자이너가 보다 효율적이고 창의적으로 작업할 수 있는 환경을 조성할 것으로 기대됩니다.6. 애플, 5년 건강 연구 프로그램 시작👉주요 내용:애플은 브리검 여성 병원(Brigham and Women’s Hospital)과 협력해 미국 아이폰 사용자를 대상으로 사용자의 자발적 참여에 기반한 5년 건강 연구 프로그램을 시작했습니다.애플 건강 앱(Health app)을 통해 수집된 방대한 사용자 건강 데이터는 향후 의료 인사이트 도출 및 건강 관리 혁신에 중요한 역할을 할 예정입니다.📍의미 및 전망:이번 연구는 디지털 헬스케어 분야에서 사용자 데이터를 통한 장기 연구가 어떻게 의료 혁신으로 이어질 수 있는지에 대한 가능성을 보여줄 전망입니다. 향후 개인 맞춤형 건강 관리와 의료 서비스 개선에도 기여할 것으로 예측됩니다.7. 트럼프, 애플 임원 등 실리콘밸리 인재 규제 기관에 지명👉주요 내용:트럼프 행정부는 애플 임원 조너선 모리슨(Jonathan Morrison)을 도로교통안전청(NHTSA) 수장 후보로 지명하는 한편, a16z 크립토(Crypto)의 브라이언 퀸텐츠(Brian Quintenz) 차기 상품선물거래위원회(CFTC) 위원장으로 지명할 계획으로 알려졌습니다. 조너선 굴드(Jonathan Gould)는 화폐감독관 후보, 조너선 맥커넌(Jonathan McKernan)은 소비자금융보호국(CFPB) 이사 후보 등 실리콘밸리 주요 인사들을 각종 규제 기관에 임명할 계획입니다.📍의미 및 전망:이런 인사 조치가 규제 정책에 민간의 혁신적 시각을 반영할 수 있는 기회가 될 수 있다는 평가가 나옵니다. 다만 부정적 영향도 있을 수 있기 때문에 향후 정부 정책 및 산업 전반에 미칠 영향에 관심이 집중되고 있습니다.8. 애플, 안드로이드용 애플 TV 앱 출시 👉주요 내용:애플이 안드로이드 사용자들을 위한 애플 TV 앱을 구글 플레이 스토어에 출시했습니다. 안드로이드 사용자도 세버런스를 비롯한 인기 TV 시리즈를 비롯해 메이저리그사커(MLS) 시즌 패스, 메이저리그베이스볼(MLB) 금요일 저녁 콘텐츠를 즐길 수 있습니다. 캐스팅(casting) 기능은 제공되지 않습니다.📍의미 및 전망:애플의 안드로이드 운영시스템(OS) 진출은 자사 콘텐츠 서비스의 사용자 기반 확대를 목표로 한 전략으로 해석됩니다. 안드로이드 생태계 내에서 애플 TV+ 및 스포츠 콘텐츠 서비스의 인지도를 높이는 계기가 될 것으로 예상됩니다.9. 구글 위협 인텔리전스, 러시아 등 사이버 범죄 활용 증가 경고👉주요 내용:구글 위협 지능 그룹(Google Threat Intelligence Group) 최신 보고서에 따르면 러시아 등 미국의 적대국들이 무료 공개 멀웨어(Malware, 악성 소프트웨어) 등을 활용해 공격을 강화하고 있는 것으로 나타났습니다.이러한 변화는 우크라이나 전쟁 이후 더욱 두드러지고 있으며 전 세계 사이버 보안 환경에 심각한 위협으로 작용하고 있다는 평가입니다. 📍의미 및 전망:이번 보고서는 사이버 보안 위협이 단순한 해킹을 넘어, 국가 간 전략적 도구로 활용되고 있음을 보여줍니다. 정부와 기업이 보안 강화 및 위협 대응 체계를 재정비할 필요가 있다는 점을 시사합니다.10. 마이크로소프트, 러시아 해킹 그룹 활동 상세 공개👉주요 내용:마이크로소프트는 러시아 해킹 그룹 샌드웜(Sandworm) 내부에서 ‘배드파일럿(BadPilot)’이라는 초기 침투(Initial Access) 팀의 존재 여부 및 활동을 공개했습니다. 이 팀은 미국, 영국, 캐나다, 호주 등 여러 주요 국가를 대상으로 한 사이버 공격의 초기 침투를 담당해 왔습니다.마이크로소프트에 따르면, 배드파일럿 팀은 샌드웜의 전반적 공격 전략에서 중요한 역할을 수행하며 침투 단계에서 네트워크 내부의 약점을 노리는 전략을 사용하고 있습니다.📍의미 및 전망:이번 발표는 국제 사이버 보안 환경의 복잡성과 심각성을 부각하고 있습니다. 각국 보안 기관, IT 기업이 더욱 긴밀하게 협력, 대응해야 할 필요성이 커졌습니다.
박원익 2025.02.12 17:52 PDT
“딥시크(DeepSeek)의 R1 출시는 맛집 레시피가 공개된 상황과 비슷합니다.”신정규 래블업 대표는 6일 더밀크가 주최한 ‘딥시크 쇼크 & 포스트 CES 산업별 집중분석 웨비나’에서 “현재 가장 곤란한 회사는 오픈AI일 것”이라며 이같이 말했다. 지금까지 오픈AI는 AI 업계에서 ‘독보적인 레시피(AI 모델 개발 비법)를 가진 미슐랭 쉐프’ 같은 지위를 유지해 왔는데, 중국 스타트업 딥시크의 부상으로 상황이 바뀌었다는 설명이다. 특히 오픈AI가 지난 9월 놀라운 성능의 추론 모델 ‘o1’을 처음 공개한 후 업계에서는 “AI 모델로 오픈AI와 경쟁하기는 힘들다”는 시각이 팽배했다. 하지만 딥시크가 o1과 비슷한 성능의 추론 모델 R1을 ‘오픈 웨이트(open-weights, 개방형 가중치)’로 공개하면서 분위기가 반전됐다. 오픈 웨이트란 AI 모델의 성능을 좌우하는 가중치(weights, 변수 간 연결 강도) 값을 공개한 모델을 말한다. 모델 크기를 이야기할 때 주로 언급하는 ‘매개변수(parameters)’가 가중치 역할을 수행한다. 연구자들은 모델이 이렇게 정해진 값에 따른 계산을 거친 후 적절한 답을 도출하는지 확인하는 과정을 반복하며 AI 모델을 개발한다.예컨대 반만 그린 고양이 그림을 주고, 나머지를 완성해 달라고 요청했을 때 실제 고양이와 흡사한 그림이 완성된다면 모델 내 존재하는 수십, 수천억 개의 매개변수, 즉 가중치 값이 잘 조정됐다고 말할 수 있다. AI업계에서는 공개된 R1의 가중치가 오픈AI o1 모델의 가중치와 비슷할 것으로 추측한다. 맛집의 비밀 레시피가 공개되자 이 레시피를 활용한 다른 식당들이 생겨나는 상황인 셈이다. 실제로 o1과 비슷한 오픈형 추론 모델이 우후죽순 등장하고 있다.
박원익 2025.02.06 13:21 PDT
안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 AI 뉴스레터 [박원익의 AI인사이트]입니다.“몇 년 후 혹은 더 빠른 시기에 (AI 모델의) ‘장기기억(long-term memory)’이 가능해질 것으로 생각합니다.” 샘 알트만 오픈AI CEO는 3일(현지시각) 일본 도쿄에서 진행된 손정의 소프트뱅크 그룹 회장과의 대담에서 “무한한(infinite) 장기기억을 가진 AI를 구축하기 위해 노력하고 있다”며 이같이 말했습니다. 한 사람의 인생 혹은 기업 전체를 AI가 이해할 수 있도록 만들겠다는 계획입니다.챗GPT가 현재의 메모리 한계(GPT-4 기준, 약 1만 단어)를 넘어서면 놀라운 일이 일어날 수 있습니다. 사용자의 과거 경험, 회사의 히스토리에 기반한 초개인형, 맞춤형 AI 비서, 연구자, 컨설턴트, 어드바이저를 활용할 수 있게 되기 때문입니다. AGI(범용인공지능)로 가는 길이죠. 이 비전을 이루려면 AI 반도체, 네트워크 장비, 스토리지(메모리 반도체), 서버 등 강력한 하드웨어로 구성된 데이터센터가 필요합니다. 소프트뱅크, 오라클 등과 함께 초대형 AI 인프라 벤처 ‘스타게이트’ 프로젝트를 추진 중인 그가 한국에서 삼성전자와 SK하이닉스를 만난 배경이 여기에 있습니다. 오픈AI는 AI 전용 모바일 기기 개발, 메신저 앱 카카오와의 협업 등 사용자 접점·데이터 확보를 위한 구상도 진행 중입니다.
박원익 2025.02.05 12:30 PDT
에단 몰릭 펜실베이니아대 와튼스쿨(경영학) 교수는 3일(현지시각) 자신의 뉴스레터를 통해 “오픈AI의 ‘딥 리서치(Deep Research)’는 고액 연봉의 전문가, 전문 컨설팅이 필요했던 작업을 수행할 수 있다”며 이같이 주장했다. 오픈AI가 2일 공개한 AI 에이전트(agent, 대리인) 기능 ‘딥 리서치’를 사용해 본 후 명확한 발전을 확인했다는 것이다. 그는 “사람의 개입 없이 특정 작업을 수행하는 자율 에이전트와 강력한 추론 전문 AI 모델(reasoner)이 딥 리서치로 수렴했다”며 “인간 전문가의 깊이로 연구를 수행하면서도 기계의 (빠른) 속도를 갖췄다”고 평가했다. 내부 평가도 긍정적이다. 피터 웰린더 오픈AI 제품 및 파트너십 담당 부사장은 전문 과학자의 딥 리서치 사용 사례를 X(옛 트위터)에 공유하며 “AI로 인한 과학 발전 가속화를 매우 낙관적으로 생각한다”며 “향후 5~10년 안에 대부분의 분야에서 생산성이 100배 향상될 것”이라고 했다.
박원익 2025.02.03 14:53 PDT
“딥리서치(Deep Research)는 마치 초능력(superpower)과 같습니다.”샘 알트만 오픈AI CEO는 2일(현지시각) “딥리서치 기능으로 인터넷을 사용해 복잡한 조사, 추론, 보고서 제작을 수행할 수 있다”며 이같이 말했다. 다소 느리지만, 포괄적이며 깊이 있는 작업이 가능한 보조 연구원처럼 이 기능을 활용할 수 있다는 설명이다. 오픈AI는 이날 회사 블로그를 통해 “딥리서치를 소개한다. 딥리서치는 추론(reasoning)을 사용해 대량의 온라인 정보를 종합, 여러 단계의 연구 작업을 완료하는 ‘에이전트(agent, 대리인)’”라고 설명했다. 딥리서치는 현재 챗GPT 프로(월 200달러) 사용자에게만 우선 제공되며 한 달에 100개 질문으로 사용량이 제한된다. 향후 챗GPT 플러스, 챗GPT 팀, 챗GPT 엔터프라이즈 사용자에게도 순차적으로 제공될 예정이다.
박원익 2025.02.02 20:15 PDT
“o3-미니(o3-mini)가 출시됐습니다. 챗GPT 사용자에게 무료로 제공합니다.”샘 알트만 오픈AI CEO는 31일(현지시각) X에 올린 글에서 “챗GPT 플러스(유료 플랜, 월 20달러)를 사용하면 더 나은 답변을 제공하는 ‘o3-미니-하이(high)’를 선택할 수 있다”며 이같이 밝혔다. 작년 12월 차세대 추론 특화 모델 o3, o3-미니를 공개한 후 약 한 달 보름 만에 경량 모델인 o3-미니를 먼저 출시한 것이다. 그는 “o3-미니는 똑똑하고 빠른 모델”이라며 “특히 높은 성능에 주목할 가치가 있다. API(애플리케이션 프로그래밍 인터페이스) 가격도 훌륭하게 제공한다”고 했다. 오픈AI에 따르면 o3-미니의 API 가격은 백만 토큰(token, 의미를 지닌 말의 최소 단위)당 입력(input) 1.10달러, 출력(output) 4.40달러로 책정됐다. o3-미니는 비전(vision, 시각 정보 이해) 기능이 없는 텍스트(text, 문자) 전용 모델이다.
박원익 2025.01.31 19:23 PDT
“딥시크(DeepSeek)의 ‘R1-제로(Zero)’는 자연어로 사람처럼 추론(reasoning)하는 기술을 보여줬습니다. 강화학습(Reinforcement Learning, RL)만으로 만들어낸 결과입니다.” 아라빈드 스리니바스 퍼플렉시티 CEO는 29일(현지시각) 중국 스타트업 딥시크가 개발한 AI 모델 R1의 논문 일부를 공개하며 이같이 말했다. 딥시크가 달성한 성과가 놀랍다며 회사를 치켜세운 것이다. 그가 공유한 논문에는 AI 모델이 수학 공식을 풀어내는 과정에서 사람처럼 스스로 방법을 알아내고, 이를 ‘깨달음의 순간(aha moment)’라고 표현하는 시연 장면이 등장한다. 논문에 따르면 딥시크는 사람이 데이터를 생성, 모델 개선에 도움을 주는 STF(Supervised Fine-Tuning, 지도 미세 조정) 방식이 아니라 별도의 지침 없이 강화학습만으로 이 결과를 얻었다. 마치 알파고가 별도의 지침 없이 바둑 두는 방법을 찾아낸 것처럼 기계 스스로 수학 문제 해결법을 찾아낸 것이다. 실리콘밸리 벤처캐피털 a16z의 마크 앤드리슨은 R1에 대해 “지금까지 내가 본 가장 놀랍고 인상적인 혁신 중 하나였다”고 평가하기도 했다. 딥시크는 어떻게 실리콘밸리를 충격과 흥분에 빠뜨릴 수 있었을까? 딥시크 설립자의 목표, 비전은 무엇일까?
박원익 2025.01.29 17:10 PDT
“딥시크(DeepSeek)의 추론 특화 모델 ‘R1’은 이미 같은 비용으로 오픈AI의 o3보다 나은 성능을 냅니다.”실리콘밸리 유명 벤처캐피털 멘로벤처스의 AI 분야 투자자 디디 다스(Deedy Das)는 27일(현지시각) “o1 모델 대비 25배 저렴하기만 게 아니다”라며 이같이 밝혔다. 자신의 X(옛 트위터) 계정에 오픈AI의 o3 성능 그래프 사진을 올리며 R1과 직접 비교한 것이다. 그가 공개한 그래프는 AI 모델의 코딩 실력을 평가하는 ‘코드포스(Codeforces)’ Elo 점수 차트. 저비용 환경에서 o3-미니(low) 대비 높은 성능을 발휘할 수 있다는 게 디디 다스의 설명이다. 1월 20일 R1 발표 직후 AI 업계는 R1이 저렴한 비용으로 오픈AI의 첫 번째 추론 특화 모델 ‘o1’과 대등한 성능을 기록했다는 점에 주목했다. 한데 그로부터 단 일주일 만에 R1이 o1의 후속 모델 o3를 능가한다는 분석이 나왔다. 오픈AI의 추론 특화 모델 o3는 지난 12월 20일에 공개된 것으로 아직 정식 출시도 되지 않은 모델이다.2023년 중국 항저우에 설립된 신생 스타트업이 실리콘밸리 프론티어(frontier, 최첨단) 기업 오픈AI를 능가했다는 소식은 업계를 깜짝 놀라게 하기 충분했다. 오픈AI 출신의 AI 전문가 아라빈드 스리니바스 퍼플렉시티 CEO가 “정말이냐?”는 댓글을 달며 놀라움을 표시했을 정도다. R1의 성능이 o3를 능가한다는 구체적 근거는 무엇일까. R1 벤치마크 점수의 의미, R1의 핵심 기술과 쟁점을 살펴봤다.
박원익 2025.01.27 14:19 PDT