O3 - 더밀크 | The Miilk

‘따라올 테면 따라와 봐’ 오픈AI, o3·o4-미니 출시... 이미지로 추론

오픈AI가 16일(현지시각) 두 개의 새로운 AI 추론(reasoning) 모델 o3와 o4-미니를 출시했다. 14일 GPT-4.1 모델을 출시한 지 불과 이틀 만에 두 개의 새로운 모델을 선보였다.오픈AI는 이날 회사 블로그를 통해 “응답하기 전 더 오래 생각하도록 훈련된 최신 o-시리즈 모델인 o3와 o4-미니(o4-mini)를 출시한다”며 “지금까지 출시된 모델 중 가장 똑똑한 모델”이라고 밝혔다. 이미지 기반으로 ‘생각(think)’을 할 수 있다는 점이 o3 및 o4-미니의 가장 큰 특징이다. 이미지를 AI 모델의 추론(reasoning, 사고) 과정에 통합할 수 있다는 의미다. 사용자의 손 그림, 화이트보드에 그린 그림 같은 것을 AI 모델에 보여주며 질문을 하거나 생각을 거친 답변을 얻을 수 있는 식이다. 또한 모델이 추론 과정의 일환으로 이미지를 확대하거나 회전시켜 조정할 수도 있다. 오픈AI는 “이미지가 흐릿하거나 반전돼 있거나 품질이 낮은 경우에도 모델이 이를 해석할 수 있다”며 “추론 과정의 일부로 이미지를 회전, 확대, 축소 또는 변형하는 등 즉석에서 이미지를 조작하는 것도 가능하다”고 설명했다.

박원익 2025.04.16 14:49 PDT

“좋은 소식 시작”... 오픈AI, 질주는 계속된다

안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 AI 뉴스레터 [박원익의 AI인사이트]입니다. “이번 주에는 여러분을 위한 좋은 소식이 많이 있습니다!”샘 알트만 오픈AI CEO는 13일(현지시각) 소셜미디어 X를 통해 “내일부터 시작된다”며 이같이 밝혔습니다. 첫 번째는 14일 월요일 공개한 ‘GPT-4.1’이었습니다. 앞서 2월 말 GPT-4.5를 출시한 이후 약 6주 만에 새로운 AI 모델을 내놓은 것입니다. API(애플리케이션 프로그래밍 인터페이스)로 사용할 수 있는 GPT-4.1은 최대 100만 토큰의 ‘컨텍스트창(context window, 한 번에 입력할 수 있는 텍스트 양)’을 제공하며 GPT-4o보다 22%p, GPT-4.5보다 17%p 높은 코딩(SWE‑bench Verified) 정확도를 기록했습니다.

박원익 2025.04.16 14:21 PDT

샘 알트만 “몇 주 내 o3·o4-미니 출시”... 훨씬 강력한 GPT-5 온다

샘 알트만 오픈AI CEO가 새로운 AI 모델 출시 일정을 공개했다. 추론(reasoning) 특화 모델인 o3를 독립 모델로 출시하지 않고 GPT-5에 통합하겠다는 기존 계획을 변경했다.알트만 CEO는 4일(현지시각) 소셜미디어 X를 통해 “계획이 변경됐다. 몇 주 내 o3와 o4-미니(mini)를 출시하고, 몇 달 안에 GPT-5를 출시할 예정”이라고 밝혔다.

박원익 2025.04.04 15:18 PDT

알리바바 QwQ-32B, 수학 추론 딥시크 능가… 中 오픈 모델 파상공세

중국 기술 기업 알리바바가 강력한 성능의 추론 모델 ‘QwQ-32B’을 오픈 소스로 출시했다. 지난 2월 27일 동영상 생성 모델 Wan2.1을 오픈 소스로 공개한 지 1주일 만이다. 오픈 소스 모델을 앞세워 클라우드, AI 생태계를 확장하려는 의도로 풀이된다. 딥시크 R1에 이어 미국과 중국의 AI 기술 전쟁이 더 치열해 질 전망이다.

박원익 2025.03.06 14:21 PDT

‘스케일링 법칙’ 결국 승리한다… 그록3로 본 세 가지 교훈

“그록3(Grok 3 Beta Think)는 SOTA(State Of The Art, 최첨단) 모델의 영역에 있는 것 같습니다. 오픈AI의 가장 강력한 모델(o1-pro)과 비슷하고 딥시크(DeepSeek) R1 및 구글 제미나이 2.0 플래시 씽킹(Gemini 2.0 Flash Thinking)보다 약간 나은 느낌입니다.” 오픈AI 창업 멤버 출신인 AI 전문가 안드레 카파시는 “엑스AI(xAI) 팀이 최첨단 영역에 도달하는 데 걸린 시간은 전례가 없을 정도로 놀랍다”며 이같이 평가했다. xAI가 19일(현지시각) 공개한 AI 모델 그록3의 우수한 성능, 특히 짧은 기간에 성과를 냈다는 점이 놀랍다는 반응이었다. AI 모델 평가 업체 아티피셜 애널리시스가 21일 발표한 분석 결과도 비슷하다. 2024년 GPT-3.5 터보와 비슷한 성능의 ‘그록1’을 처음 선보였던 xAI는 단 1년 만에 최첨단 성능의 그록3를 출시, 오픈AI와 대등한 수준에 올라섰다. 일론 머스크 테슬라 CEO가 이끄는 AI 스타트업 xAI는 어떻게 이런 성과를 낼 수 있었을까. 그록3 출시에서 배울 수 있는 세 가지 교훈을 정리했다.

박원익 2025.02.27 14:58 PDT

퍼플렉시티 ‘딥 리서치’ 딥시크 제치고 2위 껑충... 업계 평가는?

‘답변 엔진(answer engine)’을 표방하는 AI 스타트업 퍼플렉시티(Perplexity)가 오픈AI가 선보인 것과 유사한 ‘딥 리서치(Deep Research)’ 기능을 출시했다.오픈AI의 딥 리서치는 월 200달러를 내야 하는 ‘챗GPT 프로’ 사용자만 사용할 수 있는 반면, 퍼플렉시티의 딥 리서치는 누구나 무료료 사용할 수 있다는 게 차이점이다. 퍼플렉시티 무료 사용자는 하루 5개 쿼리(query, 요청)를 사용할 수 있으며 유료인 ‘퍼플렉시티 프로’ 사용자는 하루 최대 500개 쿼리가 가능하다.

박원익 2025.02.14 21:23 PDT

앤트로픽, 매출 50조 달성할까... 비밀 무기 ‘하이브리드 모델’

오픈AI의 라이벌로 평가되는 미국 AI 스타트업 앤트로픽이 정중동(靜中動) 행보를 걷고 있다. 오픈AI와 비교할 때 상대적인 고요함을 유지하면서도 비용 절감 및 매출 증대를 동시에 달성하는 뛰어난 효율을 보여주고 있다는 평가다. 앤트로픽의 이런 움직임은 이미 지난 연말 발표된 멘로 벤처스의 데이터를 통해 한 차례 확인된 바 있다. 실리콘밸리 VC 멘로벤처스가 공개한 자료에 따르면 기반 모델(foundation model) 시장에서 앤트로픽은 24% 점유율을 기록, 2023년(12%) 대비 가장 큰 폭(12%포인트)의 성장을 기록했다. 오픈AI의 점유율이 50%에서 34%로 하락한 가운데, 점유율을 배로 늘리며 오픈AI의 강력한 대체재로 자리 잡은 것이다. 구글, 메타 등 기반 모델을 제공하는 빅테크도 제친 성과다.12일(현지시각) 디인포메이션의 보도에 따르면 2027년 앤트로픽의 API 기반 매출(애플리케이션 프로그래밍 인터페이스로 AI 모델을 제공해 올리는 매출)은 최대 345억달러(약 49조8300억원)에 달할 전망이다. 2027년 오픈AI의 매출 전망치 440억달러(약 63조6000억원)를 바짝 뒤쫓는 수치다.

박원익 2025.02.13 14:07 PDT

[오늘의 테크뉴스 톱10] 샘 알트만 “o3 통합 GPT-5 출시”

1. 오픈AI, GPT-5에 o3 통합해 출시... 로드맵 업데이트👉주요 내용:샘 알트만 오픈AI CEO는 12일(현지시각) X(옛 트위터)를 통해 GPT-5에 ‘사고 연쇄(chain-of-thought)’ 기능을 포함할 계획이라고 밝혔습니다. 이 기능은 추론 모델인 o1, o3에 적용됐던 기능으로 사고의 흐름을 단계별로 드러내 AI가 더 정교한 답변을 생성할 수 있게 도와줍니다. 원래 차기 모델로 계획됐던 o3 출시는 취소됐습니다. 향후 몇 주 안에 출시될 예정인 GPT-4.5가 오픈AI의 마지막 비 CoT 적용 모델로 남게 됩니다. 알트만 CEO는 몇 달 후 GPT-5가 공개되면 챗GPT 무료 사용자에게도 무제한 채팅을 제공할 것이라고 밝혔습니다. 📍의미 및 전망:이 결정은 일반 AI 모델과 추론 모델로 나뉘어 있던 제품 종류를 통합해 단순화하는 효과를 낳을 것으로 예측됩니다. 단순 답변을 생성하는 것을 넘어, 더 복잡한 사고 과정을 활용하는 방향으로 AI 서비스가 진화하고 있음을 보여줍니다. 사용자들은 앞으로 더 심도 있는 질의, 문제 해결을 기대할 수 있을 전망입니다. 2. DOGE, 미국 재무부 시스템 침해 우려 제기👉주요 내용:포린폴리시 보도에 따르면 정부효율부(DOGE)가 미국 재무부(Treasury) 시스템 및 기밀 데이터에 접근한 사례가 드러났습니다.포린폴리시는 이번 사건을 미국의 핵심 보안 원칙을 위협한 중대 위험으로 규정했습니다. 적대국들이 데이터 탈취 및 백도어 설치 공격에 악용할 가능성이 제기된다는 설명입니다.📍의미 및 전망:이번 침해 사건은 정부 기관 및 관련 기업들이 보안 체계를 재점검하고 강화할 필요성을 키습니다. 국제 사이버 보안 환경에 대한 경각심도 높이고 있습니다.3. 트럼프 행정부, CIO 전면 교체… 실리콘밸리 인재 영입👉주요 내용:와이어드에 따르면 최근 트럼프 행정부는 관리예산실(OMB), 연방인사관리처(OPM), 에너지부(DOE) 등 주요 정부 기관의 최고정보책임자(CIO)를 팔란티어(Palantir), 스페이스X(SpaceX) 등 실리콘밸리 출신 경영진으로 교체했습니다.이런 변화는 정부 IT 전략, 보안 정책 등에 민간의 혁신적 접근법을 도입하려는 의도로 해석됩니다.📍의미 및 전망:정부와 민간 기술 기업 간의 경계가 재정의되면서 IT 및 보안 정책에 실리콘밸리의 혁신적 요소가 반영될 것으로 보입니다. 향후 정부 IT 운영 방식에 큰 변화를 예고합니다.4. 사이버 범죄자-인질 스왑, 미국 교사 마크 포겔 석방👉주요 내용:뉴욕타임스 보도에 따르면 트럼프 행정부는 사이버 범죄자로 알려진 알렉산더 비닉을 러시아에 인도하는 대신, 미국 교사 마크 포겔을 석방하는 인질 교환 거래를 진행했습니다.뉴욕타임스는 이 거래가 사이버 보안과 외교 전략의 경계를 모호하게 하며 국제 관계 및 보안 정책에 중대한 영향을 미칠 수 있다고 평가했습니다.📍의미 및 전망:이러한 인질 스왑 거래는 국가 간 신뢰와 외교 관계에 대한 재고를 요구하고 있습니다. 사이버 범죄와 국제 정치가 복합적으로 작용하는 현대 보안 환경을 반영하는 사례입니다.5. 어도비, 파이어플라이 베타 공개… 5초 영상 생성 기능👉주요 내용:어도비는 새로 개편한 파이어플라이(Firefly) 웹 앱을 통해 1080p 해상도의 5초 영상 생성 기능을 공개 베타로 제공하기 시작했습니다.이번 업데이트로 어도비는 이미지 생성, 텍스트 번역, AI 크레딧 구독 등 다양한 AI 기반 콘텐츠 제작 기능을 함께 선보였습니다. 창작자들에게 혁신적 도구가 될 것이란 평가입니다.📍의미 및 전망:이번 파이어플라이 업데이트는 AI를 활용한 콘텐츠 제작의 새로운 표준을 제시했다는 평가를 받습니다. 크리에이터와 디자이너가 보다 효율적이고 창의적으로 작업할 수 있는 환경을 조성할 것으로 기대됩니다.6. 애플, 5년 건강 연구 프로그램 시작👉주요 내용:애플은 브리검 여성 병원(Brigham and Women’s Hospital)과 협력해 미국 아이폰 사용자를 대상으로 사용자의 자발적 참여에 기반한 5년 건강 연구 프로그램을 시작했습니다.애플 건강 앱(Health app)을 통해 수집된 방대한 사용자 건강 데이터는 향후 의료 인사이트 도출 및 건강 관리 혁신에 중요한 역할을 할 예정입니다.📍의미 및 전망:이번 연구는 디지털 헬스케어 분야에서 사용자 데이터를 통한 장기 연구가 어떻게 의료 혁신으로 이어질 수 있는지에 대한 가능성을 보여줄 전망입니다. 향후 개인 맞춤형 건강 관리와 의료 서비스 개선에도 기여할 것으로 예측됩니다.7. 트럼프, 애플 임원 등 실리콘밸리 인재 규제 기관에 지명👉주요 내용:트럼프 행정부는 애플 임원 조너선 모리슨(Jonathan Morrison)을 도로교통안전청(NHTSA) 수장 후보로 지명하는 한편, a16z 크립토(Crypto)의 브라이언 퀸텐츠(Brian Quintenz) 차기 상품선물거래위원회(CFTC) 위원장으로 지명할 계획으로 알려졌습니다. 조너선 굴드(Jonathan Gould)는 화폐감독관 후보, 조너선 맥커넌(Jonathan McKernan)은 소비자금융보호국(CFPB) 이사 후보 등 실리콘밸리 주요 인사들을 각종 규제 기관에 임명할 계획입니다.📍의미 및 전망:이런 인사 조치가 규제 정책에 민간의 혁신적 시각을 반영할 수 있는 기회가 될 수 있다는 평가가 나옵니다. 다만 부정적 영향도 있을 수 있기 때문에 향후 정부 정책 및 산업 전반에 미칠 영향에 관심이 집중되고 있습니다.8. 애플, 안드로이드용 애플 TV 앱 출시 👉주요 내용:애플이 안드로이드 사용자들을 위한 애플 TV 앱을 구글 플레이 스토어에 출시했습니다. 안드로이드 사용자도 세버런스를 비롯한 인기 TV 시리즈를 비롯해 메이저리그사커(MLS) 시즌 패스, 메이저리그베이스볼(MLB) 금요일 저녁 콘텐츠를 즐길 수 있습니다. 캐스팅(casting) 기능은 제공되지 않습니다.📍의미 및 전망:애플의 안드로이드 운영시스템(OS) 진출은 자사 콘텐츠 서비스의 사용자 기반 확대를 목표로 한 전략으로 해석됩니다. 안드로이드 생태계 내에서 애플 TV+ 및 스포츠 콘텐츠 서비스의 인지도를 높이는 계기가 될 것으로 예상됩니다.9. 구글 위협 인텔리전스, 러시아 등 사이버 범죄 활용 증가 경고👉주요 내용:구글 위협 지능 그룹(Google Threat Intelligence Group) 최신 보고서에 따르면 러시아 등 미국의 적대국들이 무료 공개 멀웨어(Malware, 악성 소프트웨어) 등을 활용해 공격을 강화하고 있는 것으로 나타났습니다.이러한 변화는 우크라이나 전쟁 이후 더욱 두드러지고 있으며 전 세계 사이버 보안 환경에 심각한 위협으로 작용하고 있다는 평가입니다. 📍의미 및 전망:이번 보고서는 사이버 보안 위협이 단순한 해킹을 넘어, 국가 간 전략적 도구로 활용되고 있음을 보여줍니다. 정부와 기업이 보안 강화 및 위협 대응 체계를 재정비할 필요가 있다는 점을 시사합니다.10. 마이크로소프트, 러시아 해킹 그룹 활동 상세 공개👉주요 내용:마이크로소프트는 러시아 해킹 그룹 샌드웜(Sandworm) 내부에서 ‘배드파일럿(BadPilot)’이라는 초기 침투(Initial Access) 팀의 존재 여부 및 활동을 공개했습니다. 이 팀은 미국, 영국, 캐나다, 호주 등 여러 주요 국가를 대상으로 한 사이버 공격의 초기 침투를 담당해 왔습니다.마이크로소프트에 따르면, 배드파일럿 팀은 샌드웜의 전반적 공격 전략에서 중요한 역할을 수행하며 침투 단계에서 네트워크 내부의 약점을 노리는 전략을 사용하고 있습니다.📍의미 및 전망:이번 발표는 국제 사이버 보안 환경의 복잡성과 심각성을 부각하고 있습니다. 각국 보안 기관, IT 기업이 더욱 긴밀하게 협력, 대응해야 할 필요성이 커졌습니다.

박원익 2025.02.12 17:52 PDT

“딥시크, 맛집 레시피 공개한 셈”... 오픈 추론 모델 몰려온다

“딥시크(DeepSeek)의 R1 출시는 맛집 레시피가 공개된 상황과 비슷합니다.”신정규 래블업 대표는 6일 더밀크가 주최한 ‘딥시크 쇼크 & 포스트 CES 산업별 집중분석 웨비나’에서 “현재 가장 곤란한 회사는 오픈AI일 것”이라며 이같이 말했다. 지금까지 오픈AI는 AI 업계에서 ‘독보적인 레시피(AI 모델 개발 비법)를 가진 미슐랭 쉐프’ 같은 지위를 유지해 왔는데, 중국 스타트업 딥시크의 부상으로 상황이 바뀌었다는 설명이다. 특히 오픈AI가 지난 9월 놀라운 성능의 추론 모델 ‘o1’을 처음 공개한 후 업계에서는 “AI 모델로 오픈AI와 경쟁하기는 힘들다”는 시각이 팽배했다. 하지만 딥시크가 o1과 비슷한 성능의 추론 모델 R1을 ‘오픈 웨이트(open-weights, 개방형 가중치)’로 공개하면서 분위기가 반전됐다. 오픈 웨이트란 AI 모델의 성능을 좌우하는 가중치(weights, 변수 간 연결 강도) 값을 공개한 모델을 말한다. 모델 크기를 이야기할 때 주로 언급하는 ‘매개변수(parameters)’가 가중치 역할을 수행한다. 연구자들은 모델이 이렇게 정해진 값에 따른 계산을 거친 후 적절한 답을 도출하는지 확인하는 과정을 반복하며 AI 모델을 개발한다.예컨대 반만 그린 고양이 그림을 주고, 나머지를 완성해 달라고 요청했을 때 실제 고양이와 흡사한 그림이 완성된다면 모델 내 존재하는 수십, 수천억 개의 매개변수, 즉 가중치 값이 잘 조정됐다고 말할 수 있다. AI업계에서는 공개된 R1의 가중치가 오픈AI o1 모델의 가중치와 비슷할 것으로 추측한다. 맛집의 비밀 레시피가 공개되자 이 레시피를 활용한 다른 식당들이 생겨나는 상황인 셈이다. 실제로 o1과 비슷한 오픈형 추론 모델이 우후죽순 등장하고 있다.

박원익 2025.02.06 13:21 PDT

샘 알트만은 무슨 생각을 하는 것일까?

안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 AI 뉴스레터 [박원익의 AI인사이트]입니다.“몇 년 후 혹은 더 빠른 시기에 (AI 모델의) ‘장기기억(long-term memory)’이 가능해질 것으로 생각합니다.” 샘 알트만 오픈AI CEO는 3일(현지시각) 일본 도쿄에서 진행된 손정의 소프트뱅크 그룹 회장과의 대담에서 “무한한(infinite) 장기기억을 가진 AI를 구축하기 위해 노력하고 있다”며 이같이 말했습니다. 한 사람의 인생 혹은 기업 전체를 AI가 이해할 수 있도록 만들겠다는 계획입니다.챗GPT가 현재의 메모리 한계(GPT-4 기준, 약 1만 단어)를 넘어서면 놀라운 일이 일어날 수 있습니다. 사용자의 과거 경험, 회사의 히스토리에 기반한 초개인형, 맞춤형 AI 비서, 연구자, 컨설턴트, 어드바이저를 활용할 수 있게 되기 때문입니다. AGI(범용인공지능)로 가는 길이죠. 이 비전을 이루려면 AI 반도체, 네트워크 장비, 스토리지(메모리 반도체), 서버 등 강력한 하드웨어로 구성된 데이터센터가 필요합니다. 소프트뱅크, 오라클 등과 함께 초대형 AI 인프라 벤처 ‘스타게이트’ 프로젝트를 추진 중인 그가 한국에서 삼성전자와 SK하이닉스를 만난 배경이 여기에 있습니다. 오픈AI는 AI 전용 모바일 기기 개발, 메신저 앱 카카오와의 협업 등 사용자 접점·데이터 확보를 위한 구상도 진행 중입니다.

박원익 2025.02.05 12:30 PDT

‘박사급 AI’ 딥 리서치, 전문가 대체?... 세 가지 미래 전망

에단 몰릭 펜실베이니아대 와튼스쿨(경영학) 교수는 3일(현지시각) 자신의 뉴스레터를 통해 “오픈AI의 ‘딥 리서치(Deep Research)’는 고액 연봉의 전문가, 전문 컨설팅이 필요했던 작업을 수행할 수 있다”며 이같이 주장했다. 오픈AI가 2일 공개한 AI 에이전트(agent, 대리인) 기능 ‘딥 리서치’를 사용해 본 후 명확한 발전을 확인했다는 것이다. 그는 “사람의 개입 없이 특정 작업을 수행하는 자율 에이전트와 강력한 추론 전문 AI 모델(reasoner)이 딥 리서치로 수렴했다”며 “인간 전문가의 깊이로 연구를 수행하면서도 기계의 (빠른) 속도를 갖췄다”고 평가했다. 내부 평가도 긍정적이다. 피터 웰린더 오픈AI 제품 및 파트너십 담당 부사장은 전문 과학자의 딥 리서치 사용 사례를 X(옛 트위터)에 공유하며 “AI로 인한 과학 발전 가속화를 매우 낙관적으로 생각한다”며 “향후 5~10년 안에 대부분의 분야에서 생산성이 100배 향상될 것”이라고 했다.

박원익 2025.02.03 14:53 PDT

샘 알트만 “이건 마치 초능력”… 에이전트 ‘딥리서치’ 3대 특징은?

“딥리서치(Deep Research)는 마치 초능력(superpower)과 같습니다.”샘 알트만 오픈AI CEO는 2일(현지시각) “딥리서치 기능으로 인터넷을 사용해 복잡한 조사, 추론, 보고서 제작을 수행할 수 있다”며 이같이 말했다. 다소 느리지만, 포괄적이며 깊이 있는 작업이 가능한 보조 연구원처럼 이 기능을 활용할 수 있다는 설명이다. 오픈AI는 이날 회사 블로그를 통해 “딥리서치를 소개한다. 딥리서치는 추론(reasoning)을 사용해 대량의 온라인 정보를 종합, 여러 단계의 연구 작업을 완료하는 ‘에이전트(agent, 대리인)’”라고 설명했다. 딥리서치는 현재 챗GPT 프로(월 200달러) 사용자에게만 우선 제공되며 한 달에 100개 질문으로 사용량이 제한된다. 향후 챗GPT 플러스, 챗GPT 팀, 챗GPT 엔터프라이즈 사용자에게도 순차적으로 제공될 예정이다.

박원익 2025.02.02 20:15 PDT