박사급 AI로 연구·코딩... 오픈AI 추론 모델 ‘o1’ 활용법

reporter-profile
박원익 2024.09.12 12:11 PDT
박사급 AI로 연구·코딩... 오픈AI 추론 모델 ‘o1’ 활용법
OpenAI의 새로운 AI 모델 o1 (출처 : OpenAI)

추론 능력 강화한 새로운 AI 모델 ‘o1’ 공개
“과학, 코딩, 수학 분야 더 어려운 문제 해결 가능”
코드명 ‘스트로베리’로 불려온 모델... 챗GPT, API로 사용 가능
물리학 박사급 수준 성과... CoT 활용이 핵심
기술 격차 더 벌려... 9조4000억 규모 투자 유치 진행 중

오픈AI가 어렵고 복잡한 문제를 해결하기 위한 새로운 추론 모델 시리즈 ‘o1’을 공개했다.

오픈AI는 12일(현지시각) 홈페이지를 통해 “새로운 AI 모델 시리즈 오픈AI o1-프리뷰(o1-preview)를 소개한다”며 “과학, 코딩(컴퓨터 프로그래밍), 수학 분야에서 이전 모델 보다 복잡한 작업을 추론하고, 더 어려운 문제를 해결할 수 있다”고 밝혔다.

o1은 오픈AI 내부에서 ‘스트로베리(Strawberry)’라는 프로젝트명으로 불려온 AI 모델이다. o1은 챗GPT와 오픈AI API(애플리케이션 프로그래밍 인터페이스)를 통해 사용할 수 있다.

오픈AI는 “우리는 이 AI 모델이 문제를 해결하기 전 사람처럼 더 많은 시간을 생각하도록 훈련시켰다”며 “훈련을 통해 사고 과정을 다듬고, 다양한 전략을 시도하고, 실수를 인식하고 수정하는 방법을 배운다”고 설명했다.

오픈AI o1 모델 성능 비교 (출처 : OpenAI)

물리학 박사급 수준 성과... CoT 추론 활용이 핵심

오픈AI의 내부 테스트 결과 o1 모델은 물리학, 화학, 생물학 분야의 까다로운 벤치마크(성능평가) 과제에서 박사 과정 학생과 비슷한 성과를 보였다.

국제 수학 올림피아드(IMO) 예선 시험의 경우 GPT-4o는 13%의 문제만 정답을 맞힌 반면 o1은 정답률이 83%에 달했다. 수학·물리학·역사·법률·의학·윤리 등 57개의 주제를 복합적으로 활용해 AI 성능을 평가하는 MMLU(대규모 다중 작업 언어 이해)에서도 GPT-4o보다 우수한 점수를 기록했다.

o1 모델이 놀라운 추론 성능은 CoT(Chain of Thought, 사고 사슬)에 기인한다. 사람이 어려운 질문에 답하기 전 오랫동안 생각하는 것처럼 o1 역시 연쇄적으로 생각하는 CoT를 활용하는 것이다. 강화학습(RL, Reinforcement learning) 방식으로 CoT를 훈련했다.

오픈AI는 o1 기술 문서에서 “o1은 까다로운 문제를 더 간단한 단계로 세분화하고, 현재 접근 방식이 효과가 없을 때 다른 접근 방식을 시도하는 방법을 학습한다”며 “이 과정이 모델의 추론 능력을 극적으로 향상시킨다”고 설명했다.

“CoT로 AI 모델 마음 읽을 수 있었다... 원시 CoT 공개 안 할 것”

오픈AI는 “사용자 경험, 경쟁 우위 등을 종합적으로 고려해 사용자에게 ‘원시(raw) CoT’는 표시하지 않기로 결정했다”고 밝혔다. CoT 추론을 통해 답을 내놓지만, 구체적으로 생각의 단계를 어떻게 나눠서 추론했는지 원시 데이터는 공개하지 않는다는 것이다. 오픈AI는 “CoT는 AI 모델의 마음을 읽을 수 있게(read the mind) 해줬다”고도 했다.

o1가 어떻게 생각을 쪼개는지 외부에 공개되면 이를 모방한 AI 모델이 등장하고, o1의 경쟁 우위가 사라질 수 있다고 판단한 것으로 풀이된다. o1 모델이 생성한 CoT 요약은 제공한다.

오픈AI는 코딩에 특히 효과적인, 빠르고 저렴한 추론 모델 ‘o1-미니(o1-mini)’도 함께 선보였다. o1-미니는 o1-프리뷰보다 비용이 80% 저렴하다. 추론이 필요하지만, 광범위한 지식이 필요하지 않은 애플리케이션에 적합한 모델이다.

오픈AI 측은 “o1은 AI 추론 기술을 크게 발전시켰다. 이 모델의 개선된 버전을 계속해서 반복 출시할 계획”이라며 “o1과 그 후속 버전이 과학, 코딩, 수학 분야에서 AI의 새로운 사용 사례를 많이 발굴할 것으로 믿는다”고 했다.

챗GPT AI 모델 선택 화면 (출처 : OpenAI)

더밀크의 시각: 기술 격차 더 벌려... 9조4000억 규모 투자 유치 진행 중

오픈AI가 공개한 추론 강화 모델은 유전학(genetics), 경제학(economics), 양자 물리학(quantum physics) 같은 학문 분야에서 인류의 난제를 해결하는데 활용될 수 있을 전망이다. 뛰어난 추론 능력을 갖춘 박사급 인재를 확보해 다양한 연구를 진행하는 상황과 비슷하다. 이와 관련, 오픈AI는 실제로 각 분야 전문가들이 o1 모델을 체험해 보는 영상을 공유하기도 했다.

업계에서는 o1 모델로 오픈AI가 또 한번 기술 격차를 벌린 것으로 평가했다. CoT로 추론 능력을 강화, 제대로 작동하는 모델을 만드는 게 쉽지 않다는 것이다.

짐 팬 엔비디아 선임 연구 과학자는 X(옛 트위터)에 올린 글에서 “o1을 만들어 제공하는 건 학문적 벤치마크를 기록을 남기는 것보다 훨씬 어려운 일”이라며 오픈AI는 ‘추론 확장 법칙(scaling law)을 오래 전 발견했을 것으로 보인다. “학계에서는 이제 막 이런 발견이 이뤄지고 있다”고 평가했다.

오픈AI는 현재 기업가치 1500억달러(약 200조8500억원)에 대규모 투자 유치를 진행 중이다. 디인포메이션은 이날 “오픈AI가 아랍에미리트 투자 펀드 MGX 등에서 총 70억달러(약 9조4000억원)를 조달하는 방법을 논의 중”이라고 보도했다.

다른 AI 모델에 비해 추론에 더 많은 연산 자원을 활용하는 코드명 스트로베리 ‘o1’ 모델 (출처 : https://x.com/DrJimFan/status/1834279865933332752)

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.