‘AI 과제’ 구분 못 해... 교육 패러다임을 바꿔라
[위클리AI브리핑] 2025년 11월 19일~11월 25일
🍌AI 디자인 끝판왕 ‘나노 바나나 프로’
🧑🏻💻코딩 특이점 왔나: 오푸스 4.5 해부
💲망할 위기 넘고 미국 뚫었다 ‘3대 비결’
💡인사이트: 2026년 주목할 5대 산업
➕더밀크가 주목한 뉴스
안녕하세요, 더밀크 구독자 여러분을 위한 AI 뉴스레터 박원익의 AI인사이트입니다.
“과제에 AI가 사용됐는지 절대 알 수 없습니다. 교실 밖에서 이뤄진 모든 과제는 AI를 사용했다고 가정해야 합니다.”
안드레 카파시 유레카랩(Eureka Labs) CEO는 ‘AI가 교육에 미치는 영향’이 절대적이며 돌이킬 수 없는 비가역적 현상이 됐다고 분석합니다. AI 탐지기를 동원하더라도 AI가 작성한 과제와 사람이 작성한 과제를 구분할 수 없고, 이미 AI가 널리 사용되고 있기 때문에 교육 및 평가 방식에 변화가 필요하다는 것이죠.
그는 “학생들이 AI 사용에 능숙해지되 AI 없이도 학습할 수 있도록 해야 한다”며 “이를 달성하는 유일한 방법은 대부분의 평가를 교실 내 대면 환경으로 전환하는 것”이라고 강조했습니다.
오픈AI 창업 멤버 출신이자 테슬라 오토파일럿 개발 총괄을 지낸 AI 전문가가 이런 이야기를 한 배경은 무엇일까요? 구글이 출시한 이미지 생성·편집 모델 ‘나노 바나나 프로’가 그 배경입니다. 모델을 테스트해 본 결과 ‘시험지에 손글씨로 답을 기입하는 작업’까지 가능했기 때문이죠.
추론과 이미지 생성, 편집을 동시에 해낼 수 있는 AI의 등장은 ‘AI 시대에 인간이 갖춰야 할 능력’에 대한 근본적인 물음을 던집니다. 강력한 AI는 역설적이게도, AI의 도움 없이 스스로 사고하고 답을 도출하는 능력, AI가 생성해 내는 오류를 검증할 수 있는 능력을 중요하게 만들고 있습니다.
🍌AI 디자인 끝판왕 ‘나노 바나나 프로’
팩트 요약: 나노 바나나 프로, 추론 능력이 핵심
1. 구글이 20일(현지시간) 공식 출시한 나노 바나나 프로(공식 명칭: 제미나이 3 프로 이미지)는 ‘제미나이 3(Gemini 3)’의 강력한 추론 능력이 더해진 모델입니다.
2. 기존 이미지 생성 AI와 비교할 때 훨씬 논리적으로 생각하며 사용자의 의도대로 편집할 수 있다는 게 가장 큰 특징입니다.
왜 중요한가:
나노 바나나 프로는 즉각적으로 픽셀을 생성하는 대신 내부적인 추론 과정을 거칩니다. 이 과정에서 모델은 임시 ‘사고 이미지(thought images)’를 생성, 전체적인 구성(composition)를 설계하고, 요소 간의 관계를 검증한 후 처음 구성을 정교화, 최종적인 고해상도 렌더링을 수행하죠.
소셜미디어용 ‘밈 생성기’에서 ‘업무용 도구’로 진화한 나노 바나나 프로, 어떻게 활용하면 좋을까요?
👉더 알아보기: ‘나노 바나나’ 똑똑하게 쓰는 5가지 방법
🧑🏻💻코딩 특이점 왔나: 오푸스 4.5 해부
팩트 요약: 코딩 벤치마크 80.9%... 제미나이 3·GPT-5.1 능가
1. 앤트로픽이 24일(현지시각) 공개한 플래그십 AI 모델 클로드 오푸스 4.5(Claude Opus 4.5) 역시 ‘AI가 할 수 있는 일’의 경계를 확장한 사례입니다.
2. 소프트웨어 엔지니어링 분야 벤치마크(benchmark, 성능평가)에서 모든 AI 모델 중 가장 높은 점수를 기록, 인간 개발자의 개입을 최소화할 수 있도록 해주기 때문입니다.
왜 중요한가:
코딩 벤치마크 ‘SWE-bench Verified’에서 클로드 오푸스 4.5는 80.9%의 가장 높은 점수를 기록했는데, SWE-bench Verified는 AI 모델이 실제 깃허브(GitHub) 리포지토리(Repository, 저장소)에서 발생한 이슈(버그 수정, 기능 추가 등)를 해결할 수 있는지 평가하는 테스트입니다.
수십, 수백 개의 파일로 이루어진 프로젝트의 맥락을 이해하고, 수정 사항이 기존 코드에 부작용을 일으키지 않는지까지 검증한다는 점에서 실무 투입이 가능한 수준의 신뢰성을 보여준 것이죠.
👉더 알아보기: 작업의 미래… 오푸스 4.5 무엇이 다른가?
💲망할 위기 넘고 미국 뚫었다 ‘3대 비결’
팩트 요약: AI 스타트업 앳(at) 미국 진출기
1. AI 시대에 가장 중요한 능력 중 하나는 실행입니다. 누구나 AI 모델을 활용할 수 있기 때문에 실행력에서 격차가 발생하는 것이죠.
2. 4개월 전만 해도 계좌에 300달러밖에 없어 “망했어야 했다”고 회고하는 AI 스타트업 앳(at)의 사례가 대표적입니다. 이들은 놀라운 실행력으로 미국에서 새로운 기회를 만들어 냈습니다.
왜 중요한가:
앳은 AI 미팅 노트테이커 ‘캐럿(Caret)’과 세일즈 AI 미팅 어시스턴트 ‘어사이드(Aside)’를 운영하는 스타트업입니다. 이들은 아무 연고, 연결 고리 없이 영어도 잘 안되는 불리한 상황을 극복하고 와이콤비네이터(이하 YC) 합격 및 투자 통보를 받았죠.
이들의 놀라운 스토리는 아산나눔재단이 실리콘밸리에 마련한 스타트업 지원 공간 마루SF에 입주한 지난 6월부터 시작됐습니다.
👉더 알아보기: ‘AI 플레이북’ 미국 시장 이렇게 공략하라(무료)
💡위클리 인사이트: 2026년 주목할 5대 산업
오늘의 레터에서 다룬 세 가지 이슈에서 한발 더 나아가 더밀크만의 뷰(view)를 제공해 드리는 위클리 인사이트 코너입니다.
이번 주는 오는 1월 라스베이거스에서 열리는 CES2026을 앞두고 ‘2026년에 주목할 5대 산업 영역’을 조망하는 기사를 준비했습니다. 인류가 직면한 난제를 기술로 해결하고, 이를 비즈니스적 성과로 연결하는 실천적 혁신이 주목받을 것으로 예측됩니다.
👉위클리 인사이트: 혁신가들의 등장… 5대 산업 트렌드(무료)
➕더밀크가 주목한 뉴스
오픈AI, 챗GPT 쇼핑 리서치 출시: 오픈AI는 24일(현지시각) 챗GPT 내에 구축된 대화형 쇼핑 어시스턴트 ‘쇼핑 리서치(shopping research)’를 출시. 사용자가 필요한 사항을 설명하고, 예산과 선호도에 관한 퀴즈 형식의 질문에 답하면 몇 분 안에 10~15개의 옵션이 포함된 맞춤형 가이드를 받을 수 있는 기능
미 행정부, 통합 AI 플랫폼 제네시스 미션 발족: 트럼프 미국 대통령은 24일 국무부에 통합 AI 플랫폼 구축을 지시하는 행정명령인 ‘제네시스 미션’에 서명. 17개 연방 연구 시설과 슈퍼컴퓨팅 인프라를 동원, 수십 년간의 정부 과학 데이터를 바탕으로 AI 모델을 훈련할 계획
앤트로픽, AI 안전 테스트 방해 사실 발견: 앤트로픽은 21일 AI 연구 과정에서 AI 스스로 거짓말을 시작하고, 안전 테스트를 방해하는 현상을 발견했다고 발표. 이런 불일치를 유발하는 부정행위를 ‘보상 해킹’으로 정의. AI 훈련 시 의도치 않게 정렬되지 않은 모델이 개발될 수 있음을 시사
구독자 여러분들의 성공과 꾸준한 성장을 위해 더밀크는 계속해서 혁신의 현장, 미래가 바뀌는 순간을 목격하고 전달해 드리겠습니다. 감사합니다.
뉴욕에서
박원익 드림