
1. 구글, 제미나이 2.5 플래시 출시: AI '사고' 제어 시대 개막
구글이 AI 라인업의 주요 업그레이드인 제미나이 2.5 플래시(Gemini 2.5 Flash)를 출시했습니다. 이 모델은 기업과 개발자에게 AI가 수행하는 '사고'의 양을 전례 없이 제어할 수 있는 능력을 제공합니다.
오늘 구글 AI 스튜디오와 버텍스 AI(Vertex AI)를 통해 프리뷰로 공개된 이 새 모델은, 점점 더 경쟁이 치열해지는 AI 시장에서 경쟁력 있는 가격을 유지하면서 향상된 추론 능력을 제공하려는 구글의 전략적 노력을 보여줍니다.
이 모델은 구글이 "사고 예산(thinking budget)"이라고 부르는 메커니즘을 도입했습니다. 이는 개발자가 응답을 생성하기 전에 복잡한 문제를 추론하는 데 할당할 계산 능력을 지정할 수 있게 해줍니다.
이 접근 방식은 오늘날 AI 시장의 근본적인 긴장 관계, 즉 더 정교한 추론 능력은 일반적으로 더 높은 지연 시간(latency)과 가격을 동반한다는 문제를 해결하는 것을 목표로 합니다.
2. 비용과 성능 사이의 균형: 구글의 해법
우리는 많은 개발자 사용 사례에서 비용과 지연 시간이 중요하다는 것을 알고 있습니다. 따라서 개발자들이 필요에 따라 모델이 수행하는 사고의 양을 조절할 수 있는 유연성을 제공하고자 합니다.
툴시 도시 (Tulsee Doshi, 구글 딥마인드 제미나이 모델 제품 디렉터)
이러한 유연성은 AI 기술이 비용 예측 가능성이 필수적인 비즈니스 애플리케이션에 점점 더 내장됨에 따라 구글의 실용적인 AI 배포 접근 방식을 보여줍니다.
사고 능력을 켜거나 끌 수 있게 함으로써, 구글은 자칭 "최초의 완전 하이브리드 추론 모델"을 만들어냈습니다.
3. 필요한 만큼만 지불: 새로운 AI 가격 책정 모델 상세 분석
새로운 가격 구조는 오늘날 AI 시스템에서 추론 비용을 명확히 보여줍니다. 제미나이 2.5 플래시를 사용할 때, 개발자는 입력에 대해 백만 토큰당 0.15달러를 지불합니다.
출력 비용은 추론 설정에 따라 크게 달라집니다. 사고 기능을 껐을 때는 백만 토큰당 0.60달러이지만, 추론 기능을 활성화하면 백만 토큰당 3.50달러로 급증합니다 .
제미나이 2.5 플래시 가격 (백만 토큰 기준):
- 입력: $0.15
- 출력 (사고 기능 OFF): $0.60
- 출력 (사고 기능 ON): $3.50 (약 5.8배 증가)
추론된 출력에 대한 이 거의 6배에 달하는 가격 차이는 모델이 응답을 생성하기 전에 여러 잠재적 경로와 고려 사항을 평가하는 "사고" 프로세스의 계산 집약도를 반영합니다.
고객은 모델이 생성하는 모든 사고 및 출력 토큰에 대해 비용을 지불합니다. AI 스튜디오 UX에서는 응답 전에 이러한 '사고'를 볼 수 있습니다. API에서는 현재 '사고'에 대한 접근을 제공하지 않지만, 개발자는 얼마나 많은 토큰이 생성되었는지 확인할 수 있습니다.
툴시 도시 (Tulsee Doshi)
사고 예산은 0에서 24,576 토큰까지 조정할 수 있으며, 고정 할당량이 아닌 최대 한도로 작동합니다. 구글에 따르면, 모델은 작업의 복잡성에 따라 이 예산을 얼마나 사용할지 지능적으로 결정하여, 정교한 추론이 필요하지 않을 때는 리소스를 절약합니다.
4. 성능 비교: 제미나이 2.5 플래시, 경쟁 모델 대비 위치는?
구글은 제미나이 2.5 플래시가 대안 모델보다 작은 모델 크기를 유지하면서 주요 벤치마크에서 경쟁력 있는 성능을 보여준다고 주장합니다.
추론과 지식을 평가하도록 설계된 엄격한 테스트인 '인류 최후의 시험(Humanity's Last Exam)'에서 2.5 플래시는 12.1%를 기록하여, 앤트로픽의 클로드 3.7 소네트(8.9%)와 딥시크 R1(8.6%)을 능가했지만, 최근 출시된 OpenAI의 o4-mini(14.3%)에는 미치지 못했습니다.
주요 벤치마크 성과:
- Humanity's Last Exam: 12.1%
- GPQA 다이아몬드: 78.3%
- AIME 수학 시험: 2025년 78.0%, 2024년 88.0%
이 모델은 GPQA 다이아몬드(78.3%) 및 AIME 수학 시험(2025년 78.0%, 2024년 88.0%)과 같은 기술 벤치마크에서도 강력한 결과를 보여주었습니다.
기업들은 비용과 속도 대비 최고의 가치를 제공하기 때문에 2.5 플래시를 선택해야 합니다. 특히 수학, 멀티모달 추론, 장기 컨텍스트 및 여러 다른 주요 지표에서 경쟁사 대비 강점을 보입니다.
툴시 도시 (Tulsee Doshi)
업계 분석가들은 이러한 벤치마크가 구글이 가격 우위를 유지하면서 경쟁사와의 성능 격차를 좁히고 있음을 나타낸다고 지적합니다. 이는 AI 예산을 주시하는 기업 고객들에게 매력적인 전략이 될 수 있습니다.
5. 스마트함 vs. 신속함: 언제 AI의 깊은 사고가 필요한가?
조절 가능한 추론 기능의 도입은 기업이 AI를 배포하는 방식에 있어 중요한 진화를 의미합니다. 기존 모델에서는 사용자가 모델의 내부 추론 프로세스에 대한 가시성이나 제어권이 거의 없었습니다.
구글의 접근 방식은 개발자가 다양한 시나리오에 맞게 최적화할 수 있도록 합니다. 언어 번역이나 기본적인 정보 검색과 같은 간단한 쿼리의 경우, 사고 기능을 비활성화하여 비용 효율성을 극대화할 수 있습니다.
수학 문제 해결이나 미묘한 분석과 같이 다단계 추론이 필요한 복잡한 작업의 경우, 사고 기능을 활성화하고 미세 조정할 수 있습니다.
핵심 혁신은 쿼리에 따라 적절한 추론 수준을 모델 스스로 결정하는 능력입니다. 구글은 "캐나다에는 몇 개의 주가 있습니까?"와 같은 간단한 질문에는 최소한의 추론이 필요하지만, 빔 응력 계산에 대한 복잡한 엔지니어링 질문에는 자동으로 더 깊은 사고 프로세스를 사용하는 예를 들어 이를 설명합니다.
사고 기능을 주력 제미나이 모델에 통합하고 전반적인 개선을 통해 더 높은 품질의 답변을 제공하게 되었습니다. 이러한 개선은 사실성을 측정하는 SimpleQA를 포함한 학술 벤치마크 전반에 걸쳐 사실입니다.
툴시 도시 (Tulsee Doshi)
6. 구글의 AI 주간: 플래시 출시와 함께 발표된 소식들
제미나이 2.5 플래시 출시는 구글이 AI 분야에서 공격적인 행보를 보이는 주간에 이루어졌습니다. 월요일에는 Veo 2 비디오 생성 기능을 제미나이 어드밴스드 구독자에게 제공하여 사용자가 텍스트 프롬프트로 8초짜리 비디오 클립을 만들 수 있게 했습니다.
오늘, 2.5 플래시 발표와 함께 구글은 모든 미국 대학생에게 2026년 봄까지 제미나이 어드밴스드를 무료로 제공한다고 밝혔습니다. 분석가들은 이를 미래의 지식 근로자들 사이에서 충성도를 구축하려는 노력으로 해석합니다.
이러한 발표들은 OpenAI의 ChatGPT가 주도하는 시장에서 경쟁하기 위한 구글의 다각적인 전략을 반영합니다. 제3자 분석에 따르면 ChatGPT는 주간 사용자가 8억 명 이상인 반면, 제미나이는 월간 사용자가 2억 5천만에서 2억 7천 5백만 명으로 추정됩니다.
비용 효율성과 성능 맞춤화에 명시적으로 초점을 맞춘 2.5 플래시 모델은 고급 기능에 접근하면서도 AI 배포 비용을 신중하게 관리해야 하는 기업 고객에게 특히 어필하도록 설계된 것으로 보입니다.
개발자들이 제미나이 플래시 2.5로 무엇을 구축하고 있는지, 그리고 사고 예산을 어떻게 사용하고 있는지에 대한 피드백을 받기 시작하는 것이 매우 기대됩니다.
툴시 도시 (Tulsee Doshi)
7. 프리뷰 이후 전망: 기업들이 기대할 수 있는 것
이번 출시는 프리뷰 단계이지만, 모델은 이미 개발자들이 빌드를 시작할 수 있도록 제공됩니다. 다만 구글은 정식 출시(General Availability) 일정은 명시하지 않았습니다.
회사는 이 프리뷰 단계 동안 개발자 피드백을 바탕으로 동적 사고 능력을 계속해서 개선할 것이라고 밝혔습니다.
기업 AI 도입자들에게 이번 출시는 AI 배포에 대한 더욱 미묘한 접근 방식을 실험할 기회를 제공합니다. 즉, 중요한 작업에는 더 많은 계산 리소스를 할당하고 일상적인 애플리케이션에서는 비용을 절약할 수 있습니다.
이 모델은 제미나이 앱을 통해서도 소비자에게 제공되며, 모델 드롭다운 메뉴에 이전의 2.0 Thinking (Experimental) 옵션을 대체하여 "2.5 Flash (Experimental)"로 표시됩니다. 이러한 소비자 대상 배포는 구글이 앱 생태계를 사용하여 추론 아키텍처에 대한 광범위한 피드백을 수집하고 있음을 시사합니다.
AI가 비즈니스 워크플로우에 점점 더 깊숙이 통합됨에 따라, 구글의 맞춤형 추론 접근 방식은 비용 최적화와 성능 튜닝이 순수 기능만큼 중요해지는 성숙한 시장을 반영합니다.
이는 생성형 AI 기술 상용화의 새로운 단계를 알리는 신호탄이며, 기업들이 AI를 더욱 효율적이고 전략적으로 활용할 수 있는 길을 열어줄 것입니다.
제미나이 2.5 플래시의 '사고 예산' 기능이 앞으로 AI 애플리케이션 개발과 비용 관리에 어떤 변화를 가져올지 주목할 필요가 있습니다.
'🌐[기술]' 카테고리의 다른 글
엔비디아 GTC 2025 완벽 정리: 블랙웰 GPU부터 로봇 GR00T까지, AI의 모든 것! (0) | 2025.04.19 |
---|---|
GPS 없이 드론이 난다? 테세우스, 비전 기반 항법 기술로 주목 (시드 투자 성공) (0) | 2025.04.19 |
토큰화란 무엇인가? AI 시대 데이터 보안의 핵심 기술 (0) | 2025.04.19 |
젠레이어(GenLayer): AI 에이전트 거래, '다수결 LLM 투표'로 신뢰를 구축하다! (1) | 2025.04.18 |
패트로너스 AI, 환각 잡아드립니다"… 업계 최초 멀티모달 AI 심사위원, 저지-이미지 전격 공개 (0) | 2025.04.18 |