1월 22일, X에서 히에로글리프 벤치마크 운영자 Leo가 구글의 차세대 Gemini 모델 Snowbunny의 벤치마크를 올렸다.

솔직히 신뢰도가 그렇게 높은 게시글인 것 같지는 않지만 그냥 사실이라 가정하고 볼 때 Snowbunny의 성능 수치가 gpt 5.1 high보다 무려 60%나 높다. 물론 claude 4.5나 gpt 5.2랑 비교를 안 한게 아쉽긴하지만 일단 바로 이전 세대의 모델보다 60% 이상 뛰어난 거면 어느정도 기대해볼만하지 않을까 싶다.
지금까지의 Gemini 모델은 프론트 작업, UI 작업에서는 그 어떤 모델보다 뛰어나서 원하는 고퀄리티 UI를 바로 바로 뽑아낼 수 있었지만 기능 구현, 백엔드 쪽에서는 codex와 claude 4.5 sonnet에 비해서 2세대는 뒤쳐져있는 느낌을 받았다. claude 4.5 sonnet을 사용하면 20분 내에 해결될 일이 gemini 3.0 pro로는 절대 해결이 되지 않았다.
하지만 이번에 Leo가 올린 수치를 보면 아마 백엔드에서도 조금은 기대해봐도 될 것 같다.
더욱 자세한 설명을 보고 싶다면 다음 게시글을 참고하면 될 것 같다.
https://intheworldofai.com/p/google-gemini-3-ga-coming-soon
Google Gemini 3 GA Coming SOON!?
Google just moved Gemini 3 into general availability. Stable APIs, production readiness, and what this signals about Google’s AI strategy.
intheworldofai.com
'인공지능 (AI)' 카테고리의 다른 글
| 상용 모델을 뛰어넘는 고성능 오픈소스 TTS 모델, Qwen3-TTS (0) | 2026.02.04 |
|---|---|
| 음성 복제 가능한 세계 최초 실시간 음성 대화 AI 오픈소스, Chroma 1.0 (0) | 2026.02.04 |
| UI/UX 계의 최강 AI 모델 활용 도구 Stitch, Gemini CLI Extension으로 출시되다. (0) | 2026.01.22 |
| 딥시크(deepseek), GPU 의존 줄이는 엔그램 기법 공개 (0) | 2026.01.22 |
| Gemini CLI 빠르게 활용하기(Gemini 3.0 pro 설정하는 법) (0) | 2026.01.17 |