Google представила Gemini 3 — модель, которая по их словам приближает компанию к AGI. По этому поводу в блоге целый взрыв материалов, поскольку Google начинает выкатывать её во все свои продукты.Модель показывает впечатляющие результаты на бенчмарках — 1501 Elo на LMArena, 91.9% на GPQA Diamond, 45.1% на ARC-AGI-2 в режиме Deep Think. Последняя цифра особенно любопытна, учитывая, что этот бенчмарк создавался как проверка на способность к абстрактному мышлению.
Я пока увидел модель только в AI Studio, в обычном Gemini её нет, хотя выкатка вроде бы началась. Будем тестировать — надо сказать, что у меня Gemini заменил ChatGPT, а Deep Think прямо сильно помог за неделю использования.
Модель не отличается параметрами от предыдущей версии — дата окончания знания январь 2025 года и, как и 2.5 Pro, на самом деле она даже раньше, факты второй половины 2024 года ей неизвестны. Размер контекста — 1 млн токенов, 64K на выход. А вот цена в API дороже — 2 доллара на вход до 200к токенов, 4 — если промпт больше 200к, а выдача 12 и 18 долларов за млн токенов соответственно.
Обратите внимание, что Flash модели пока нет — предыдущую версию запускали иначе.
В общем, пошли тестировать — за деньги, поскольку бесплатный ключ не подойдет.