Что понятно про Gemini 3 Pro — модель, которую Google называет серьезным шагом к AGI

На этой неделе Google представила Gemini 3 — и этот релиз тянет на большее, чем очередное обновление, но не без курьезов. Для Google этот релиз оказался уже крайне успешным: акции материнской Alphabet подскочили на 6,9%. И это — уже вторая хорошая новость за неделю для бигтеха: ранее Loop Capital повысил рейтинг акций до «покупать», заявив, что прежние опасения насчет перспектив поискового гиганта «были сметены волной энтузиазма вокруг ИИ».

Что умеет Gemini 3 Pro

Gemini 3 Pro — полноценный универсальный инструмент, утверждает в своем релизе Google. Модель может одновременно анализировать разные типы данных (текст, изображения, видео, аудио, код) и объединять их в цельный итоговый продукт.

▫️Показательный пример — эксперимент с архивом старых исследовательских данных, который провел профессор бизнес-школы Уортона и автор книги «Co-Intelligence» Итан Молик. Он дал модели доступ к беспорядочной папке десятилетней давности, куда входили поврежденные Excel-файлы вкупе с устаревшими форматами. Gemini 3 Pro разобралась в этом хаосе.

▫️Другой эксперимент был такой: Молик загрузил в Gemini 3 Pro скриншот твита от ноября 2022 года. Тогда первая версия ChatGPT сочинила короткий забавный стих про «космический двигатель на конфетах». Gemini 3 Pro на основе того же запроса самостоятельно спланировала, запрограммировала и запустила мини-игру — небольшой интерактивный симулятор космического корабля, движущегося на «конфетной тяге».

▫️Gemini 3 Pro отвечает коротко и по делу, посчитал один из первых тестировщиков Мэтт Шумер. Он сравнивает ее с опытным senior-инженером и признает, что модель к тому же выдерживает живой ритм на письме. Ему пришлось перечитывать созданные искусственным интеллектом главы, чтобы убедиться, что это не фрагменты реальной книги.

▫️Platformer пишет, что Gemini 3 Pro показала лучший результат среди всех протестированных систем на любимом у автора эксперименте — нарисовать векторную картинку с пеликаном на велосипеде. Проводивший эксперимент разработчик Саймон Уиллисон отметил, что модель сгенерировала «отличного пеликана» — что получается далеко не у всех топовых моделей.

Но есть нюансы

По большинству публичных бенчмарков Gemini 3 Pro уверенно обходит и недавно вышедшую GPT-5.1 от OpenAI, и Claude Sonnet 4.5 от Anthropic. Единственный тест, где модель уступила конкуренту, — SWE-Bench Verified, бенчмарка, созданного для оценки того, как хорошо ИИ-модели справляются с реальными задачами по программированию, и то на один процентный пункт.

Но исследователи отмечают любопытную деталь. В закрытом тесте AA-Omniscience Index, где модели должны отвечать только в том случае, если полностью уверены в результате, Gemini 3 Pro дала больше правильных ответов, чем конкуренты, но в ситуациях неопределенности чаще вела себя «слишком уверенно» и предпочитала придумать ответ. По данным тестировщиков, около 88% ее ошибок приходились на такие галлюцинации. Для сравнения, у менее мощного, но более осторожного Claude Haiku 4.5 этот показатель — всего 26%.

Встречались и полноценные логические ловушки. В одном из тестов Андрея Карпатого модель категорически отказывалась признать, что сейчас 2025 год, и уверяла пользователя, что все показанные статьи и скриншоты — подделка, созданная другими ИИ. Модель разбирала изображения и указывала на «признаки генерации», которых на самом деле не было. И лишь после того, как ее заставили воспользоваться поиском, модель признала, что ошиблась.

Скопировать ссылку

Переговоры с Уиткоффом и Кушнером, санкции снова обходятся и Россия в черном списке ЕС

Визит в Москву Стива Уиткоффа и Джареда Кушнера поставил точку в попытке США добиться перемирия в Украине стремительным наскоком. Владимир Путин высказал американцам свои прежние требования, на которые Украина пока не готова соглашаться, и уехал с визитом в Индию. Эффект последних американских санкций против российских нефтяных компаний начинает выдыхаться по мере того, как экспортеры находят новые пути к покупателям, а европейцы, похоже, окончательно зашли в тупик в вопросе о кредитовании Украины за счет российских арестованных резервов.

Зачем бизнесу VPN: как повысить эффективность команды и безопасность данных

В январе 2025 года хакеры слили в сеть 15 тысяч VPN-паролей сотрудников нескольких компаний, которые пользовались VPN для удаленного доступа. VPN-провайдер пострадавших компаний не заметил уязвимость в коде, из-за которой его клиенты стали жертвой атаки. С такими угрозами сталкиваются не только корпорации, но и средние предприятия — в попытке защитить ценную информацию бизнес обращается к VPN-провайдерам, но не всегда может понять, кому можно доверять.

Рассылки The Bell стали платными. Подписывайтесь!

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL. 18+

Россию готовятся внести в черный список ЕС. Что это будет значить для бизнеса и для граждан?

Не дождавшись попадания России во всемирный черный список Группы по разработке мер по борьбе с отмыванием денег (FATF), ЕС включил ее в собственный список стран с высоким риском отмывания и финансирования терроризма. Таких тяжелых последствий, как попадание в черный список FATF, это не влечет, но на практике приведет к ужесточению надзора и проверок в Европе всех финансовых операций, так или иначе связанных с Россией.