Google запустила функцию анализа экрана с помощью ИИ Gemini в Chrome

Google начала поэтапно открывать доступ к новой функции анализа экрана с помощью искусственного интеллекта Gemini прямо в браузере Chrome. Первыми возможность опробовали подписчики тарифов AI Pro и AI Ultra в США, сообщает издание The Verge, поделившееся первыми впечатлениями от её работы.

Google интегрирует ИИ чат-бот Gemini в браузер Chrome

Как работает новая функция Gemini в Chrome

На презентации I/O 2025 компания анонсировала, что Gemini сможет просматривать содержимое экрана и камеры пользователя, отвечая на вопросы по содержанию сайтов. Активировать помощника можно с помощью новой иконки Gemini в браузере или сочетанием клавиш Alt+G. Пользователям доступен текстовый чат и голосовой режим Live.

Gemini умеет:

Пересказывать статьи и комментарии со страниц, которые пользователь просматривает;
Находить и обобщать информацию из видео, например, определять инструменты, используемые в роликах о ремонте;
Извлекать рецепты из видео на YouTube, избавляя пользователя от необходимости записывать их вручную;
Анализировать онлайн-магазины, например, выделять водонепроницаемые сумки на Amazon.

Gemini в Chrome также умеет извлекать рецепты из видео на YouTube. Рецепт соответствует оригинальному. Скриншот: The Verge

Ограничения и неточности работы Gemini

По наблюдениям журналистов The Verge, новая возможность Gemini имеет одно важное ограничение: она видит и анализирует только то, что отображено непосредственно на текущей вкладке браузера. Для полноценного пересказа статей или комментариев нужно предварительно пролистать всю страницу, чтобы модель «увидела» весь необходимый контент;
ИИ-анализатор пока ограничен одной вкладкой на запрос. При переходе на другую вкладку или сайт, Gemini не сможет объединить данные;
Gemini иногда не может точно определить детали без таймкодов в видео. Например, не сразу указала местонахождение MrBeast в ролике о городах майя;
Не всегда находит конкретные товары в интернет-магазинах, предлагая альтернативы;
Ответы Gemini могут быть слишком длинными для маленького всплывающего окна в браузере.

На видео: пользователь соцсети X тестирует Gemini в голосовом режиме, спрашивая, что демонстрирует Google в ролике для разработчиков с презентации I/O 2025 (Источник: Paul Couvert).

The Verge отмечает, что несмотря на небольшие недочёты, новая функция Gemini существенно упрощает получение полезной информации прямо в браузере, особенно при работе с видео.

Впервые ИИ-модель Gemini 2.0 Flash с функцией анализа экрана Google представила в декабре 2024 года. Изначально она была доступна только на платформе для разработчиков AI Studio.

Как использовать Google Gemini 2.0 Flash бесплатно – на сайте Gemini, в Google AI Studio и приложении

Обновления программ, что нового

• Представлен бюджетный смартфон Realme P4 Lite 4G: батарея 6300 мАч и защита MIL-STD-810H
• Новые функции Android 17 – нативная блокировка программ и общий буфер обмена
• Google Chrome получил новые инструменты для продуктивной работы
• Утечка: Google готовит чип безопасности Titan M3 для процессоров Tensor G6
• Google выпустила Gemini 3.1 Pro с двукратным ростом в ARC-AGI-2 и поддержкой визуальных интерфейсов
• Технология Microsoft Project Silica: запись терабайтов данных на стеклянные пластины для хранения 10 000 лет

Google запустила функцию анализа экрана с помощью ИИ Gemini в Chrome

Как работает новая функция Gemini в Chrome

Ограничения и неточности работы Gemini

Обновления программ, что нового

Новое на сайте