Google обновила голосовой Gemini

Google представила сразу два блока обновлений Gemini: перевод в реальном времени через наушники и улучшения голосового помощника Gemini Live и модели Gemini 2.5 Flash Native Audio.

Перевод в реальном времени через наушники

Новая бета‑функция Live translate позволяет слышать перевод сразу в наушниках, при этом система синтезирует речь с сохранением тембра и особенностей голоса говорящего, а не обезличенным «роботом». Это превращает любые наушники в устройство для однонаправленного синхронного перевода: достаточно надеть их, открыть Google Translate, выбрать режим «Live translate» и целевой язык.

Бета уже доступна в приложении Translate на Android в США, Мексике и Индии, работает с любыми наушниками и поддерживает более 70 языков. Google планирует расширить функцию на iOS и другие страны к 2026 году. За счёт интеграции Gemini в Google Translate текстовые переводы становятся более естественными, особенно для сленга, идиом и локальных выражений — система учитывает контекст, а не переводит фразы дословно.

Инструменты для изучения языков

Google расширила набор учебных функций в Translate почти ещё для 20 стран, включая Германию, Индию, Швецию и Тайвань. Теперь изучающие английский в этих регионах могут практиковать язык прямо в приложении, а носители бенгальского, китайского (упрощённого), нидерландского, немецкого, хинди, итальянского, румынского и шведского — тренировать английский. Такой режим превращает переводчик в полноценный тренажёр разговорной речи.

Обновления Gemini 2.5 Flash Native Audio

Инженеры Google усилили три ключевых аспекта аудиомодели Gemini 2.5 Flash Native Audio. Во‑первых, улучшена надёжность вызова внешних функций: модель точнее определяет, когда нужно подтянуть актуальные данные (например, погоду или расписание) и вставляет их в голосовой ответ без «рваного» ритма речи. Во‑вторых, уровень соблюдения инструкций разработчиков вырос с 84 до 90%, что заметно повышает предсказуемость и точность выполнения сложных команд. В‑третьих, улучшено извлечение контекста из предыдущих реплик, благодаря чему диалоги звучат более логично и связно даже при длительных разговорах.

Новые возможности Gemini Live

Вице‑президент Google Labs Джош Вудворд сообщил о двух удобных изменениях в Gemini Live. Теперь ассистент больше не перебивает собеседника, если тот делает длинную паузу: система терпеливее ждёт продолжения речи, что делает общение более естественным. Появилась и возможность отключить микрофон прямо во время ответа ИИ, чтобы исключить случайное «перехватывание» фразы и обрыв реплики модели, если пользователь решит обсудить что‑то в комнате или просто помолчать.

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *