Инженеры Google научили Gemini понимать настроение и интонацию пользователя

Ця стаття доступна українською мовою
Gemini Live

Google выпустила масштабное обновление для Gemini Live на Android и iOS, которое делает голосовые чаты с ассистентом значительно «человечнее». Модель теперь анализирует не только слова, но и интонацию, ритм и акценты говорящего. Это позволяет ИИ реагировать более естественно и эмпатично.

Google начала внедрять обновление для Gemini Live, которое направлено на то, чтобы разговоры с ассистентом воспринимались как диалог с реальным человеком. В отличие от предыдущих версий, которые в основном реагировали только на содержание слов, новая модель обращает внимание на то, как вы говорите.

Как отмечается в блоге Google, обновленная модель «настроена улавливать такие вещи, как ритм, ударение и интонацию», чтобы отвечать более естественно в режиме реального времени. Это уменьшает роботизированность и делает поток речи более плавным.

Почему это важно

Этот шаг знаменует постепенный переход от жестких «помощников» к настоящим «собеседникам», с которыми можно обсуждать сложные идеи. Когда аудио звучит отчетливо, пользователям легче поддерживать разговор. Длинные объяснения, например, сложной учебной темы, становятся менее утомительными, когда голос приближен к естественной речи, а не является плоским воспроизведением текста.

«Разговоры – это больше, чем просто слова», – отметила Анжела Сун (Angela Sun), директор по управлению продуктами для приложения Gemini. «Они касаются нюансов того, как мы говорим – подъема и падения наших голосов, ритма наших предложений и тона, который стоит за нашими словами».

Что это означает для пользователей

На практике обновление открывает новые сценарии использования Gemini Live. Теперь вы можете попросить помощника говорить быстрее, если спешите, или замедлить темп, если вам нужно тщательно разобрать сложную концепцию.

Обновление также превращает обучение в интерактивную практику. Пользователи могут попросить Gemini:

  • Провести викторину по испанским фразам.
  • Попрактиковаться в повседневных приветствиях на новом языке.
  • Сыграть ролевую игру, например, провести тренировочное собеседование или помочь подготовиться к сложному разговору.

Кроме того, ассистент теперь может рассказывать истории, меняя голос, используя различные акценты (например, британский или ковбойский) или говоря с точки зрения различных персонажей, таких как Юлий Цезарь.

Что дальше

Новые возможности превращают повседневные вопросы в короткие управляемые сессии, которые можно легко вписать в свой дневной график. Эксперты в области технологий предполагают, что в основе обновления лежит модель Gemini 2.5 Flash Live API с нативным аудио. Эта технология генерирует речь напрямую, минуя промежуточный этап преобразования текста в речь, что и придает диалогам необходимую реалистичность.

Обновление Gemini Live — это значительный шаг к тому, чтобы сделать взаимодействие с искусственным интеллектом менее роботизированным и более интуитивным. Предоставляя пользователям инструменты для обучения, репетиций и просто более естественного общения, Google превращает своего помощника в более персонализированного и полезного компаньона.

terazus.com є майданчиком для вільної журналістики. Матеріали користувачі завантажують самостійно. Адміністрація terazus.com може не розділяти позицію блогерів і не відповідає за достовірність викладених ними фактів.

Шановні користувачі, просимо вас шановливо ставитися до співрозмовників в коментарях, навіть якщо ви не згодні з їх думкою!



Другие статьи рубрики

В этот день 16 ноября

2025

2024

2023