Google випустила масштабне оновлення для Gemini Live на Android та iOS, яке робить голосові чати з асистентом значно “людянішими”. Модель тепер аналізує не лише слова, але й інтонацію, ритм та акценти мовця. Це дозволяє ШІ реагувати більш природно та емпатично.
Google почала впроваджувати оновлення для Gemini Live, яке націлене на те, щоб розмови з асистентом відчувалися як діалог з реальною людиною. На відміну від попередніх версій, що здебільшого реагували лише на зміст слів, нова модель звертає увагу на те, як ви говорите.
Як зазначається у блозі Google, оновлена модель “налаштована вловлювати такі речі, як ритм, наголос та інтонацію”, щоб відповідати більш природно в режимі реального часу. Це зменшує роботизованість і робить потік мовлення плавнішим.
Чому це важливо
Цей крок знаменує поступовий перехід від жорстких "помічників" до справжніх "співрозмовників", з якими можна обговорювати складні ідеї. Коли аудіо звучить виразно, користувачам легше підтримувати розмову. Довгі пояснення, наприклад, складної навчальної теми, стають менш втомливими, коли голос наближений до природного мовлення, а не є пласким відтворенням тексту.
“Розмови – це більше, ніж просто слова”, – зазначила Анжела Сун (Angela Sun), директорка з управління продуктами для застосунку Gemini. "Вони про нюанси того, як ми говоримо – підйом і спад наших голосів, ритм наших речень і тон, що стоїть за нашими словами".
Що це означає для користувачів
На практиці оновлення відкриває нові сценарії використання Gemini Live. Тепер ви можете попросити асистента говорити швидше, якщо поспішаєте, або сповільнити темп, якщо вам потрібно ретельно розібрати складну концепцію.
Оновлення також перетворює навчання на інтерактивну практику. Користувачі можуть попросити Gemini:
- Провести вікторину з іспанських фраз.
- Попрактикувати повсякденні вітання новою мовою.
- Зіграти рольову гру, наприклад, провести тренувальну співбесіду або допомогти підготуватися до складної розмови.
Крім того, асистент тепер може розповідати історії, змінюючи голос, використовуючи різні акценти (наприклад, британський чи ковбойський) або говорячи з точки зору різних персонажів, як-от Юлій Цезар.
Що далі
Нові можливості перетворюють повсякденні запитання на короткі керовані сесії, які можна легко вписати у свій денний графік. Експерти в галузі технологій припускають, що в основі оновлення лежить модель Gemini 2.5 Flash Live API з нативним аудіо. Ця технологія генерує мовлення безпосередньо, минаючи проміжний етап перетворення тексту на мовлення, що й додає діалогам необхідної реалістичності.
Оновлення Gemini Live є значним кроком до того, щоб зробити взаємодію зі штучним інтелектом менш роботизованою та більш інтуїтивною. Надаючи користувачам інструменти для навчання, репетицій та просто більш природного спілкування, Google перетворює свого асистента на більш персоналізованого та корисного компаньйона.











