Deep Think, Veo 3, тариф за 250 доларів та інші ШІ-новинки Google на конференції I/O 2025

21 травня 2025 в 12:43

117

Джерело фото: Flux Pro

Вчора на щорічній конференції розробників Google I/O 2025 компанія представила цілу низку революційних оновлень свого штучного інтелекту Gemini. Від нових моделей до інтеграції з браузером Chrome, від генерації відео до окулярів доповненої реальності – Google продемонструвала амбітне бачення майбутнього, в якому ШІ стає більш персоналізованим, проактивним і потужним. Розглянемо детальніше ключові анонси, які змінять ваш досвід взаємодії з технологіями Google.

Потужніші моделі Gemini 2.5: новий рівень інтелекту

Google DeepMind представила значні оновлення для своїх флагманських моделей штучного інтелекту. Gemini 2.5 Pro продовжує бути улюбленцем розробників як найкраща модель для програмування, а Gemini 2.5 Flash стає ще кращою завдяки новому оновленню.

Важливим нововведенням став режим Deep Think – експериментальний режим покращеного мислення для Gemini 2.5 Pro. Ця технологія дозволяє моделі розглядати кілька гіпотез перед формуванням відповіді, що суттєво покращує її здатність вирішувати складні математичні задачі та програмувати.

Оновлена версія Gemini 2.5 Flash стала ефективнішою, використовуючи на 20-30% менше токенів у процесі обробки інформації, зберігаючи при цьому високу якість результатів. Обидві моделі отримали можливість нативного аудіовиводу для природнішого діалогового досвіду, покращені засоби безпеки та можливості використання комп'ютера через Project Mariner.

Революційні новинки Gemini App: Від Veo 3 до Canvas

Додаток Gemini отримав сім масштабних оновлень, серед яких одними з найцікавіших є:

Gemini Live з можливістю обміну камерою та екраном тепер доступний безкоштовно на Android та iOS для всіх користувачів. Ви можете навести телефон на будь-який об'єкт і обговорити його з Gemini.
Imagen 4 – нова модель генерації зображень, що вбудована в додаток і відома своєю якістю, кращим відтворенням тексту та швидкістю роботи.
Veo 3 – найсучасніша модель генерації відео, що є першою в світі з нативною підтримкою звукових ефектів, фонових шумів та діалогів між персонажами.
Deep Research і Canvas отримали суттєві оновлення, що відкриває нові способи аналізу інформації, створення подкастів та розробки веб-сайтів і додатків.
Gemini тепер доступний у Chrome, що дозволяє ставити питання під час перегляду веб-сторінок.

Нові тарифні плани: Google AI Pro та Google AI Ultra

Компанія представила два нових тарифних плани для шанувальників штучного інтелекту:

Google AI Pro за $19.99/місяць, що дає доступ до набору інструментів ШІ та замінює Gemini Advanced. Він також включає такі продукти як Flow, NotebookLM та інші з особливими функціями та вищими лімітами.

Google AI Ultra за $249.99/місяць, призначений для користувачів, які потребують доступу до найпотужніших моделей з найвищими обмеженнями та раннього доступу до експериментальних продуктів ШІ. Власники цього плану отримають доступ до ексклюзивних функцій, включаючи Veo 3 та майбутній 2.5 Pro Deep Think.

Gemini в Chrome та інші інтеграції

Google анонсувала інтеграцію Gemini в браузер Chrome, що дозволить користувачам легко отримувати відповіді під час перегляду веб-сайтів. Ця функція спочатку буде доступна для передплатників Google AI Pro та Google AI Ultra у США, які використовують англійську мову в Chrome на Windows та macOS.

В майбутньому Gemini зможе працювати з декількома вкладками та серфити по веб-сайтах від імені користувача, що значно спростить пошук інформації та виконання завдань в інтернеті.

Android XR та інновації в апаратному забезпеченні

Ще одним важливим анонсом стала платформа Android XR для пристроїв розширеної реальності. Google співпрацює з Samsung над проектом Moohan – першим пристроєм Android XR, а також розробляє легкі окуляри доповненої реальності разом з такими брендами як Gentle Monster та Warby Parker.

Ці окуляри будуть оснащені камерою та мікрофонами, що дозволить Gemini бачити та чути світ навколо користувача, а також динаміками для відтворення відповідей ШІ або музики.

Презентація цих технологій на конференції включала вражаючі демонстрації, зокрема можливість живого перекладу між різними мовами під час розмови.

Вражаючі показники продуктивності Gemini 2.5

Варто відзначити вражаючі показники Gemini 2.5 Pro, який лідирує на популярному лідерборді кодування WebDev Arena з ELO рейтингом 1415. Модель також займає перші позиції на всіх лідербордах LMArena та має контекстне вікно в 1 мільйон токенів, що забезпечує передове розуміння довгого контексту та відео.

Обидві моделі отримали інноваційну функцію "Thought summaries" (Резюме міркувань) в Gemini API та Vertex AI, яка структурує процес мислення моделі з заголовками, ключовими деталями та інформацією про дії моделі, як-от використання інструментів. Також функція "Thinking Budgets" (Бюджети мислення), яка дозволяє контролювати кількість токенів, які модель використовує для міркувань, тепер доступна і для Gemini 2.5 Pro.

Нові можливості для розробників

Google додав нативну підтримку SDK для визначень Model Context Protocol (MCP) у Gemini API для простішої інтеграції з інструментами з відкритим кодом. Також компанія інтегрувала Gemini 2.5 Pro в нативний редактор коду Google AI Studio, що значно спрощує розробку.

Додаткові переваги і можливості

Gemini 2.5 Flash став новою моделлю за замовчуванням. Студенти в усьому світі можуть створювати інтерактивні вікторини, а студенти закладів вищої освіти у США, Бразилії, Індонезії, Японії та Великобританії мають право на безкоштовний навчальний рік плану Google AI Pro.

Нові користувачі Google AI Ultra отримують знижку 50% на перші три місяці використання, а сам план включає індивідуальну передплату YouTube Premium та 30 ТБ сховища Google One (для порівняння, Google AI Pro включає 2 ТБ сховища.

Доступність і розгортання

Gemini 2.5 Flash уже доступний для попереднього перегляду в Google AI Studio для розробників, у Vertex AI для підприємств та в додатку Gemini для всіх користувачів. Повноцінний запуск планується на початок червня, а Gemini 2.5 Pro стане доступним невдовзі після цього.

Agent Mode: майбутнє Gemini

Окрім згаданого раніше, користувачі плану Ultra отримають ранній доступ до Agent Mode – нової експериментальної функції, яка дозволяє Gemini самостійно виконувати складні багатоетапні завдання з мінімальним наглядом. Agent Mode поєднує такі передові можливості, як перегляд вебсторінок, поглиблені дослідження та інтеграцію з додатками Google.

Теги: google

terazus.com є майданчиком для вільної журналістики. Матеріали користувачі завантажують самостійно. Адміністрація terazus.com може не розділяти позицію блогерів і не відповідає за достовірність викладених ними фактів.

Шановні користувачі, просимо вас шановливо ставитися до співрозмовників в коментарях, навіть якщо ви не згодні з їх думкою!