Улучшенное понимание текстовых подсказок
В отличие от Imagen 2, новая модель гораздо точнее интерпретирует текстовые подсказки, на основе которых генерируются изображения. Это позволяет получать нужный результат, используя простой повседневный язык без сложных формулировок.
Кроме того, в обучающих данных Imagen 3 для каждого изображения добавлено более подробное текстовое описание. ИИ-модель использует эту дополнительную информацию, чтобы лучше передавать мелкие детали в сгенерированных картинках.
Качество и детализация
Imagen 3 отличается высоким качеством генерируемых изображений с реалистичным освещением, композицией и текстурами. Модель способна в точности воспроизводить мелкие детали вроде морщин на ладонях человека или рисунка вязаной игрушки.
Компания улучшила также возможности ИИ по генерации текста на изображениях. Это расширяет сферы применения технологии – от генерации поздравительных открыток до презентаций.
Меры безопасности
При создании новой модели Google использовала последние разработки для обеспечения ответственного подхода к ИИ. В частности, была усилена фильтрация данных для снижения вероятности появления опасного или предвзятого контента.
Кроме того, в Imagen 3 интегрирована технология SynthID – невидимые цифровые водяные знаки, которые позволяют определить источник изображения. Это призвано предотвратить злоупотребление инструментом для создания дипфейков.
Доступность и перспективы
Пока доступ к Imagen 3 предоставлен ограниченному кругу пользователей и разработчиков. Однако в ближайшие месяцы модель станет доступна в приложениях Google, рекламных сервисах и других продуктах.
Google также планирует добавить в Imagen 3 популярные функции редактирования изображений из Imagen 2 – заполнение и расширение выделенных областей.
Выводы
Выход Imagen 3 – значительный шаг в развитии технологий генеративного ИИ. Новая модель от Google выдает изображения еще более высокого качества и лучше понимает контекст заданий. При этом компания внедрила дополнительные меры контроля для предотвращения злоупотреблений.
Масштабное распространение Imagen 3 в продуктах Google откроет новые перспективы применения ИИ для миллионов пользователей и бизнесов. В то же время это вызывает опасения относительно возможных негативных последствий мощных генеративных технологий.










