Покращене розуміння текстових підказок
На відміну від Imagen 2, нова модель набагато точніше інтерпретує текстові підказки, на основі яких генеруються зображення. Це дає змогу отримувати потрібний результат, використовуючи просту повсякденну мову без складних формулювань.
Крім того, в навчальних даних Imagen 3 для кожного зображення додано більш докладний текстовий опис. ШІ-модель використовує цю додаткову інформацію, щоб краще передавати дрібні деталі в згенерованих картинках.
Якість і деталізація
Imagen 3 вирізняється високою якістю зображень, що генеруються, з реалістичним освітленням, композицією і текстурами. Модель здатна в точності відтворювати дрібні деталі на кшталт зморшок на долонях людини або малюнка в'язаної іграшки.
Компанія поліпшила також можливості ШІ з генерації тексту на зображеннях. Це розширює сфери застосування технології – від генерації вітальних листівок до презентацій.
Заходи безпеки
При створенні нової моделі Google використовувала останні розробки для забезпечення відповідального підходу до ШІ. Зокрема, було посилено фільтрацію даних для зниження ймовірності появи небезпечного або упередженого контенту.
Крім того, в Imagen 3 інтегровано технологію SynthID – невидимі цифрові водяні знаки, які дають змогу визначити джерело зображення. Це покликане запобігти зловживанню інструментом для створення діпфейків.
Доступність і перспективи
Поки що доступ до Imagen 3 надано обмеженому колу користувачів і розробників. Однак найближчими місяцями модель стане доступною в додатках Google, рекламних сервісах та інших продуктах.
Google також планує додати в Imagen 3 популярні функції редагування зображень з Imagen 2 – заповнення і розширення виділених областей.
Висновки
Вихід Imagen 3 – значний крок у розвитку технологій генеративного ШІ. Нова модель від Google видає зображення ще більш високої якості і краще розуміє контекст завдань. При цьому компанія впровадила додаткові заходи контролю для запобігання зловживанням.
Масштабне поширення Imagen 3 у продуктах Google відкриє нові перспективи застосування ШІ для мільйонів користувачів і бізнесів. Водночас це викликає побоювання щодо можливих негативних наслідків потужних генеративних технологій.










