Скорость и качество: почему Stable Diffusion XL Turbo – это прорыв в области генеративных технологий

4 декабря 2023 в 13:04

Компания Stability AI представила новую модель искусственного интеллекта Stable Diffusion XL Turbo. Она способна генерировать изображения на основе текстового описания с невиданной ранее скоростью. Так, картинка разрешением 512 на 512 пикселей генерируется всего за 207 миллисекунд. В чем секрет такой производительности и какие перспективы открывает эта разработка? Давайте разбираться.

Революционная технология, доступная всем

В основе Stable Diffusion XL Turbo лежит запатентованная технология Adversarial Diffusion Distillation (ADD). Она позволяет создавать изображения за один шаг вместо 20-50, необходимых в предыдущих моделях. Это стало возможным благодаря использованию машинного обучения с подкреплением на базе существующих генераторов изображений.

Хотя детализация получаемых изображений несколько ниже, чем в обычной модели Stable Diffusion XL, скорость впечатляет. На видеокарте Nvidia A100 генерируется картинка 512х512 пикселей всего за 207 миллисекунд!

Эксперименты и доступность модели

Пока Stable Diffusion XL Turbo доступна только для некоммерческого использования. Однако компания не исключает появления коммерческой версии в будущем. Уже сейчас можно попробовать бета-версию генератора на платформе Clipdrop.

Потенциал применения

Благодаря скорости, сравнимой со «скоростью мысли», Stable Diffusion XL Turbo открывает путь к созданию интерактивных ИИ-фильтров и графики в компьютерных играх в режиме реального времени. Конечно, предстоит решить проблемы согласованности изображений в видеопотоке, но будущее однозначно за подобными разработками.

terazus.com є майданчиком для вільної журналістики. Матеріали користувачі завантажують самостійно. Адміністрація terazus.com може не розділяти позицію блогерів і не відповідає за достовірність викладених ними фактів.

Шановні користувачі, просимо вас шановливо ставитися до співрозмовників в коментарях, навіть якщо ви не згодні з їх думкою!