Компания Stability AI представила новую модель искусственного интеллекта Stable Diffusion XL Turbo. Она способна генерировать изображения на основе текстового описания с невиданной ранее скоростью. Так, картинка разрешением 512 на 512 пикселей генерируется всего за 207 миллисекунд. В чем секрет такой производительности и какие перспективы открывает эта разработка? Давайте разбираться.
Революционная технология, доступная всем
В основе Stable Diffusion XL Turbo лежит запатентованная технология Adversarial Diffusion Distillation (ADD). Она позволяет создавать изображения за один шаг вместо 20-50, необходимых в предыдущих моделях. Это стало возможным благодаря использованию машинного обучения с подкреплением на базе существующих генераторов изображений.
Хотя детализация получаемых изображений несколько ниже, чем в обычной модели Stable Diffusion XL, скорость впечатляет. На видеокарте Nvidia A100 генерируется картинка 512х512 пикселей всего за 207 миллисекунд!
Эксперименты и доступность модели
Пока Stable Diffusion XL Turbo доступна только для некоммерческого использования. Однако компания не исключает появления коммерческой версии в будущем. Уже сейчас можно попробовать бета-версию генератора на платформе Clipdrop.
Потенциал применения
Благодаря скорости, сравнимой со «скоростью мысли», Stable Diffusion XL Turbo открывает путь к созданию интерактивных ИИ-фильтров и графики в компьютерных играх в режиме реального времени. Конечно, предстоит решить проблемы согласованности изображений в видеопотоке, но будущее однозначно за подобными разработками.











