У світі генерації зображень з'явився новий гравець. Стартап Black Forest Labs представив свою розробку – нейромережу FLUX. Ця технологія, за словами творців, перевершує відомих конкурентів, таких як Midjourney і DALL-E. Фахівці впевнені, що їхній продукт здатний задати нові стандарти в індустрії.
Що таке FLUX?
FLUX заснований на унікальній гібридній архітектурі, яка поєднує в собі трансформаторні та дифузійні методи. Модель охоплює 12 мільярдів параметрів, що дає їй змогу ефективно справлятися із завданнями, які раніше викликали труднощі в аналогічних систем. Наприклад, генерація людських рук, яка традиційно була слабким місцем інших ШІ, тепер виконується на високому рівні.
Команда розробників
За проектом стоять досвідчені інженери, які раніше працювали в Stability AI. Робін Ромбах, Андреас Блаттманн і Домінік Лоренц об'єднали зусилля з Патріком Ессером, творцем методу прихованої дифузії. Їхня мета – зробити генеративний ШІ доступним для широкої аудиторії, підвищити довіру до технологій і продемонструвати їхні переваги.
Доступність та ліцензування
FLUX можна завантажити на GitHub, однак варто враховувати, що модель потребує значних ресурсів. Для запуску потрібна відеокарта з достатнім обсягом пам'яті. Стартап пропонує три версії FLUX.1: потужну модель для бізнесу, спрощений варіант для розробників і швидку версію для любителів. Кожна з них має свої особливості та вартість.
Висновок
Із запуском FLUX Black Forest Labs планує не тільки конкурувати з наявними гравцями, а й змінити підхід до генерації зображень. В умовах зростаючої популярності ШІ-технологій, такий крок може мати значний вплив на ринок. Слід очікувати, що нові розробки продовжать радувати користувачів якістю і різноманітністю.











