Stable Diffusion 3 — новый ИИ-генератор изображений, способный корректно отображать текст
Компания Stability AI, стоящая за Stable Diffusion — инструментом, использующим генеративный ИИ для создания изображений из текстовых запросов, представила Stable Diffusion 3 — модель следующего поколения.
Stability AI заявила, что новая модель, которая пока не доступна широкой публике, улучшает качество изображений, лучше справляется с запросами, содержащими несколько объектов, и может более точно воспроизводить текст как часть сгенерированного изображения — с этим предыдущие модели Stable Diffusion справлялись не очень хорошо.
Генеральный директор Stability AI Эмад Моск опубликовал несколько примеров на X.
Анонс последовал спустя несколько дней после того, как главный конкурент Stability AI компания OpenAI представила Sora — абсолютно новую ИИ-модель, способную генерировать почти реалистичные видео высокого разрешения из простых текстовых запросов.
Sora, которая также пока недоступна для широкой публики, вызвала опасения по поводу своего потенциала создавать реалистично выглядящие фейковые видео. OpenAI заявила, что работает с экспертами, чтобы протестировать инструмент перед его широким распространением.
Stability AI заявила, что делает то же самое:
[Мы] предприняли и продолжаем предпринимать разумные шаги, чтобы предотвратить неправильное использование Stable Diffusion 3 злоумышленниками. Благодаря постоянному сотрудничеству с исследователями, экспертами и нашим сообществом мы рассчитываем и дальше инновационно развиваться, сохраняя принципиальность по мере приближения к публичному релизу модели.
Неясно, когда Stable Diffusion 3 будет выпущена для широкой аудитории, скорее всего долго ждать не придется.
- Stable Diffusion 3.5 улучшает точность следования промптам и генерирует более разнообразных людей
- Stability AI обсуждает продажу из-за нехватки денег
- Midjourney обвиняет Stability AI в краже изображений и запрещает доступ ее сотрудникам