В сентябре 2023 года OpenAI представили обновленную версию нейросети для генерации изображений – DALL-E 3. Обновленный ИИ получил интеграцию с ChatGPT и справляется со сложными промптами лучше предыдущей версии Дали. На этой странице вы найдете подробный обзор нейросети, сравнение с предыдущей версией, а также инструкцию, как получить доступ к DALL-E 3 бесплатно.
Обзор DALL-E 3 и примеры работы ИИ
DALL-E 3 – продолжение линейки нейросетей от OpenAI для генерации изображений. Третья версия DALL-E AI по-прежнему позволяет сгенерировать любое изображение по текстовому описанию, но делает это качественней.
Новая версия DALL-E обладает 12 миллиардами параметров, которые являются когнитивными блоками модели, что позволяет искусственному интеллекту понимать значительно больше нюансов и деталей из промпта, чем раньше. Благодаря этому теперь вы можете максимально точно воплотить любые идеи в жизнь, нейросеть сгенерирует изображение с максимальным вниманием к мельчайшим деталям.
Например, по запросу “Tiny potato kings wearing majestic crowns, sitting on thrones, overseeing their vast potato kingdom filled with potato subjects and potato castles” нейросеть сгенерировала:
В этом примере видно, что нейросеть обработала абсолютно все указания в запросе, не оставив без внимания ни короны на голове, ни замок, ни другие детали. Это одно из ключевых отличий от предыдущей версии – теперь ИИ максимально внимательно относится к деталям и учитывает все параметры при создании изображения.
Сравнивая DALL-E с конкурентами, такими как MidJourney, третья версия Дали чаще остальных ИИ выдавала результат, соответствующий исходному запросу. Не удалось воспроизвести ситуацию, чтобы DALL-E 3 проигнорировала один из параметров в запросе.
DALL-E 3 работает с любыми темами в различных стилях. Например, по запросу “A paper craft art depicting a girl giving her cat a gentle hug. Both sit amidst potted plants, with the cat purring contentedly while the girl smiles. The scene is adorned with handcrafted paper flowers and leaves.” вы можете получить подобное изображение:
Как и в предыдущем примере работы нейросети, DALL-E 3 максимально полно обработала все требования в промпте, добавив на изображение даже мельчайшие детали, например, что девушка на картинке должна улыбаться.
Помимо внимания к нюансам, DALL-E 3 теперь лучше обрабатывает запросы на создание изображений людей. Предыдущие версии Дали не всегда корректно рисовали конечности, например, на кадрах появлялись 3 ноги или 6 пальцев на руке, в новой версии от этого бага избавились. Также улучшились пропорции – теперь люди получаются анатомически корректными, в том числе в различных графических стилях.
Например, DALL-E 3 по запросу “School girl in the USA, playing with a puppy next to the yellow school bus at the autumn” сгенерировала следующее изображение:
В кадре мы видим корректное анатомическое строение тела, пропорциональное лицо и плечи, а также корректную отрисовку кистей. Также корректно отрисована и собака. В предыдущей версии Дали шанс возникновения аномалий был значительно более высокий.
DALL-E 3 и ChatGPT
Одно из ключевых нововведений DALL-E – третья версия ИИ теперь интегрирована с ChatGPT, а значит вы можете получить преимущества от каждой нейронки.
OpenAI объединили два собственных продукта в одном, поэтому теперь вы можете использовать ChatGPT для взаимодействия с DALL-E 3. Совместная работа упрощает процесс создания изображений. Например, вы можете сгенерировать полноценный промпт для DALL-E 3 через запрос в ChatGPT, либо же использовать ChatGPT для уточнения промпта или просто для совместного мозгового штурма над задачей.
В официальном ролике OpenAI виден сценарий использования связки DALL-E с ChatGPT – когда нейросеть отвечает на запрос генерацией изображения:
DALL-E 3 и DALL-E 2
Разница в результате DALL-E 3 и DALL-E 2 видна на примере готовых работ. Сам принцип работы остался схожим, но теперь вы можете поручить часть задач ChatGPT.
Как и в предыдущих версиях, DALL-E 3 искусственно ограничивает создание некоторых изображений. Например, вы не сможете создать изображения некоторых известных деятелей. Это сделано с целью предотвращения мошенничества или других вредоносных действий.
Из нового – теперь нейросеть сильней ограничивает создание изображений в стиле некоторых деятелей искусства. Неизвестно, если это сделано под давлением сообщества, которое активно призывало ограничить нейросети. Более того, OpenAI открыла приём заявок от художников, для исключения их работ.
OpenAI в новой версии DALL-E внимательней относится к соблюдению этических норм. И ранее нельзя было создать контент, содержащий насилие и другой неподобающий контент, но в новой версии контроль за соблюдением этических норм усилен. Кажется, OpenAI удалось предотвратить любые злоупотребления ИИ, так как пока не удалось воспроизвести примеры “взрослого” контента или другой неподобающей информации в DALL-E 3.
Совет: если вы хотите создать изображения 18+, то используйте специализированные нейросети. Собрали подборку лучших решений на этой странице.
Как пользоваться DALL-E 3
Существует два способа, как пользоваться DALL-E 3:
- Бесплатно: через Bing
- Платно: через подписку ChatGPT Plus
Платный способ появился 3 октября, когда OpenAI добавила в ChatGPT возможность генерировать изображения. Эта опция доступна прямо из чата – вы можете либо самостоятельно написать промпт и получить картинку, либо запросить ChatGPT помочь сначала составить промпт, а затем использовать его для генерации изображения.
Бесплатный доступ интересен как минимум для теста ИИ, но им вполне можно пользоваться и для других задач. Microsoft даёт бесплатный доступ к DALL-E в двух независимых продуктах – Bing.com и Microsoft Designer. Первое – поисковая система, и именно в Bing уже доступна третья версия ИИ, в Microsoft Designer изображения создаются с помощью DALL-E 2.5:
Как получить доступ к DALL-E 3 бесплатно
Бесплатный доступ появился раньше платного (в сентябре 2023 года) и по-прежнему отлично работает, но есть ограничения:
- Не работает из России – вам потребуется VPN (можете использовать любой IP за пределами России).
- Потребуется аккаунт Bing.com – можно зарегистрировать бесплатно или использовать аккаунт от любого сервиса Microsoft.
- Быстрое создание до 25 изображений – изначально доступно 25 изображений в сутки, далее лимит обновляется. По исчерпанию лимита инструмент продолжает работать, но время ожидания результатов существенно увеличится. Вы можете получить дополнительные бесплатные лимиты в рамках Microsoft Rewards.
Чтобы получить доступ к нейросети DALL-E 3 бесплатно, вам необходимо проделать следующее:
- Подключиться к VPN – Европа, США или другая страна, кроме России. Если вы не в России, то можете переходить к следующему пункту сразу же.
- Зайти на страницу инструмента Image Creator на Bing.com.
- Создать аккаунт на Bing.com, а если уже есть, то авторизоваться.
- Задать запрос нейросети на английском языке и кликнуть кнопку “Create”:
Совет: если вы не говорите на английском, для формирования запроса можете использовать Google Translate, Deepl или любой другой бесплатный онлайн-переводчик.
Image Creator на Bing.com работает на базе самой свежей версии нейросети – DALL-E 3, поэтому вы получите точно такой же результат, как при работе через платную подписку ChatGPT. Разница в том, что ChatGPT не поможет вам составить запрос к DALL-E 3, придется писать самостоятельно на английском или в бесплатной версии ChatGPT самостоятельно собрать запрос к нейросети, затем скопировать его в Bing.
Совет: если у вас ранее был аккаунт в Skype или любом другом сервисе Microsoft, вы можете использовать этот аккаунт для доступа к Bing.com.
Пример работы нейросети DALL-E 3 через Bing.com для запроса: “photo of Turkish middle age woman with Turkish tea cup in her hands, walking down street in Istanbul next to the sea, wearing classic Turkish clothes”:
Один запрос даёт 4 результата и расходует один из 25 бесплатных ускоренных выполнений заданий. Полученный результат можно сохранить в разрешении до 1024х1024 пикселей, а также поделиться онлайн:
На всех картинках в бесплатной версии DALL-E 3 будет водяной знак Bing. Его можно легко обрезать в Фотошопе или любом другом инструменте, так как накладывается лишь небольшой логотип в углу. Поэтому бесплатный способ позволяет фактически использовать DALL-E 3 без водяного знака.
Чем пользоваться – DALL-E 3 или аналогами
DALL-E 3 – это безусловно шаг вперед, и при наличии третьей версии искусственного интеллекта, нет никакого смысла пользоваться устаревшими вариантами DALL-E.
Хоть новая версия и более тщательно оберегает этические нормы, но и предыдущие версии Дали также не давали сгенерировать спорный контент за исключением редких случаев. Подобное ограничение не позволяет DALL-E стать универсальным решением, так как часть задач ИИ не сможет выполнить.
Основными аналогами DALL-E 3 по-прежнему останется MidJourney и Stable Diffusion. В вашей работе вы можете использовать любой из трех вариантов ИИ, который позволит добиться наилучшего для вас результата.