Нека изправим един срещу друг най-големите играчи на изкуствен интелект и да видим кой ще излезе на върха. DALL-E, Midjourney или Stable Diffusion?
Изкуственият интелект измина дълъг път в областта на генерирането на изображения. Генеративните приложения като DALL-E, Midjourney и Stable Diffusion имат дълбок ефект върху начина, по който взаимодействаме с цифрово съдържание.
В тази статия ще сравним всяко приложение, за да видим кое е по-добро като цяло в генерирането на изображения въз основа на текстови подкани. Да започваме!
DALL-E 2
DALL-E 2 има прост интерфейс, който е лесен за разбиране и е лесно да започнете да генерирате изображения, без да се налага да се регистрирате в платформа на трета страна. Просто отидете на уебсайта и въведете текста си в Генерирай кутия за създаване на изображение. След това DALL-E 2 ще създаде четири версии на подканата, които можете да редактирате или изтеглите.
Отличителна функция
Една забележителна характеристика на DALL-E 2 е възможността за създаване, редактиране и сливане на множество изображения заедно. След като изберете изображението, което искате, и щракнете
редактиране, ще имате възможността да използвате Добавяне на рамка за генериране функция за добавяне на допълнителни поколения изображения към съществуващото.След като поставите рамката, въведете нова подкана и DALL-E 2 ще генерира нов набор от изображения с опция за сливане на всяко от тях в оригиналното изображение.
След това можете да използвате всяка от функциите за редактиране, за да създадете изображението до съвършенство. Например, можете да използвате Изтрива инструмент за изтриване на съществуващи пиксели и след това въведете нов текст в полето Генериране, за да го попълните. Можете да направите това няколко пъти, за да получите желаните резултати.
Но не забравяйте, че всеки път, когато щракнете върху Генериране, използвате кредити. И след като вашето разпределение бъде използвано, ще трябва да закупите още кредити, за да продължите.
Професионалисти
- Лесен за използване
- Много творческа гъвкавост
- Не е необходима платформа на трета страна
минуси
- Опростени изображения
- Не е висока степен на точност
- Може да създава само квадратни изображения
Ние покриваме основите на DALL-E 2 ако никога преди не сте го използвали.
По средата на пътуването
По средата на пътуването е спорно AI генераторът на текст към изображение, който да победи. Със своя мощен набор от функции, той е в състояние да създава високо артистични и правдоподобни изображения, които други конкуренти с изкуствен интелект тепърва трябва да постигат постоянно. Но за разлика от DALL-E 2, трябва да създадете Discord акаунт, преди да започнете да го използвате.
Дори с добавените слоеве на сложност и въпреки факта, че трябва да въвеждате команди като /imagine за да генерирате вашите изображения, скоро ще простите Midjourney заради красивото изкуство, което можете да създадете с няколко думи.
Както при DALL-E 2, създават се четири версии и можете да изберете една или повече от тях, за да изтеглите или създадете варианти. Но има повече гъвкавост при съотношенията на изображенията; можете да направите всяко съотношение, което предпочитате, като добавите всяко изображение с --ар и след това последвано от съотношението, в нашия пример, 3:2.
Качеството на резултатите е безпогрешна магия на Midjourney.
Отличителна функция
Една от по-вълнуващите и мощни функции на Midjourney е възможността да качвате свои собствени изображения и след това Midjourney да създава подкани за тях, които можете да използвате, за да създавате напълно нови изображения. Чрез писане /describe, ще бъдете помолени да качите едно от вашите изображения.
След като бъде качен, Midjourney ще предложи четири подкани със собствена интерпретация на това, което вижда.
След това можете да използвате тези подкани, за да създадете напълно различен набор от изображения.
С толкова много творческа гъвкавост, Midjourney предлага почти безкрайни възможности.
Професионалисти
- Висококачествени изображения
- Потребителите могат да програмират персонализирани съотношения
- Голяма гъвкавост за контрол на параметрите на изображението
минуси
- По-сложно за използване
- Изисква потребителите да се регистрират в Discord
- Времето за генериране на изображение се увеличава драстично след изчерпване на бързите часове
Можеш създавайте зашеметяващи фонове за портрети с помощта на Midjourney за да изпъкнат вашите снимки.
Стабилна дифузия
Stable Diffusion представлява дивия запад на генеративните AI приложения. С много уеб-базирани приложения и налични опции за инсталиране не е лесно да сравните Stable Diffusion с DALL-E 2 и Midjourney. Това се дължи най-вече на несъответствието между уеб версиите и инсталационните модели по отношение на опциите и качеството на изхода. С други думи, версиите на инсталираната Stable Diffusion обикновено ще ви дадат много по-добри резултати и творческа свобода.
Ще разгледаме официалния уебсайт на Stable Diffusion, DreamStudio от Stability AI, и ви показва как да започнете да използвате приложението, за да ви даде основна представа за неговите възможности.
Оформлението на Stable Diffusion в DreamStudio е по-разхвърляно от DALL-E 2 и Midjourney, но все пак е лесно за използване. Пробните потребители получават 200 безплатни кредита за създаване на подкани, които се въвеждат в подкана кутия. Но освен това има и a Отрицателна подкана кутия, където можете да изпреварите Stable Diffusion, за да оставите нещата навън.
Има няколко други основни функции в лявото меню, които трябва да имате предвид, които ще повлияят на цялостния имидж и използването на кредита. Има стил кутия с опции, Качи изображение, и Настройки (за съотношение и брой изображения за генериране). В Разширено раздел, има Бърза сила, Стъпки на поколение, семена, и Модел.
Когато задържите курсора на мишката върху всяка от тези опции, има кратко описание на всяка функция. Но за да разберете наистина какво прави всеки от тях на практика, трябва просто да ги изпробвате. Но следете кредитите си, защото това не е система "един кредит за едно изображение".
Отличителна функция
The Отрицателна подкана е вероятно забележителната функция на Stable Diffusion на DreamStudio. Освен това се предполага, че е страхотен инструмент в други версии на Stable Diffusion, който помага за цялостното качество на изображението. В тези версии въвеждането на отрицателни твърдения помага на алгоритмите да произвеждат по-точни и по-висококачествени изображения.
Когато отрицателните подкани работят, те работят добре. Но в много случаи ще похарчите кредити, опитвайки се да усъвършенствате външния вид, който искате.
Професионалисти
- Множество опции за уеб и инсталирани версии
- Повече творческа свобода (можете да създавате нецензурирани изображения в някои версии)
- Много контроли за персонализиране на параметрите на изображението
минуси
- Изгаря кредити в платени версии
- Стръмна крива на обучение
- Качеството на изображението е много добро, в зависимост от версията, която имате
Ако имате нужда от помощ при създаването на подкани, ние ви показваме как да използвате ChatGPT за създаване на AI изображения.
Кое е по-доброто приложение?
И така, кое е най-доброто приложение, DALL-E 2, Midjourney или Stable Diffusion? Това е труден въпрос, защото потребителите ще имат различни очаквания и има различни версии на тези приложения, които правят преките сравнения нереалистични. Въпреки това можем да оценим всеки от нашите примери по тези категории.
Класиране на качеството на изображението
Midjourney създаде изображения с най-добро качество в нашите примери. Те бяха по-реалистични и по-красиво изобразени от DALL-E 2 и Stable Diffusion.
Лесна употреба
Извън кутията DALL-E 2 беше най-лесният за използване. Не изискваше приложение на трета страна за използване и менюто беше ясно и опростено.
Характеристики и възможности
Midjourney изпреварва своите конкуренти, защото има повече функции и възможности, които създават висококачествени изображения по-последователно.
Скорост
DALL-E 2 създава изображения най-бързо (около 12 секунди), изпреварвайки Stable Diffusion с около секунда и Midjourney (в бърз режим) с по-голяма разлика.
Гъвкавост и персонализиране
Stable Diffusion е в собствен клас за гъвкавост и персонализиране. Има нарастващ брой версии, които позволяват на потребителите не само да създават изображения, които обикновено са цензурирани, но има версии, които дори произвеждат висококачествени изображения, които са директно моделирани от Midjourney изображения.
Midjourney и DALL-E 2 са на първо място в броя на спечелените категории, но общият победител ще трябва да отиде в Midjourney само въз основа на качеството на изображението.
Тъй като конкуренцията се засилва, потребителите на AI съдържание се обслужват по-добре
Най-многото, което можем да предложим, е моментна снимка на най-добрите изпълнители сред DALL-E 2, Midjourney и Stable Diffusion във всеки даден момент. Полето на технологиите за изкуствен интелект непрекъснато се развива, като всеки ден на пазара се присъединяват множество конкуренти. Това е много полезно за потребителите на генеративни AI приложения, тъй като насърчава иновациите и води до намалени разходи за всички нас за достъп до тези невероятни творчески инструменти.