Генераторите на изкуство с изкуствен интелект имат лоша репутация за създаване на неточни изображения на ръце. Нека изправим Midjourney v5 срещу Dall-E 2, за да видим кой се справя по-добре.
Генераторите на изкуство с изкуствен интелект продължават да впечатляват, позволявайки ни да създаваме почти всичко, което можем да си представим. Въпреки това, технологията изглежда е ударила тухлената стена, когато става въпрос за генериране на реалистично изглеждащи ръце.
Тук разглеждаме две от водещите приложения за генеративно изкуство и ги изправяме лице в лице — или ръка в ръка — за да видим кое може да генерира по-добри ръце, Midjourney v5 или Dall-E 2. Някое от тези приложения овладяло ли е ръцете? Нека разберем!
Проблемът на AI с ръцете
Откакто изкуството, генерирано от AI, стана широко разпространено в интернет, имаше критики по отношение на качество на ръцете, начертани от AI. Въпреки последните актуализации, както е показано в нашите паралелни сравнения, резултатите не са задоволителни.
И двамата претенденти подобряват своите способности и качеството на резултатите си с всяка итерация. Най-новата актуализация,
Версия 5 на Midjourney, показа впечатляващ напредък. Въпреки това, проблемът с ръцете, начертани от AI, остава неразрешен и не може да бъде пренебрегнат.Сравнение 1: Използване на подканите „Hand“ и „Hands“
Нашите сравнения ще съдържат същите подкани както за Dall-E 2, така и за Midjourney v5. Ще проектираме подканите да бъдат специфични за ръката, вместо просто да създаваме хора, които да видят как изглеждат ръцете. Също така даваме на всяко приложение само един шанс (хвърляне) за всяка подкана.
ръка
Нека започнем нещата с най-основната и подходяща подкана: „ръка“.
Midjourney v5:
Dall-E 2:
Не сме започнали добре!
Midjourney пое по необичайния начин да асоциира ръка с доста креативни ситуации. Вместо да се фокусираме само върху ръка, виждаме магьосник, ръкавици, скелет и малка фигурка. На изображението с ръкавици също липсва пръст.
Dall-E 2 използва обратния подход и ни предлага само една ръка на обикновен фон. Но странно, има някои странни пози, особено с палците, които не изглеждат естествени или удобни. Всяка ръка също е отрязана от едната страна на изображенията.
Кой печели този кръг? Ще го дадем на Dall-E 2 за цялостна точност.
Ръце
Сега, нека направим подканата множествено число "ръце" и да видим какво ще измислят ИИ.
Midjourney v5:
Dall-E 2:
Опитът на Midjourney за "ръце" се оказа по-добър този път. Но и четирите изображения са черно-бели и имаме някои липсващи пръсти. При по-внимателно разглеждане можете също да видите, че някои от цифрите са странно оформени или преливат една в друга.
Dall-E 2 продължава да включва ръце с обикновен фон. Няма липсващи цифри, но ръцете са изрязани на третото изображение, а другите версии изглеждат някак тромави като композиция и им липсва креативност.
Нека наречем това сравнение равенство. Dall-E 2 би спечелил за точност, ако това беше единственият фактор, но Midjourney успява да създаде някои красиви изображения в своите черно-бели предавания, дори и четирите версии да не са много реалистичен.
Винаги можеш използвайте Photoshop, за да коригирате вашето изкуство Midjouney, включително ръцете.
Сравнение 2: Жестове с ръце
Нека сравним няколко жеста с ръце, които са почти универсално разпознати.
Стискам палци
Първо, нека опитаме "стискаме палци".
Midjourney v5:
Dall-E 2:
Безопасно е да се каже, че Midjourney напълно провали тази подкана. Липсват ни пръсти и нито една от версиите не изглежда естествено.
Шапки долу още веднъж на Dall-E 2 за правилното преброяване на пръстите, но това е единствената добра новина. Всяка версия изглежда така, сякаш пръстите заемат свои собствени йога пози в игра на Twister.
Няма победител в това сравнение.
Палец нагоре
След това тръгваме с "вдигнат палец".
Midjourney v5:
Dall-E 2:
Midjourney прави преброяването на пръстите правилно, като същевременно третира всяка подкана по креативен начин. Забелязвате въвеждането на илюстративен стил?
Dall-E 2 също получава точки за точност, като същевременно не се опитва да разтърси лодката с нещо креативно, добавено към всеки резултат.
Тук няма ясен победител.
Сравнение 3: Ръце с предмети
Сега ще увеличим сложността, като подтикнем ръцете да взаимодействат с обектите.
Ръка, държаща кристална топка
Нека започнем с произволен обект, използвайки подканата „ръка, държаща кристална топка“.
Midjourney v5:
Dall-E 2:
Докато издигаме сложността, Midjourney започва да блести. Освен че няколко от изпълненията изглеждат неестествени, ръцете и кристалните топки изглеждат красиви. Midjourney дори отделя време, за да създаде отражения в стъклото, които със сигурност допринасят за цялостната креативност.
Но за първи път виждаме Dall-E 2 да липсва цифра в поне една от ръцете, като четвъртата ръка изглежда просто странно. Кристалните топки също не изглеждат толкова впечатляващи в сравнение с тези на Midjourney.
Midjourney печели първата си победа.
Ръка, която държи вода
Нека опитаме нещо още по-сложно с подканата „ръка, която държи вода“.
Midjourney v5:
Dall-E 2:
Midjourney успява да превърти само едно изображение с правилния брой цифри. Макар и красиво изобразено, отново започваме да виждаме пукнатините в отдела за достоверност.
Dall-E 2 също се бори с постигането на естествени ръце, но върши много по-добра работа. Той превключва и цвета на фона за известно разнообразие.
Ще дадем този кръг на Dall-E 2.
Сравнение 4: Работещи ръце
За това сравнение ще създадем подкани, в които ръцете участват в дейности.
Ръце за формоване на глина
Нека да видим как моделите с изкуствен интелект се справят с „ръчно формоване на глина“.
Midjourney v5:
Dall-E 2:
Midjourney пропусна пръст в две изображения, но всичко останало изглежда страхотно.
Изображенията на Dall-E 2 изглеждат объркващи и претъпкани, прибягвайки до добавяне на ръце на друг човек в половината от версиите.
Ръбът отива към Midjourney.
Притискане на тесто с ръце
Нека опитаме подобна дейност, "ръце пресоване на тесто".
Midjourney v5:
Dall-E 2:
Изображенията на Midjourney изглеждат страхотно като цяло. Но отново половината от тях имат липсващи цифри. Но изображенията не могат да бъдат обвинявани за техния артистичен стил.
Във версиите на Dall-E 2 също липсват пръсти в половината от предаванията и дори добавят един към последната ръка в комплекта.
Нека наречем това равенство.
Ако искате сами да опитате тези сравнения, ние ви показваме как да използвате Midjourney за създаване на AI изкуство.
Какво ни казват резултатите?
Забавно е да правите сравнения и да определяте общ победител. И ако трябваше да избираме, бихме го избрали в полза на Midjourney v5. Въпреки че Dall-E 2 създава ръце с правилния брой пръсти по-често, именно Midjourney създава по-артистично изобразени и привлекателни изображения.
Но и двете приложения имат място на пазара за художници, които пренасочват изображенията на Dall-E 2 и Midjourney за своята работа. И двете са в състояние да създават ръце, които могат да се използват като изрезки или в композити за артистична, редакционна и търговска употреба. Това е просто въпрос на лични предпочитания.
AI в крайна сметка ще завладее ръцете
Приложенията за генериращо изкуство като Dall-E 2 и Midjourney изминаха дълъг път в способността си да създават реалистично и фантастично изкуство. Те все още се борят с генерирането на ръце, но като се има предвид ускоряването на генеративните технологии, можем да очакваме подобрение само в близко бъдеще.