Може ли автентичното изкуство наистина да бъде защитено от AI? Творците изглеждат все по-безсилни.

Генеративните AI инструменти като Midjourney и Stable Diffusion произвеждат все по-убедителни визуализации. И все пак те разчитат на огромни бази данни от работата на творците, за да генерират своето съдържание. В този момент може би се чудите дали има начин да защитите работата си от AI инструменти и отговорът е: това е сложно.

Генеративните AI инструменти използват модели за машинно обучение, които са обучени да извършват действия, използвайки големи набори от данни. Да кажем, че говорим за AI генератор на изображения като Midjourney. В този случай наборите от данни, използвани за обучение, включват милиарди двойки изображения и текст – от произведения на легендарни художници като Пикасо до професионални и любителски творци.

Генераторите на изкуство с изкуствен интелект използват тези двойки медия-текст, за да генерират визуално съдържание в отговор на потребителски текстови подкани. По принцип те използват работата на съществуващи художници и съчетават модели с текстови двойки (социални публикации, надписи, алтернативен текст и т.н.), така че потребителите да могат да генерират нови визуални елементи от подкани като „звездно нощно небе в стила на Винсент ван Гог“ или „неоноар сцена на детектив, който пие уиски през 50-те години в центъра на града Ел Ей”.

instagram viewer

Защо толкова много артисти са разстроени?

Най-голямото оплакване от творците е, че генеративните AI инструменти използват работата им без разрешение. Те не просто използват работата си за обучение на алгоритми.

Маркетинговите разговори за генеративния AI предполагат, че тези инструменти създават уникално съдържание, но не го правят. Това, което наистина правят, е да комбинират данни от множество произведения на изкуството и да ги обединят, за да генерират нещо, което отговаря на подканата на потребителя.

Самият термин генериране на AI е подвеждащ. AI репликацията би била по-точна и трикът с тези инструменти е, че те репликират големи обеми произведения на изкуството и ги смесват заедно.

Генеративните AI инструменти са предназначени да заменят рекламните послания – и те го правят, като използват своите произведения на изкуството. И като че ли това не е достатъчно лошо, повечето AI инструменти правят всичко това, без да искат разрешение, без да предлагат каквато и да е компенсация или дори да признават оригиналните създатели.

За съжаление, единственият начин да попречите на инструментите за изкуствен интелект да имат достъп до което и да е вашето съдържание е да не публикувате нищо онлайн. Може да звучи крайно, но това е реалността. Разбира се, можете да използвате файла robots.txt на уебсайта си, за да блокирайте инструментите за изкуствен интелект от изстъргване на уебсайта ви, или защитете вашите изображения от AI като се откажете от набори от данни за обучение, но тези методи имат няколко ограничения.

Първо, командите във файла robots.txt са препоръчителни, което означава, че сайтовете нямат правно задължение да се придържат. Второ, ще трябва да блокирате компания като Google да обхожда уебсайта ви, което на практика е самоубийство за SEO. И накрая, файлът robots.txt ви дава само (ограничен) контрол върху достъпа до вашия уебсайт, той не прави нищо, за да защити съдържанието, което публикувате другаде: социални медии, облачни услуги и т.н.

За съжаление на творците, пейзажът ще се влоши, преди да стане по-добър.

Политиката за поверителност на Google може да означава, че използва цялото онлайн съдържание, за да обучи своите AI алгоритми

През юли 2023 г. Google актуализира политиката си за поверителност, за да заяви, че ще използва онлайн съдържание, за да обучи своите AI системи, включително Brad, Google Translate и други. Google използва израза „публично достъпни източници“. Ето цитата, който предизвика някои тревоги след актуализацията:

„Например, можем да събираме информация, която е публично достъпна онлайн или от други обществени източници, за да помогнем обучете AI моделите на Google и изградете продукти и функции, като Google Translate, Bard и Cloud AI способности.“ – Правила за поверителност на Google

С други думи, Google сега казва, че всичко, което публикувате онлайн, е готово за грабване. Най-малкото Google улеснява сравняването на актуализациите на своята политика за поверителност, като подчертава най-новите промени:

Както можете да видите, промените във формулировката са доста фини, но последиците са значителни. Преди това основните функции на езиковите модели на Google бяха интерпретиране на заявки за търсене и превод на текст на други езици.

Сега компанията казва, че може да използва всички обществено достъпни източници, за да обучи пълния си набор от AI модели. Това включва неговата генеративна AI система, Bard, и се разширява отвъд езиковите модели, за да включва всички инструменти/функции на AI на Google – най-очевидният пример е генерирането на изображения.

Социалните мрежи могат да използват всяко съдържание, което публикувате на техните платформи

Meta също има неограничен достъп до всичко, публикувано във Facebook, Instagram и Threads. Това е стандартна практика за социални платформи, ако прочетете T&Cs. Веднага след като качите нещо в социална мрежа, те имат правата да го използват и използват повторно по какъвто начин пожелаят.

Изобилие от социалните потребители са открили компании, използващи техни изображения в реклами без разрешение, включително рекламни послания. За съжаление, ако тази компания е социалната мрежа, в която сте качили изображението, компанията майка на мрежата или друга марка, собственост на същата компания майка, нямате късмет.

За повечето хора шансовете платформа като Instagram да използва едно от техните изображения за рекламна кампания са сериозно ниски. Въпреки това Meta почти сигурно използва вашите изображения, видеоклипове и публикации, за да обучи своите AI алгоритми.

Услуги като Adobe могат да имат достъп и да използват вашата работа, за да обучават своите алгоритми

През януари 2023 г. Adobe хвана известно време за актуализация на своите T&C. Изглежда, че езикът предполага, че Adobe може да използва изображения, качени в своите облачни услуги от фотографи, за да обучи своите AI алгоритми.

Конкретната формулировка беше следната:

„Adobe може да анализира вашето съдържание, използвайки техники като машинно обучение (напр. за разпознаване на образи), за да разработи и подобри нашите продукти и услуги.“

За да влоши нещата, Adobe автоматично включваше потребителите в тази система за анализ на съдържанието, което означаваше, че те трябваше ръчно да я изключат в настройките на акаунта си. Разбираемо, творците не реагираха твърде любезно и Adobe разпали пламъците, като първоначално не отговори на критиките.

Седмици по-късно Adobe заяви, че не се използват данни на клиенти за обучение на неговите генеративни AI инструменти. Компанията нарече инцидента сигнал за събуждане и обеща да изясни всяко объркване, като направи формулировката на своята политика по-конкретна.

Така или иначе остава фактът, че ако Adobe иска да използва клиентски данни, за да обучи своите AI системи, никой не може да направи нищо по въпроса - освен бойкот. В същото време Adobe получава своите данни за инструменти като Generative Fill отнякъде, така че използва работата на художници по един или друг начин.

Технологичните компании имат почти неограничен достъп до вашите данни... за сега

В момента технологичните гиганти като Google и Meta имат почти неограничен достъп до данните на рекламните послания. Проучването върху обработката на потребителски данни е почти толкова старо, колкото интернет, но регулациите за поверителност все още наваксват.

На Европейския съюз отне до 2018 г., за да приложи своите Указания за поверителност на GDPR и те са направили малко за защита на потребителските данни.

Generative AI е напълно ново минно поле с почти никакви регулации, които да ограничават действията на технологичните компании в това пространство. За момента компании като Google и OpenAI могат да правят почти всичко, което поискат с нашите данни и това няма да се промени скоро.

В крайна сметка ще са необходими съдебни дела и регулации, за да се защитят артистите от AI

Докато генеративният AI и неговият достъп до потребителски данни не бъдат регулирани, творците са почти безсилни да спрат технологията. Най-вероятният сценарий би бил промени в законите за авторското право или, потенциално, нови защити на данните, свързани с творческата собственост. И в двата случая ще отнеме много време, за да видим въвеждането на нови разпоредби и след това тяхното прилагане.

Положителното за творците е, че съдебните дела срещу генеративния ИИ се трупат бързо и това може да ускори правния отговор. Лошата новина е, че някои от замесените технологични компании разполагат със законните средства, за да проточат тези случаи през най-отнемащите време пътища на надлежен процес.

Междувременно етичните въпроси, висящи над поколението на изкуството с изкуствен интелект, ще останат.