Модели с изкуствен интелект като ChatGPT и Bard се обучават с помощта на данни, създадени от хора. Колкото повече данни поглъщат, толкова по-умни стават в имитирането на човешкия интелект и креативност. Големи играчи в AI индустрията, като OpenAI и Meta, внедриха големи езикови модели, обучени чрез извличане на данни от текст и книги, достъпни онлайн.

Поради начина, по който се обучават LLM, беше неизбежно да има конфликт между закона за авторското право и изкуствения интелект. Сега пилетата се прибират вкъщи, за да си легнат, тъй като Сара Силвърман и други художници съдят OpenAI и Meta за нарушаване на авторски права.

в колективен иск [PDF], подадена в Калифорния, комикът Сара Силвърман и други писатели (Кристофър Голдън и Ричард Кадри) търсят възстановяване на щети срещу OpenAI и Meta заради нарушаване на авторски права. В делото се твърди, че OpenAI и Meta са извадили защитени с авторски права книги от пиратски уебсайтове, за да обучат своите AI модели. Това е еквивалентът на AI модел, който изтегля своите набори от данни за обучение от Piratebay, без да компенсира авторите.

instagram viewer

Случайно, а отделен колективен иск [PDF] срещу OpenAI твърди, че компанията е използвала неоторизирана лична информация, за да обучи ChatGPT. Google също е изправен пред подобно съдебно дело за предполагаемо използване на откраднати данни за обучение на Google Bard. Ето защо трябва създайте си навик да защитавате личната си информация, въпреки че издателската работа и частните лични данни не са едно и също.

Какви са шансовете Сара Силвърман да спечели делото?

Кредит за изображение: freepik

Силвърман и други художници твърдят, че ChatGPT може точно да обобщи техните книги, когато бъде подканен. Жалбата твърди, че това не би било възможно, ако AI моделът нямаше достъп до защитения с авторски права материал. Въпреки това, ако ChatGPT е бил обучен с помощта на милиарди интернет текстове, вероятно е попаднал на статии, коментари и публикации в социалните медии, обсъждащи книгите.

Освен това Meta разкри откъде е придобила книгите, които е използвала за обучение на своя AI модел - източникът е проследен до торент уебсайт за електронни книги. По същия начин, груповият иск срещу OpenAI също споменава незаконни уебсайтове, за които се подозира, че OpenAI е получил защитените с авторски права материали, но OpenAI все още не е потвърдил своите източници.

Ако се докаже, че OpenAI и Meta са използвали незаконни торент уебсайтове, за да придобият защитени с авторски права материали, за да обучат своите AI модели, Silverman може да има шанс да спечели делото. Моделите на ИИ обаче са неизследвана територия без прецедент, на който съдилищата да разчитат, за да вземат решение въз основа на нарушаване на авторските права на ИИ. Всъщност това е една от причините ЕС предложи Закон за ИИ.

Какво е бъдещето на AI моделите и закона за авторското право?

Все още сме в ранните дни на AI, за да знаем как ще се адаптира към закона за авторското право. Още по-сложно е да се опитваш да разбереш който притежава авторските права върху създаването на AI. Но за човешките създатели съществуват разпоредби, които ги защитават срещу достъп на някой друг до техните защитени с авторски права материали без компенсация, съгласие или кредит. Ако правилата съществуват за хората, ще се прилагат ли те за AI модели?

Европейският парламент изготви най-близкия поглед към бъдещето за това как AI моделите ще отговарят на закона за авторското право. Ако Законът за изкуствения интелект на ЕС бъде приет като закон, моделите на изкуствен интелект като ChatGPT и Bard ще трябва да публикуват всички свои източници на набор от данни и защитени с авторски права данни, използвани за обучение. Това ще помогне да се изясни всяко объркване, ако AI моделите са имали достъп до защитени с авторски права книги, филми, музика и снимки за обучение чрез незаконни уебсайтове за пиратство.

Решението по делото за групов иск AI ще създаде правен прецедент

Големите езикови модели могат да претърсят всички ъгли на интернет за данни, използвани в обучението. Но ще бъдат ли отговорни за нарушаване на авторски права, ако получат достъп до незаконни торент уебсайтове, за да получат данните? И ако го направят, можете ли да го докажете?

Независимо от резултата, груповите искове срещу технологичните компании, които притежават най-популярните AI модели, ще създадат прецедент, който ще бъде актуален в бъдеще.