След пускането на ChatGPT през ноември 2022 г., феноменалният AI чатбот се превърна в един от най-доверените инструменти за писане в интернет. Лесен е за използване; опишете какво трябва да бъде написано и ChatGPT го отпечатва на екрана за секунди.

Въпреки това, в епоха, в която текстът, генериран от AI, се предава като написан от човек и се използва за получаване на несправедливо предимство, идентифицирането на AI съдържание е много важно. Но ChatGPT не може точно да забележи AI съдържание, дори собствената си работа - но защо?

Има ли разлика между AI текст и човешко писане?

Предварително условие ChatGPT да забележи собственото си писане или текст, генериран от изкуствен интелект, е, че трябва да има разлика между него и текста, написан от хора. И така, има ли някаква значителна разлика между текст, написан от хора, и генерирано от AI съдържание? Ако има, със сигурност инструмент като ChatGPT трябва да може да го различи.

Написахме кратка история без никаква информация от който и да е AI инструмент и след това попитахме ChatGPT дали историята е съдържание, написано от AI. ChatGPT уверено го маркира като текст, генериран от AI.

instagram viewer

След това помолихме ChatGPT да генерира история и в същата нишка за чат копирахме генерирания текст и попитахме ChatGPT дали текстът е създаден от AI. Отговорът на ChatGPT? Едно уверено „Не“.

И в двата случая ChatGPT не успя да идентифицира текст, написан от хора или генериран от AI. И така, как така ChatGPT не може да открие собствения си текст? Това означава ли, че няма разлика между AI и човешки текст?

Е, има. Можем да напишем цяла книга за разликата между двете, но това няма да има голямо значение. И така, ако има разлика, защо ChatGPT или който и да е друг AI инструмент не може да идентифицира тези разлики и точно да посочи генериран от AI текст от написан от човек? Отговорът се крие в как работи ChatGPT и как генерира текст.

Как ChatGPT генерира текст

Когато поискате от ChatGPT да генерира текст, той се опитва да имитира човешкия процес на писане. Първо, моделът зад ChatGPT — Generative Pre-trained Transformer (GPT) — е обучен върху голям корпус от човешки текст. Всичко от имейли, здравни статии, технически статии, есета в гимназията и почти всеки текст, който можете да намерите онлайн, е било подавано на модела по време на обучението. Така че ChatGPT разбира как трябва да бъде написан всеки от тези типове текстове.

Ако помолите ChatGPT да напише имейл до вашия шеф, той знае как трябва да изглежда такъв имейл, защото е бил обучен на подобни имейли - вероятно хиляди от тях. По същия начин, ако го помолите да напише есе за гимназия, то също знае как трябва да звучи есе за гимназия. ChatGPT ще се опита да напише каквото искате да напише по начин, по който човек би го направил.

Но има една уловка. За разлика от начина, по който пишат хората, ChatGPT наистина не разбира какво пише по начин, по който би го направил човек. Вместо това чатботът се опитва да предвиди коя би била най-правдоподобната следваща дума в изречението, докато не завърши записа.

Как ChatGPT пише чрез прогнозиране

Да приемем, че помолите ChatGPT да напише история за измислен град, наречен Волкра. Има огромна вероятност чатботът да започне историята с думите „Имало едно време“. Това е така, защото чатботът не мисли за себе си, но се опитва да предвиди какво би написал човек въз основа на това, което е научил от хилядите истории, с които е бил хранен по време обучение.

И така, вярвайки, че човек вероятно ще започне историята с думите „Имало едно време“, ChatGPT след това ще се опита да предвиди следващата логична дума, която ще бъде "a", последвано от "време". Така че ще имате „Имало едно време...“, последвано от следващата логична дума и следващата, докато историята бъде завършена. ChatGPT основно пише, като предвижда коя дума естествено (или поне има най-голяма вероятност) да дойде следваща в изречение и я вмъква.

Така че, когато AI инструмент се опитва да открие дали даден текст е генериран от AI, един от критериите, които се опитва да претегли, е предсказуемостта на текста, тъй като AI инструментите пишат чрез предвиждане. Тази мярка за предсказуемост се нарича объркване на езика на AI. Сега, когато се представя с текст, наред с други критерии, AI инструмент като ChatGPT се опитва да анализира текста, за да измери колко предсказуема е последователността от думи или изречения в текста. По-голямата предсказуемост или ниската степен на объркване обикновено означава, че текстът вероятно е генериран от AI. По-малко предсказуемост или по-висока степен на объркване обикновено означава, че текстът вероятно е написан от хора.

Тези критерии, заедно с други фактори като нивото на креативност на даден текст, за съжаление не са достатъчни, за да се установи със сигурност дали текстът е написан от инструмент с изкуствен интелект или не. Това е така, защото хората могат да пишат с по-голяма вариация, както в примерния текст, който използвахме за демонстрация в началото на тази статия.

AI chatbots като ChatGPT са проектирани да имитират естествения човешки език, доколкото е възможно. Така че докато AI текстът може да има забележими модели, тези модели не са толкова очевидни дори за мощен инструмент като ChatGPT. Ето защо ChatGPT не може да забележи собственото си писане, както и защо инструментите за детектор на AI-текст не работят.

Ще разпознае ли ChatGPT собственото си писане в бъдеще?

Понастоящем инструменти като ChatGPT не могат да открият дали даден текст е написан от самия него или от друг AI инструмент, тъй като няма ясен, забележим модел в генерираното от AI съдържание. Въпреки това има голям шанс това да се промени скоро. С усилията на компании като ChatGPT да въведат цифрови водни знаци в съдържание, генерирано от ChatGPT, ще има по-забележим модел на текста, генериран от chatbot.