Вашият любим генеративен AI чатбот изглежда безобиден, но с правилния опит може да бъде накаран да разкрие деликатна информация за вас.
Ключови изводи
- Атаките с инверсия на модела на невронни мрежи използват AI chatbots, за да разкрият и реконструират лична информация от цифрови отпечатъци.
- Хакерите създават инверсионни модели, които предвиждат входовете въз основа на изходите на невронна мрежа, разкривайки чувствителни данни.
- Техники като диференциална поверителност, многостранно изчисление и обединено обучение могат да помогнат за защита срещу инверсионни атаки, но това е непрекъсната битка. Потребителите трябва избирателно да споделят, да актуализират софтуера и да внимават при предоставянето на лична информация.
Представете си, че сте в ресторант и току-що сте опитали най-добрата торта, която някога сте яли. Върнете се вкъщи и сте решени да пресъздадете този кулинарен шедьовър. Вместо да питате за рецептата, вие разчитате на вкусовите си рецептори и знания, за да деконструирате десерта и да приготвите свой собствен.
Ами ако някой може да направи това с вашата лична информация? Някой опитва цифровия отпечатък, който оставяте след себе си, и възстановява вашите лични данни.
Това е същността на атаката с инверсия на модел на невронна мрежа, техника, която може да превърне AI чатбот в инструмент за киберследене.
Разбиране на атаките с инверсия на модела на невронната мрежа
А невронна мрежа е „мозъкът“ зад съвременния изкуствен интелект (AI). Те са отговорни за впечатляващата функционалност зад гласовото разпознаване, хуманизираните чатботове и генеративния AI.
Невронните мрежи по същество са поредица от алгоритми, предназначени да разпознават модели, да мислят и дори да учат като човешки мозък. Те го правят в мащаб и скорост, които далеч надхвърлят нашите органични възможности.
Книгата на тайните на AI
Точно като нашия човешки мозък, невронните мрежи могат да крият тайни. Тези тайни са данните, които потребителите им са им предоставили. При атака с инверсия на модел хакерът използва изходите на невронна мрежа (като отговорите от чатбот), за обратен инженер входовете (информацията, която сте предоставили).
За да изпълнят атаката, хакерите използват свой собствен модел на машинно обучение, наречен „модел на инверсия“. Този модел е проектиран да бъде своеобразен огледален образ, обучен не на оригиналните данни, а на резултатите, генерирани от мишена.
Целта на този модел на инверсия е да предвиди входовете - оригиналните, често чувствителни данни, които сте въвели в чатбота.
Създаване на модел на инверсия
Създаването на инверсия може да се разглежда като реконструкция на раздробен документ. Но вместо да сглобява ленти хартия, той сглобява историята, разказана на отговорите на целевия модел.
Моделът на инверсия научава езика на изходите на невронната мрежа. Той търси издайнически знаци, които с времето разкриват естеството на входящите данни. С всяка нова част от данните и всеки отговор, който анализира, той по-добре предвижда информацията, която предоставяте.
Този процес е постоянен цикъл от хипотези и тестове. С достатъчно резултати, моделът на инверсия може точно да изведе подробен профил на вас, дори от най-безобидните на пръв поглед данни.
Процесът на инверсионния модел е игра на свързване на точките. Всяка част от данните, изтекла чрез взаимодействието, позволява на модела да формира профил и с достатъчно време профилът, който формира, е неочаквано подробен.
В крайна сметка се разкриват прозрения за дейностите, предпочитанията и самоличността на потребителя. Прозрения, които не са били предназначени да бъдат оповестени или оповестени публично.
Какво го прави възможно?
В рамките на невронните мрежи всяка заявка и отговор е точка от данни. Опитните нападатели използват усъвършенствани статистически методи, за да анализират тези точки от данни и да търсят корелации и модели, незабележими за човешкото разбиране.
Техники като регресионен анализ (изследване на връзката между две променливи) за прогнозиране на стойностите на входа въз основа на резултатите, които получавате.
Хакерите използват алгоритми за машинно обучение в собствените си модели на инверсия, за да прецизират своите прогнози. Те вземат резултатите от чатбота и ги подават в своите алгоритми, за да ги обучат да приближават обратната функция на целевата невронна мрежа.
С опростени термини, "обратна функция" се отнася до това как хакерите обръщат потока от данни от изход към вход. Целта на атакуващия е да обучи своите инверсионни модели да изпълняват обратната задача на оригиналната невронна мрежа.
По същество това е начинът, по който те създават модел, който, като се има предвид само изходът, се опитва да изчисли какъв трябва да е бил входът.
Как инверсионните атаки могат да бъдат използвани срещу вас
Представете си, че използвате популярен онлайн инструмент за оценка на здравето. Вие въвеждате вашите симптоми, предишни състояния, диетични навици и дори употреба на наркотици, за да получите известна представа за вашето благосъстояние.
Това е чувствителна и лична информация.
С инверсионна атака, насочена към AI системата, която използвате, хакерът може да успее да вземе общите съвети, които чатботът ви дава, и да ги използва, за да заключи вашата лична медицинска история. Например отговорът от чатбота може да бъде нещо подобно:
Антинуклеарното антитяло (ANA) може да се използва, за да покаже наличието на автоимунни заболявания като лупус.
Моделът на инверсия може да предвиди, че целевият потребител е задавал въпроси, свързани с автоимунно състояние. С повече информация и повече отговори, хакерите могат да заключат, че целта има сериозно здравословно състояние. Изведнъж полезният онлайн инструмент се превръща в цифрова шпионка в личното ви здраве.
Какво може да се направи за инверсионните атаки?
Можем ли изградете крепост около нашите лични данни? Е, сложно е. Разработчиците на невронни мрежи могат да направят по-трудно извършването на атаки с инверсионен модел, като добавят слоеве на сигурност и затъмняват как работят. Ето някои примери за техники, използвани за защита на потребителите:
- Диференциална поверителност: Това гарантира, че AI изходите са достатъчно „шумни“, за да маскират отделни точки от данни. Това е малко като шепот в тълпата - думите ви се губят в колективното бърборене на хората около вас.
- Многостранно изчисление: Тази техника е като екип, който работи върху поверителен проект, като споделя само резултатите от своите индивидуални задачи, а не чувствителните подробности. Той позволява на множество системи да обработват данни заедно, без да излагат индивидуалните потребителски данни на мрежата или един на друг.
- Федерално обучение: Включва обучение на AI на множество устройства, като същевременно запазва данните на отделните потребители локални. Това е малко като хор, който пее заедно; можете да чуете всеки глас, но нито един глас не може да бъде изолиран или идентифициран.
Въпреки че тези решения са до голяма степен ефективни, защитата срещу инверсионни атаки е игра на котка и мишка. С подобряването на защитите се подобряват и техниките за тяхното заобикаляне. Следователно отговорността пада върху компаниите и разработчиците, които събират и съхраняват нашите данни, но има начини, по които можете да се защитите.
Как да се предпазите от инверсионни атаки
Относително казано, невронните мрежи и AI технологиите са все още в начален стадий. Докато системите не са безупречни, потребителят носи отговорността да бъде първата линия на защита, когато защита на вашите данни.
Ето няколко съвета как да намалите риска да станете жертва на инверсионна атака:
- Бъдете избирателен споделящ: Отнасяйте се към личната си информация като към тайна семейна рецепта. Подбирайте с кого го споделяте, особено когато попълвате формуляри онлайн и взаимодействате с чатботове. Подлагайте на съмнение необходимостта от всяка част от данните, която се иска от вас. Ако не бихте споделили информацията с непознат, не я споделяйте с чатбот.
- Поддържайте актуализиран софтуер: Има актуализации на предния софтуер, браузъри и дори вашата операционна система предназначени да ви предпазят. Докато разработчиците са заети със защитата на невронните мрежи, вие също можете да намалите риска от прихващане на данни чрез редовно прилагане на корекции и актуализации.
- Пазете личната информация лична: Всеки път, когато приложение или чатбот изисква лични данни, направете пауза и обмислете намерението. Ако исканата информация изглежда неподходяща за предоставяната услуга, вероятно е така.
Не бихте предоставили чувствителна информация като здраве, финанси или самоличност на нов познат само защото са казали, че се нуждаят от нея. По същия начин преценете каква информация е наистина необходима, за да функционира дадено приложение, и се откажете от споделянето на повече.
Защита на нашата лична информация в епохата на ИИ
Нашата лична информация е нашият най-ценен актив. Опазването му изисква бдителност, както по отношение на начина, по който избираме да споделяме информация, така и при разработването на мерки за сигурност за услугите, които използваме.
Осъзнаването на тези заплахи и предприемането на стъпки като тези, описани в тази статия, допринася за по-силна защита срещу тези привидно невидими вектори на атака.
Нека се ангажираме с бъдеще, в което личната ни информация остава точно това: лична.