Искате да предоставите на ChatGPT вашите персонализирани данни? Ето стъпка по стъпка как да направите точно това!
Предоставяйки GPT технология в мощен и лесен за използване чатбот, ChatGPT се превърна в най-популярния AI инструмент в света. Много хора използват ChatGPT, за да предоставят ангажиращи разговори, да отговарят на запитвания, да предлагат творчески предложения и да помагат при кодиране и писане. Въпреки това ChatGPT е ограничен, тъй като не можете да съхранявате данните си за дългосрочна лична употреба и неговата точка на прекъсване на данните за знания през септември 2021 г.
Като заобиколно решение можем да използваме API на OpenAI и LangChain, за да предоставим на ChatGPT персонализирани данни и актуализирана информация след 2021 г., за да създадем персонализиран екземпляр на ChatGPT.
Защо да предоставяме на ChatGPT персонализирани данни?
Захранването на ChatGPT с персонализирани данни и предоставянето на актуализирана информация след датата на прекъсване на знанията осигурява няколко предимства пред простото използване на ChatGPT както обикновено. Ето няколко от тях:
- Персонализирани взаимодействия: Като предоставят на ChatGPT персонализирани данни, потребителите могат да създадат по-персонализирано изживяване. Моделът може да бъде обучен върху специфични набори от данни, подходящи за отделни потребители или организации, което води до отговори, съобразени с техните уникални нужди и предпочитания.
- Специфичен опит в областта: Персонализираната интеграция на данни позволява на ChatGPT да се специализира в определени домейни или индустрии. Може да се обучава на базата на специфични за индустрията знания, терминология и тенденции, което позволява по-точни и проницателни отговори в тези специфични области.
- Актуална и точна информация: Достъпът до актуализирана информация гарантира, че ChatGPT остава в течение с най-новите разработки и знания. Може да предостави точни отговори въз основа на скорошни събития, новини или изследвания, което го прави по-надежден източник на информация.
Сега, след като разбирате важността на предоставянето на персонализирани данни на ChatGPT, ето стъпка по стъпка как да го направите на вашия локален компютър.
Стъпка 1: Инсталирайте и изтеглете софтуер и предварително създаден скрипт
Моля, имайте предвид, че следните инструкции са за машина с Windows 10 или Windows 11.
За да предоставите персонализирани данни на ChatGPT, ще трябва да инсталирате и изтеглите най-новите Python3, Git, Microsoft C++ и скрипта за извличане на ChatGPT от GitHub. Ако вече имате инсталиран част от софтуера на вашия компютър, уверете се, че е актуализиран с най-новата версия, за да избегнете хълцане по време на процеса.
Започнете с инсталиране:
- Изтегли:Python3 (Безплатно)
- Изтегли:Git (Безплатно)
- Изтегли:Microsoft Visual Build Tools (Безплатно)
Бележки за инсталиране на Python3 и Microsoft C++
Когато инсталирате Python3, уверете се, че сте отметнали Добавете python.exe към PATH опция, преди да щракнете Инсталирай сега. Това е важно, тъй като ви позволява достъп до Python във всяка директория на вашия компютър.
Когато инсталирате Microsoft C++, ще искате да инсталирате Инструменти за изграждане на Microsoft Visual Studio първи. Веднъж инсталиран, можете да поставите отметка Разработка на настолен компютър с C++ опция и щракнете Инсталирай с всички незадължителни инструменти, автоматично отбелязани в дясната странична лента.
Сега, след като сте инсталирали най-новите версии на Python3, Git и Microsoft C++, можете да изтеглите скрипта на Python, за да правите лесно заявки за персонализирани локални данни.
Изтегли: Скрипт за извличане на ChatGPT (Безплатно)
За да изтеглите скрипта, щракнете върху код, след това изберете Изтеглете ZIP. Това трябва да изтегли скрипта на Python във вашата директория по подразбиране или избрана.
Веднъж изтеглени, вече можем да настроим локална среда.
Стъпка 2: Настройте локалната среда
За да настроите средата, ще трябва да отворите терминал в папката chatgpt-retrieval-main, която сте изтеглили. За да направите това, отворете chatgpt-извличане-главен папка, щракнете с десния бутон и изберете Отворете в терминал.
След като терминалът е отворен, копирайте и поставете тази команда:
pip инсталирайте langchain openai chromadb tiktoken неструктуриран
Тази команда използва мениджъра на пакети на Python, за да създаване и управление на виртуалната среда на Python необходими.
След като създадем виртуалната среда, трябва да предоставим OpenAI API ключ за достъп до техните услуги. Първо ще трябва да генерираме API ключ от Сайт за API ключове на OpenAI като щракнете върху Създайте нов таен ключ, като добавите име за клавиша, след което натиснете Бутон за създаване на таен ключ.
Ще ви бъде предоставен низ от знаци. Това е вашият OpenAI API ключ. Копирайте го, като щракнете върху иконата за копиране отстрани на API ключа. Имайте предвид, че този API ключ трябва да се пази в тайна. Не го споделяйте с други, освен ако наистина възнамерявате те да го използват с вас.
След като копирате, върнете се в главната папка chatgpt-retrieval-main и отворете константите с Бележник. Сега заменете контейнера с вашия API ключ. Не забравяйте да запазите файла!
Сега, след като успешно сте настроили своята виртуална среда и сте добавили вашия OpenAI API ключ като променлива на средата. Вече можете да предоставите персонализираните си данни на ChatGPT.
Стъпка 3: Добавяне на персонализирани данни
За да добавите персонализирани данни, поставете всичките си персонализирани текстови данни в данни папка в chatgpt-retrieval-main. Форматът на текстовите данни може да бъде под формата на PDF, TXT или DOC.
Както можете да видите от екранната снимка по-горе, добавих текстов файл, съдържащ изготвен личен график, статия, на която написах Инстинктните ускорители на AMDи PDF документ.
Стъпка 4: Запитване до ChatGPT през терминал
Скриптът Python ни позволява да правим заявки за данни от персонализираните данни, които сме добавили към папката с данни и интернет. С други думи, ще имате достъп до обичайния бекенд на ChatGPT и всички данни, съхранявани локално в папката с данни.
За да използвате скрипта, стартирайте python chatgpt.py скрипт и след това добавете вашия въпрос или заявка като аргумент.
питон chatgpt.py "ТВОЯТ ВЪПРОС"
Не забравяйте да поставите въпросите си в кавички.
За да тествам дали успешно сме предоставили данните си на ChatGPT, ще задам личен въпрос относно Personal Sched.txt файл.
Проработи! Това означава, че ChatGPT е успял да прочете Personal Sched.txt, предоставен по-рано. Сега нека видим дали успешно сме захранили ChatGPT с информация, която той не знае поради датата на прекъсване на знанията.
Както можете да видите, той правилно описва AMD Instinct MI250x, който беше пуснат след крайната дата на познаване на ChatGPT -3.
Ограничения на Custom ChatGPT
Въпреки че захранването на GPT-3.5 с персонализирани данни отваря повече начини за прилагане и използване на LLM, има няколко недостатъка и ограничения.
Първо, трябва сами да предоставите всички данни. Все още имате достъп до всички знания за GPT-3.5 до крайната дата на познаване; обаче трябва да предоставите всички допълнителни данни. Това означава, че ако искате вашият местен модел да е запознат с определена тема в интернет, която GPT-3.5 все още не знае, ще трябва да отидете в интернет и сами да изтриете данните и да ги запишете като текст в папката с данни на chatgpt-retrieval-main.
Друг проблем е, че запитването на ChatGPT като това отнема повече време за зареждане в сравнение с директното запитване на ChatGPT.
И накрая, единственият наличен в момента модел е GPT-3.5 Turbo. Така че дори и да имате достъп до GPT-4, няма да можете да го използвате, за да захранвате своя персонализиран екземпляр на ChatGPT.
Персонализираният ChatGPT е страхотен, но ограничен
Предоставянето на персонализирани данни на ChatGPT е мощен начин да извлечете повече от модела. Чрез този метод можете да захранвате модела с всякакви текстови данни, които искате, и да го подсказвате точно като обикновения ChatGPT, макар и с някои ограничения. Това обаче ще се промени в бъдеще, тъй като става по-лесно да интегрираме нашите данни с LLM, заедно с достъп до най-новия модел GPT-4.