GPT моделите на OpenAI революционизираха обработката на естествен език (NLP), но освен ако не плащате за премия достъп до услугите на OpenAI, няма да можете да прецизирате и интегрирате техните GPT модели във вашия приложения. Освен това OpenAI ще има достъп до всички ваши разговори, което може да е проблем за сигурността, ако използвате ChatGPT за бизнес и други по-чувствителни области от живота си. Ако не сте запалени по това, може да искате да изпробвате GPT4All.

И така, какво точно е GPT4All? Как работи и защо да го използвате над ChatGPT?

Какво е GPT4All?

GPT4All е екосистема с отворен код, използвана за интегриране на LLM в приложения, без да се плаща за абонамент за платформа или хардуер. Създаден е от Nomic AI, компания за информационна картография, която има за цел да подобри достъпа до AI ресурси.

GPT4All е проектиран да работи на съвременни до сравнително модерни компютри, без да се нуждае от интернет връзка или дори GPU! Това е възможно, тъй като повечето от моделите, предоставени от GPT4All, са квантувани да бъдат толкова малки, колкото няколко гигабайта, изискващи само 4–16 GB RAM за работа.

instagram viewer

Това позволява на по-малки фирми, организации и независими изследователи да използват и интегрират LLM за конкретни приложения. И с GPT4All, лесно инсталиран чрез инсталатор с едно щракване, хората вече могат да използват GPT4All и много от нейните LLM за създаване на съдържание, писане на код, разбиране на документи и информация събиране.

Защо да използвате GPT4ALL през ChatGPT?

Кредит за изображение: bruce mars/Unplash

Има няколко причини, поради които може да искате да използвате GPT4All над ChatGPT.

  • Преносимост: Моделите, предоставени от GPT4All, изискват само четири до осем гигабайта памет за съхранение, не изискват графичен процесор за работа и могат лесно да бъдат запазени на USB флаш устройство с инсталатора с едно щракване на GPT4All. Това прави GPT4All и неговите модели наистина преносими и използваеми на почти всеки съвременен компютър.
  • Поверителност и сигурност: Както беше обяснено по-рано, освен ако нямате достъп до ChatGPT Plus, всички ваши ChatGPT реализации са достъпни от OpenAI. GPT4All е фокусиран върху прозрачността и поверителността на данните; вашите данни ще бъдат запазени само на вашия локален хардуер, освен ако умишлено не ги споделите с GPT4All, за да помогнете за разрастването на техните модели.
  • Офлайн режим: GPT е патентован модел, изискващ достъп до API и постоянна интернет връзка за запитване или достъп до модела. Ако загубите интернет връзка или имате проблем със сървъра, няма да имате достъп до ChatGPT. Това не е случаят с GPT4All. Тъй като всички данни вече са съхранени в пакет от четири до осем гигабайта и изводите се извършват локално, не се нуждаете от интернет връзка за достъп до модели в GPT4All. Можете да продължите да чатите и да настройвате фино вашия модел дори без интернет връзка.
  • Безплатен и с отворен код: Няколко LLM, предоставени от GPT4All, са лицензирани под GPL-2. Това позволява на всеки да прецизира и интегрира свои собствени модели за търговска употреба, без да е необходимо да плаща за лицензиране.

Как работи GPT4All

Както беше обсъдено по-рано, GPT4All е екосистема, използвана за обучение и внедряване на LLM локално на вашия компютър, което е невероятно постижение! Обикновено зареждането на стандартен 25-30GB LLM ще отнеме 32GB RAM и GPU от корпоративен клас.

За сравнение, LLM, които можете да използвате с GPT4All, изискват само 3GB-8GB памет и могат да работят на 4GB-16GB RAM. Това прави възможно стартирането на цял LLM на крайно устройство без нужда от GPU или външна облачна помощ.

Хардуерните изисквания за стартиране на LLM на GPT4All са значително намалени благодарение на квантуването на невронни мрежи. Чрез намаляване на прецизното тегло и активациите в невронна мрежа, много от моделите, предоставени от GPT4All, могат да се изпълняват на повечето относително модерни компютри.

Данните за обучение, използвани в някои от наличните модели, бяха събрани чрез „купчината“, която представлява само изчерпани данни от публично публикувано съдържание в интернет. След това данните се изпращат до базата данни Atlas AI на Nomic AI, която може да се види въз основа на корелации на лесна за разглеждане 2D векторна карта (известна също като AI векторна база данни).

Чрез обучение на Nomic AI за модела Groovy и използване на публично достъпни данни, Nomic AI успя да пусне модела на отворен GPL лиценз, който позволява на всеки да го използва, дори за комерсиални приложения.

Как да инсталирате GPT4All

Инсталирането на GPT4All е лесно, а сега, когато GPT4All версия 2 е пусната, е още по-лесно! Най-добрият начин да инсталирате GPT4All 2 е да изтеглите инсталатора с едно кликване:

Изтегли:GPT4All за Windows, macOS или Linux (безплатно)

Следните инструкции са за Windows, но можете да инсталирате GPT4All на всяка основна операционна система.

След като го изтеглите, щракнете двукратно върху инсталатора и изберете Инсталирай. Windows Defender може да види инсталацията като злонамерена, тъй като процесът на Microsoft за предоставяне на валидни подписи за приложения на трети страни може да отнеме много време. Това обаче трябва скоро да бъде поправено. Към момента на писане, стига да сте изтеглили приложението GPT4All от официалния уебсайт, трябва да сте в безопасност. Кликнете върху Инсталирайте все пак за да инсталирате GPT4All.

След като отворите приложението, ще трябва да изберете модел, който да използвате. GPT4ALL ви предоставя няколко модела, всеки от които ще има своите силни и слаби страни. За да знаете кой модел да изтеглите, ето таблица, показваща техните силни и слаби страни.

Модел

Размер

Забележка

Параметри

Тип

Квантуване

Хермес

7,58 GB

  • Въз основа на инструкции
  • Дава дълги отговори
  • Подготвен с 300 000 нецензурирани инструкции
  • Не може да се използва с търговска цел

13 милиарда

LLaMA

q4_0

GPT4All Falcon

3,78 GB

  • Бързи отговори
  • Базиран на инструкции
  • Лицензирано за търговска употреба

7 милиарда

Сокол

q4_0

Groovy

8 GB

  • Бързи отговори
  • - Творчески отговори
  • Базиран на инструкции
  • Лицензирано за търговска употреба

7 милиарда

GPT-J

q4_0

ChatGPT-3.5 Turbo

Минимална

  • Изисква личен API
  • Ще изпрати вашите чатове на OpenAI
  • GPT4All се използва само за комуникация с OpenAI

?

GPT

NA

ЧатGPT-4

Минимална

  • Изисква личен API
  • Ще изпрати вашите чатове на OpenAI
  • GPT4All се използва само за комуникация с OpenAI

?

GPT

NA

Snoozy

7,58 GB

  • Базиран на инструкции
  • По-бавен от Groovy, но с по-висококачествени отговори
  • Не може да се използва с търговска цел

13 милиарда

LLaMA

q4_0

MPT чат

4,52 GB

  • Бързи отговори
  • Базиран на чат
  • Не може да се използва с търговска цел

7 милиарда

MPT

q4_0

Орка

3,53 GB

  • Базиран на инструкции
  • Обяснява настроените набори от данни
  • Подходи за изграждане на набор от данни на Orca Research Paper
  • Лицензирано за търговска употреба

7 милиарда

OpenLLaMA

q4_0

Викуня

3,92 GB

  • Базиран на инструкции
  • Не може да се използва с търговска цел

7 милиарда

LLaMA

q4_2

Магьосник

3,92 GB

  • Базиран на инструкции
  • Не може да се използва с търговска цел

7 милиарда

LLaMA

q4_2

Магьосник Нецензуриран

7,58 GB

  • Базиран на инструкции
  • Не може да се използва с търговска цел

13 милиарда

LLaMA

q4_0

Имайте предвид, че предоставените модели имат различни нива на ограничения. Не всички модели могат да се използват комерсиално безплатно; някои ще се нуждаят от повече хардуерни ресурси, докато други ще се нуждаят от API ключ. Най-малко ограничителните модели, налични в GPT4All, са Groovy, GPT4All Falcon и Orca.

Можете ли да тренирате GPT4All модели?

Да, но не и квантуваните версии. За ефективно фино настройване на моделите GPT4All, трябва да изтеглите необработените модели и да използвате графични процесори от корпоративен клас, като напр. Инстинктните ускорители на AMD или Ampere или Hopper GPU на NVIDIA. Освен това ще трябва да обучите модела чрез рамка за обучение на AI като LangChain, което ще изисква известни технически познания.

Фината настройка на модел GPT4All ще изисква известни парични ресурси, както и известно техническо ноу-хау, но ако искате само да подадете потребителски данни на модел GPT4All, можете продължавайте да обучавате модела чрез разширено генериране на извличане (което помага на езиковия модел да има достъп и да разбира информация извън основното си обучение, за да завърши задачи). Можете да направите това, като подканите GPT4All да моделира персонализираните ви данни, преди да зададете въпрос. Персонализираните данни трябва да се запазват локално и когато бъдете подканени, моделът трябва да може да ви предостави информацията, която сте предоставили.

Трябва ли да използвате GTP4All?

Идеята за GPT4All е да предостави безплатна за използване платформа с отворен код, където хората могат да изпълняват големи езикови модели на своите компютри. В момента GPT4All и неговите квантувани модели са чудесни за експериментиране, учене и изпробване на различни LLM в сигурна среда. За професионални натоварвания все пак бихме препоръчали използването на ChatGPT, тъй като моделът е значително по-способен.

Като цяло няма причина да се ограничавате до едно. Тъй като техният случай на използване не се припокрива, трябва да опитате да използвате и двата.