GPT-4 е тук и това са новите функции, които трябва да разгледате.

OpenAI най-накрая стартира своята дългоочаквана GPT актуализация, GPT-4. Големият езиков модел (LLM) идва с някои мощни нови функции и възможности, които вече шокираха потребителите по целия свят.

Освен че е значително по-добър от GPT-3.5, съществуващият LLM, който захранва вирусния чатбот на OpenAI ChatGPT, GPT-4 може разбира по-сложни входове, има много по-голямо ограничение за въвеждане на символи, има мултимодални възможности и според съобщенията е по-безопасен за използване.

1. GPT-4 може да разбира по-сложни входове

Една от най-големите нови функции на GPT-4 е способността му да разбира по-сложни и нюансирани подкани. Според OpenAI, GPT-4 "показва производителност на човешко ниво при различни професионални и академични показатели."

Това беше демонстрирано чрез подлагане на GPT-4 на няколко изпита на човешко ниво и стандартизирани тестове, като SAT, BAR и GRE, без специално обучение. GTP-4 не само разбираше и решаваше тези тестове със сравнително висок резултат навсякъде, но също така побеждаваше своя предшественик, GPT-3.5, всеки път.

instagram viewer

Кредит за изображение: OpenAI

Способността за разбиране на по-нюансирани подкани за въвеждане също е подпомогната от факта, че GPT-4 има много по-голямо ограничение на думите. Новият модел може да обработва подкани за въвеждане до 25 000 думи (за контекст GPT-3.5 беше ограничен до 8 000 думи). Това пряко ще повлияе на подробностите, които потребителите могат да вмъкнат в своите подкани, като по този начин ще даде на модела много повече информация за работа и ще създаде по-дълги резултати.

GPT-4 също поддържа над 26 езика, включително езици с ниски ресурси като латвийски, уелски и суахили. При сравняване с точност от три изстрела на MMLU бенчмарка, GPT-4 победи GPT-3.5, както и други водещи LLM като PaLM и Chinchilla по отношение на представянето на английски език на 24 езика.

2. Мултимодални възможности

Предишната версия на ChatGPT беше ограничен само до текстови подкани. За разлика от това, една от най-новите характеристики на GPT-4 са неговите мултимодални възможности. Моделът може да приема както текстови, така и графични подкани.

Това означава, че AI може да приеме изображение като вход и да го интерпретира и разбере точно като текстова подкана. Тази възможност обхваща всички размери и типове изображения и текст, включително документи, комбиниращи двете, ръчно нарисувани скици и дори екранни снимки.

Въпреки това, възможностите за четене на изображения на GPT-4 надхвърлят простото им интерпретиране. OpenAI демонстрира това в своя поток за разработчици (по-горе), където те предоставиха на GPT-4 ръчно нарисуван макет на уебсайт за шеги. Моделът беше натоварен да напише HTML и JavaScript код, за да превърне макета в уебсайт, като същевременно замени шегите с истински.

GPT-4 написа кода, докато използва оформлението, посочено в макета. При тестване кодът създаде работещ сайт с, както можете да предположите, истински вицове. Означава ли че Напредъкът на AI ще означава край на програмирането? Не съвсем, но все пак това е функция, която ще бъде полезна в помощ на програмистите.

Колкото и обещаваща да изглежда тази функция, тя все още е в предварителен преглед и не е публично достъпна. Освен това моделът отнема много време за обработка на визуални входове, като самият OpenAI заявява, че може да отнеме работа и време, за да стане по-бърз.

3. По-голяма управляемост

OpenAI също така твърди, че GPT-4 има висока степен на управляемост. Освен това е затруднило изкуствения интелект да разбие персонажа, което означава, че е по-малко вероятно да се провали, когато се внедри в приложение за възпроизвеждане на определен герой.

Разработчиците могат да предписват стила и задачата на своя AI, като опишат посоката в съобщението „система“. Тези съобщения позволяват на потребителите на API силно да персонализират потребителското изживяване в рамките на определени граници. Тъй като тези съобщения са и най-лесният начин за "джейлбрейк" на модела, те също работят върху това да ги направят по-сигурни. Демонстрацията за GPT-4 закова тази точка, като накара потребителя да се опита да спре GPT-4 да бъде Сократов учител и да отговори на запитването им. Моделът обаче отказа да пречупи характера си.

4. Безопасност

OpenAI прекара шест месеца в създаването на GPT-4 по-безопасни и по-подравнени. Компанията твърди, че е 82% по-малко вероятно да отговори на искания за неподходящо или по друг начин забранено съдържание, 29% по-вероятно да отговарят в съответствие с политиките на OpenAI на чувствителни заявки и с 40% по-голяма вероятност да произвеждат фактически отговори в сравнение с GPT-3.5.

Не е идеален и все още можете да очаквате да „халюцинира“ от време на време и може да грешите в своите прогнози. Разбира се, GPT-4 има по-добри възприятия и сила на прогнозиране, но все пак не трябва да се доверявате сляпо на AI.

5. Подобрения в производителността

Извън оценката на представянето на модела при човешки изпити, OpenAI също така оцени бота на традиционни бенчмаркове, предназначени за модели за машинно обучение.

Той твърди, че GPT-4 "значително превъзхожда" съществуващите LLM и "най-съвременните модели". Тези показатели включват гореспоменатите MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval и Drop, всички от които тестват индивидуалните способности.

Ще намерите подобни резултати, когато сравнявате ефективността на показателите за академично зрение. Провежданите тестове включват VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA и LSMDC, всички от които GPT-4 е на върха. OpenAI обаче заяви, че резултатите на GPT-4 в тези тестове „не представят напълно степента на неговите възможности“, тъй като изследователите продължават да откриват нови и по-предизвикателни неща, с които моделът може да се справи.

Малка стъпка за GPT-4, гигантски скок за AI

С по-голяма точност, безопасност на използване и разширени възможности, GPT-4 е пуснат за обществеността чрез месечния абонаментен план ChatGPT+, който струва 20 на месец. Освен това OpenAI си партнира с различни организации, за да започне изграждането на потребителски продукти с GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes и Khan Academy, между другото, вече внедриха GPT-4 в своите продукти.

GPT-4 може да е постепенна актуализация спрямо GPT-3.5, но това е огромна победа за AI като цяло. Тъй като моделът става по-достъпен, както за средния потребител, така и за разработчиците чрез своя API, изглежда, че той ще бъде добър случай за внедряване на LLM в различни области.