реклама
AI се завръща.
За първи път след 80-те години изследователите на изкуствения интелект постигат осезаем напредък по трудните проблеми и хората отново започват да говорят сериозно за силния ИИ. Междувременно, все по-задвижваният от нас свят стартира надпревара с оръжия между компании, които се стремят да осигурят приходи от новата информация, особено в мобилното пространство.
Двамата титани, водещи пакета, са Google и Microsoft. Първата битка? Нова област в изкуствения интелект, наречена „дълбоко обучение“.
И така, кой печели?
Google мозъкът
Изследователските усилия на Google бяха насочени около проект, наречен „Google мозък. “Google Brain е продукт на известната / тайна изследователска лаборатория„ Google X “на Google, която отговаря за проекти, заснети с луна, с ниски шансове за успех, но с много висок потенциал. Други продукти на Google X включват Project Loon, инициативата за балон в Интернет и Проект за кола за самоуправление на Google Ето как ще стигнем до свят, изпълнен с автомобили без шофьори Шофирането е досадна, опасна и взискателна задача. Възможно ли е един ден да бъде автоматизиран с технологията на автомобили на Google без шофьори? Прочетете още .
Google Brain е огромна инициатива за машинно обучение, която е насочена основно към обработката на изображения, но с много по-широки амбиции. Проектът е стартиран от професора от Станфорд Андрю Нг, експерт по машинно обучение, който оттогава напусна проекта да работя за Байду, Най-голямата търсачка в Китай.
Google има дълга история на участие в AI изследвания. Матю Зейлер, изпълнителен директор на машинно визуално стартиране, и стажант, който е работил в Google Brain, го казва така:
„Google всъщност не е компания за търсене. Това е компания за машинно обучение [..] Всичко в компанията наистина се движи от машинно обучение. "
Целта на проекта е да се намерят начини за усъвършенстване на алгоритмите за задълбочено обучение за изграждане на невронни мрежи, които могат да намерят по-дълбоки и по-смислени модели в данните, използвайки по-малко обработваща мощност. За тази цел Google агресивно изкупува таланти в задълбочено обучение, правейки придобивания, които включват 500 милиона долара покупка на AI стартиране DeepMind.
DeepMind се притесни достатъчно за приложенията на техните технологии, че те принудиха Google да създаде етична дъска, предназначена да предотврати софтуера унищожавайки света Ето защо учените смятат, че трябва да се притеснявате за изкуствения интелектМислите ли, че изкуственият интелект е опасен? ИИ може да представлява сериозен риск за човешката раса. Това са някои причини, поради които може да искате да сте загрижени. Прочетете още . DeepMind все още не беше пуснал първия си продукт, но компанията наистина нае значителна част от всички специалисти по дълбоко обучение. Към днешна дата единствената им публична демонстрация на техните технологии е играчка AI, която е наистина, наистина добра в Atari.
Тъй като задълбоченото обучение е сравнително ново поле, не е имало време да подготви голямо поколение експерти. В резултат на това има много малък брой хора с опит в тази област и това означава, че е възможно да спечелите значително предимство в тази област, като наемете всички участващи.
Google Brain се прилага досега за функцията за разпознаване на глас на Android и автоматично катализиране на StreetView изображения, идентифицирайки важни функции като адреси. Ранен тест беше известен експеримент с котки, в която мрежа за дълбоко обучение на Google автоматично се научи да идентифицира котки в видеоклипове в Youtube с по-висока степен на точност от предишното състояние на техниката. В техните хартия по темата, Google го каза така:
„Противно на това, което изглежда широко разпространена интуиция, нашите експериментални резултати разкриват, че е възможно да се обучи детектор за лице без да се налага да етикетирате изображения, съдържащи лице или не […] Мрежата е чувствителна към концепции от високо ниво като лица на котки и хора тела. Започвайки с тези научени функции, ние го обучихме, за да получим 15,8 процента точност при разпознаването на 20 000 обектни категории, скок от 70 процента относително подобрение спрямо предишното състояние на техниката [мрежи] ".
В крайна сметка Google би искала алгоритмите му за дълбоко учене да правят… ами, всъщност почти всичко. Мощни AI платформи като Уотсън на IBM разчитат на тези видове алгоритми за машинно обучение на ниско ниво, а подобренията на този фронт правят цялостното поле на AI много по-мощно.
Една бъдеща версия на Google Now, задвижвана от Google Brain, би могла да идентифицира реч и изображения и да предостави интелигентна информация за тези данни, за да помогне на потребителите да вземат по-интелигентни решения. Мозъкът на Google би могъл да подобри всичко - от резултатите от търсенето до Google Translate.
Microsoft Адам
Подходът на Microsoft към дълбоката учебна война беше малко по-различен. Вместо да се опитва да купува експерти за задълбочено обучение, за да усъвършенства алгоритмите си, Microsoft е била съсредоточаване върху подобряването на прилагането и намиране на по-добри начини за паралелизиране на използваните алгоритми да се влак алгоритми за дълбоко обучение
Този проект се нарича „Microsoft Адам. " Техните техники намаляват излишните изчисления, удвоявайки качеството на резултатите, докато използват по-малко процесори за получаването им. Това доведе до впечатляващи технически постижения, включително мрежа, която може да разпознава отделни породи кучета от снимки с висока точност.
Microsoft описва проекта като този:
Целта на Project Adam е да даде възможност на софтуера за визуално разпознаване на всеки обект. Това е висок ред, като се има предвид огромната невронна мрежа в мозъка на човека, която прави тези видове асоциации възможни чрез трилиони връзки. […] Използвайки 30 пъти по-малко машини от други системи, [данни за интернет изображения] се използва за обучение на невронна мрежа, съставена от повече от две милиарди връзки. Тази мащабируема инфраструктура е два пъти по-точна в разпознаването на обектите си и 50 пъти по-бърза от другите системи.
Очевидното приложение за тази технология е в Кортана, Новият виртуален асистент на Microsoft Как Кортана стана „Другата жена“ в живота миТя се появи един ден и промени живота ми. Тя знае точно от какво имам нужда и има нечестиво чувство за хумор. Не е чудно, че съм попаднал на прелестите на Кортана. Прочетете още , вдъхновен от характера на AI в Halo. Cortana, насочена към конкуренция със Siri, може да направи редица умни неща, използвайки сложни техники за разпознаване на речта.
Целта на дизайна е да се изгради асистент с по-естествено взаимодействие и може да изпълнява по-широк спектър от полезни задачи за потребителя, нещо, което задълбоченото обучение би помогнало изключително.
Подобренията на Microsoft в задния край на задълбоченото обучение са впечатляващи и доведоха до невъзможност за прилагане преди това.
Как работи Deep Learning
За да разберем проблема малко по-добре, отделете малко време, за да разберете тази нова технология. Дълбокото обучение е техника за изграждане на интелигентен софтуер, често прилаган към невронни мрежи. Той изгражда големи, полезни мрежи, като наслоява по-прости невронни мрежи заедно, като всеки от тях намира модели в изхода на своя предшественик. За да разберете защо това е полезно, е важно да разгледате какво е станало преди задълбоченото обучение.
Обратно пропагандиране на невронни мрежи
Основната структура на невронната мрежа всъщност е доста проста. Всеки „неврон“ е малък възел, който приема вход и използва вътрешни правила, за да реши кога да „стреля“ (произвежда изход). Входовете, подаващи се във всеки неврон, имат "тежести" - умножители, които контролират дали сигналът е положителен или отрицателен и колко силен.
Свързвайки тези неврони заедно, можете да изградите мрежа, която подражава на всеки алгоритъм. Вие подавате своя вход във входните неврони като двоични стойности и измервате стойността на изстрелване на изходните неврони, за да получите изхода. Като такъв, трикът на невронните мрежи от всякакъв тип е да вземете мрежа и да намерите набора от тегла, който най-добре приближава функцията, която ви интересува.
Обратно разпространяващи, алгоритъмът, използван за обучение на мрежата въз основа на данни, е много прост: стартирате мрежата със случайни тегла и след това се опитвате да класифицирате данни с известни отговори. Когато мрежата греши, проверявате защо не е наред (създавайки по-малък или по-голям изход от целта) и използвате тази информация, за да придвижите тежестите в по-полезна посока.
Правейки това отново и отново, за много точки от данни мрежата се научава да класифицира правилно всичките си данни и, да се надяваме, да генерализира нови точки от данни. Най- ключов поглед на алгоритъма за обратно разпространение е, че можете да местите данни за грешки назад през мрежата, като променяте всеки слой въз основа на промени, които направихте в последния слой, като по този начин ви позволява да изградите мрежи на няколко слоя дълбоки, което може да разбере по-сложно модели.
Backprop е изобретен през 1974 г. от Джефри Хинтъни имаше забележителния ефект да направи невронните мрежи полезни за широки приложения за първи път в историята. Тривиалните невронни мрежи съществуват от 50-те години на миналия век и първоначално са реализирани с механични двигателни неврони.
Друг начин да се мисли за алгоритъма за справка е като изследовател на пейзаж от възможни решения. Всяко тегло на неврона е друга посока, в която може да изследва, а за повечето невронни мрежи има хиляди от тях. Мрежата може да използва своята информация за грешки, за да види в коя посока трябва да се придвижи и докъде, за да намали грешката.
Той започва в произволна точка и непрекъснато консултирайки своя компас за грешки, се движи „надолу“ в посока на по-малко грешки, в крайна сметка се установява в дъното на най-близката долина: възможно най-доброто решение.
Така че защо не използваме backpropagation за всичко? Е, backprop има няколко проблема.
Най-сериозният проблем се нарича „изчезващ проблем с градиента. "По принцип, когато премествате данни за грешки обратно през мрежата, тя става по-малко смислена всеки път, когато върнете слой обратно. Опитът за изграждане на много дълбоки невронни мрежи с обратно разпространение не работи, защото грешката информацията няма да може да проникне достатъчно дълбоко в мрежата, за да обучава по-ниските нива в полезен начин.
Втори, по-малко сериозен проблем е, че невронните мрежи се сближават само до местна оптима: често се хващат в малка долина и пропускат по-дълбоки, по-добри решения, които не са близо до тяхната случайна отправна точка. И така, как да решим тези проблеми?
Мрежи на дълбоко вярване
Мрежи с дълбоки вярвания са решение на двата проблема и разчитат на идеята за изграждане на мрежи, които вече имат представа за структурата на проблема и след това усъвършенстват тези мрежи обратно разпространение. Това е форма на задълбочено обучение и тази, която се използва от Google и Microsoft.
Техниката е проста и се основава на вид мрежа, наречена „Ограничена машина на Болцман“Или„ RBM “, която разчита на това, което се нарича неподдържано обучение.
Ограничените Boltzman Machines, накратко, са мрежи, които просто се опитват да компресират данните, които са им предоставени, вместо да се опитват да я категоризират категорично според информацията за обучение. RBM вземат колекция от данни и се обучават според способността им да възпроизвеждат тези данни от паметта.
Правейки RBM по-малък от сбора на всички данни, които искате да кодират, принуждавате RBM да научи структурни закономерности за данните, за да ги съхранява в по-малко пространство. Това изучаване на дълбока структура позволява на мрежата да се генерализира: Ако тренирате RBM да възпроизвежда хиляди изображения на котки, можете да захранвате ново изображение в него - и като погледнете колко енергична се превръща мрежата в резултат, можете да разберете дали новото изображение съдържа котка или не.
Правилата за обучение за RBM наподобяват функцията на реални неврони вътре в мозъка по важни начини, по които други алгоритми (като backpropagation) не го правят. В резултат на това може да има неща, на които да научат изследователите как работи човешкият ум Мислещи машини: какво може да ни научи на съзнанието невронауката и изкуственият интелектМоже ли изграждането на изкуствено интелигентни машини и софтуер да ни научи за работата на съзнанието и същността на самия човешки ум? Прочетете още .
Друга отлична характеристика на МКУ е, че те са „конструктивни“, което означава, че те също могат да участват обратно, работи назад от функция на високо ниво, за да създаде въображаеми входове, съдържащи това отличителен белег. Този процес се нарича „сънуване“.
Така че защо това е полезно за задълбоченото обучение? Е, машините на Boltzman имат сериозни проблеми с мащабирането - колкото по-дълбоко се опитвате да ги направите, толкова повече време отнема да тренирате мрежата.
Ключовият поглед върху мрежите с дълбоки убеждения е, че можете да подреждате двуслойни УПМ заедно, всеки обучен да намира структура в изхода на своя предшественик. Това е бързо и води до мрежа, която може да разбере сложни, абстрактни характеристики на данните.
В задача за разпознаване на изображение, първият слой може да се научи да вижда линии и ъгли, а вторият слой може да се научи да вижда комбинациите от тези линии, които съставят функции като очи и носове. Третият слой може да комбинира тези функции и да се научи да разпознава лице. Превръщайки тази мрежа към обратно разпространение, можете да усъвършенствате само онези функции, които са свързани с категориите, които ви интересуват.
В много отношения това е просто поправяне на обратното разпространение: той позволява на backprop да „изневерява“, като го стартира с куп информация за проблема, който се опитва да реши. Това помага на мрежата да достигне по-добри минимуми и гарантира, че най-ниските нива на мрежата са обучени и правят нещо полезно. Това е.
От друга страна, методите за дълбоко обучение доведоха до драматични подобрения в скоростта на машинното обучение и точността и са почти отговорни за бързото подобряване на софтуера за реч в текстов текст в последните години.
Състезание за Canny Computers
Можете да видите защо всичко това е полезно. Колкото по-дълбоко можете да изградите мрежи, толкова по-големи и по-абстрактни са концепциите, които мрежата може да научи.
Искате ли да знаете дали имейл е спам или не? За умните спамери това е трудно. Всъщност трябва да прочетете имейла и да разберете някои намерения зад него - опитайте се да проверите дали има връзка между изпращача и получателя и да разберете намеренията на получателя. Трябва да направите всичко това на базата на безцветни низове от букви, повечето от които описват понятия и събития, за които компютърът не знае нищо.
Това може да се иска от всекиго.
Ако бъдете помолени да се научите да идентифицирате спам на език, на който вече не сте говорили, при условие само някои положителни и отрицателни примери, ще се справите много зле - и имате човешки мозък. За компютър проблемът беше почти невъзможен, до съвсем скоро. Това са видове прозрения, които задълбоченото обучение може да има и ще бъде невероятно мощно.
В момента Microsoft печели тази надпревара с косъм. В дългосрочен план? Някой предполага.
Имидж кредити: “Компютърен интелект„, От Симон Лю,“Bullfrog", От Бруноп,"Компас отгоре„, От airguy1988,“По-свободно от безплатно, “От opensource.com
Писател и журналист със седалище в Югозапада, Андре гарантирано остава функционален до 50 градуса по Целзий и е водоустойчив до дълбочина от дванадесет фута.