С всички приказки за машинно обучение през последните години е трудно да се пренебрегне желанието да опитате сами. Изглежда, че технологията се развива с много бързи темпове и вече намира приложения в много среди. Ако имате някои умения за програмиране и основно разбиране на някои концепции за статистиката, добре е да се справите с изискванията за умения.
Трябва обаче да помислите и за хардуера, който ще ви е необходим за това. Можете да хоствате всичко у дома или да използвате отдалечени услуги - и двете имат своите предимства и недостатъци.
Основни изисквания за развитие на машинното обучение
Ще ви е необходим относително мощен хардуер, за да стартирате нещата. Въпреки че можете да използвате повечето свързани инструменти на евтин лаптоп, ще бъдете силно ограничени в своя учебен потенциал и всичко ще отнеме много повече време, отколкото е необходимо.
Вашият GPU (графичен процесор) е най-важният компонент тук. Той няма нищо общо с графиката директно. Просто графичните процесори са по-подходящи за видовете изчисления, на които разчита машинното обучение.
GPU, който поддържа CUDA, ще бъде още по-добър тук, въпреки че ще ви струва повече, за да се докоснете до такъв. Не се притеснявайте, ако в момента не можете да си позволите този вид хардуер. Можете също така да стартирате вашите решения дистанционно, въпреки че ще трябва да се справите с възходите и паденията на тази настройка.
Прочетете още: Какво представляват ядрата на CUDA?
Защо разходите ви могат да бъдат по-високи през 2021 г.
Също така си струва да се отбележи, че пазаруването на нов хардуер за машинно обучение може да бъде още по-голямо предизвикателство в момента. Има сложна глобална ситуация, развиваща се около недостиг на полупроводници, използвани в производството на различна потребителска електроника. От графични процесори за смартфони и други устройства, много пазари са били засегнати.
Някои прогнози твърдят, че този недостиг може да продължи още няколко години, тъй като е резултат от неочаквано изравняване на няколко фактора. Между пандемията, увреждаща производствените възможности и повишаващо търсенето, и миньорите и скалперите изкупувайки целия запас, ситуацията беше предизвикателна за тези, които просто искат да получат нова GPU.
Свързани: Защо графичните карти са толкова скъпи в момента?
Не е ясно кога и цените ще се нормализират - цените може да продължат да се покачват. Търсенето на използван графичен процесор може да бъде по-добър вариант, въпреки че не можете да гарантирате, че ще намерите нещо подходящо.
Предимства и недостатъци на хостваните платформи
Хоствана платформа за разработване на машинно обучение ще ви позволи да се съсредоточите върху действителната разработка, без да се притеснявате за хардуерни съображения. Ще се възползвате от усъвършенстваната мощ за обработка и тези платформи обикновено могат да изпълняват вашите решения много по-бързо от всичко, което бихте могли да изградите у дома.
Разбира се, този вид мощност не идва безплатно. За да използвате повечето от тези услуги, ще трябва да платите абонаментна такса. Предлаганите безплатно идват със свои собствени отделни ограничения.
Например може да не успеете да стартирате програмата си при поискване и може да се наложи да чакате на опашка. Това може да бъде особено проблематично при по-дълги тренировъчни сесии, където ще трябва да добавите няколко допълнителни часа на върха на вече дългия период на изчакване.
И тогава, някои хора просто се чувстват по-комфортно в работата си, когато имат всичко на разположение на местно ниво. Със сигурност може да е по-удобно да работите с машинно обучение по този начин, когато някои модели могат да бъдат няколко гигабайта и може да отнеме известно време, за да ги прехвърлите към и от съответните сървъри.
Най-доброто от двата свята
Можете да използвате смесен подход. Правете по-голямата част от разработката си локално - като действителната работа по вашите алгоритми и модели - и използвайте хоствана услуга за основна, скъпа обработка.
Обикновено можете да изпращате данните си на партиди, за да бъдат обработени наведнъж за определен период от време и просто трябва да се върнете, за да извлечете резултатите си след това. Това може да работи добре, когато не се нуждаете от незабавни резултати, и може да ви позволи да извършвате скъпо обучение на относително ниска цена.
Това е подходът, който повечето хора използват в наши дни. Ако не искате да харчите твърде много за хардуер, но се справяте първо с идеята да похарчите пари за това, вероятно това трябва да търсите.
На пазара има различни оферти, като някои са насочени към хора с по-малък бюджет, така че огледайте се и вижте какво има там. Понякога можете да се измъкнете с домакинството на проектите си за изненадващо малко, стига да нямат никакви сложни изисквания.
Бъдете внимателни с чувствителни данни
Не забравяйте, че машинното обучение често може да включва работа с чувствителни данни. Например може да имате задача да обработвате медицински записи или друга лична информация. Трябва да се разбира, че трябва да бъдете много по-внимателни в тези ситуации, ако работите с отдалечени хоствани услуги.
Трябва да сте наясно с последиците от предаването на тези данни на отдалечени сървъри. Понякога може да се окажете в нарушение на определени правни рамки, без дори да осъзнавате това. Например в Европейския съюз трябва да бъдете много внимателни с GDPR.
Добре е да се консултирате с юридически специалист, ако вашите упражнения за машинно обучение ще включват някакъв вид чувствителни данни. Дори по-добре, най-вероятно не би трябвало да използвате този вид данни за първите си проекти за обучение. Просто отидете с нещо, което е по-безопасно и по-лесно за боравене.
Машинно обучение самостоятелно
Машинното обучение у дома е осъществимо и има много предимства. Но това има и някои негативни последици, които трябва да вземете предвид и в крайна сметка трябва да се погрижите да намерите балансиран подход. Обърнете специално внимание на подробности като работа с чувствителни данни и винаги се запознайте с всички законови изисквания, които вашата ситуация може да ви наложи.
В крайна сметка това може да бъде много забавно и продуктивно преживяване, което може да ви постави в чудесна позиция на пазара на труда.
Python е изключително гъвкав, с приложения, вариращи от уеб разработка до анализ на данни.
Прочетете Напред
- Обяснени технологии
- Облачни изчисления
- Машинно обучение
Стефан е писател със страст към новото. Първоначално е завършил инженер по геология, но вместо това решава да се занимава с писане на свободна практика.
Абонирайте се за нашия бюлетин
Присъединете се към нашия бюлетин за технически съвети, рецензии, безплатни електронни книги и ексклузивни оферти!
Още една стъпка…!
Моля, потвърдете имейл адреса си в имейла, който току-що ви изпратихме.