Данните са чувствителна тема и естествено ще се занимавате с голяма част от тях като специалист по данни. Ето някои правила, които винаги трябва да спазвате.

Данните са изключително ценни и използването им лесно е една от най-добрите практики за повечето организации днес. Но познаването на индустриалните стандарти по отношение на това е необходимо за учените по данни, за да не грешат с данните, докато хората научават повече за тяхната стойност.

Като такива, учените по данни трябва да приемат безопасни и етични практики и да приемат стандартизирани такива. Вместо да обмисляте колко ценни са само данните, разумно е да поставите под въпрос методите за получаване и обработка на данни за всякакви цели. И така, ето девет кодекса на поведение, които всеки специалист по данни трябва да следва.

1. Спазвайте разпоредбите

Учените по данни трябва да познават разпоредбите за защита на данните, които се прилагат за определени работни места. В противен случай може несъзнателно да нарушите закона и да изложите себе си и другите на риск. Така че това знание е от решаващо значение за осигуряване на етична работа и предотвратяване на неволни вреди.

instagram viewer

Като такъв, проверете съответните закони, преди да се включите в каквито и да било дейности. Освен това, не просто спазвайте разпоредбите, за да следвате правилата; също потърсете по-задълбочено разбиране за тях. За да спазвате правилно разпоредбите, трябва да знаете защо са поставени и от какво защитават.

Няколко забележителни закона за поверителност са Общият регламент за защита на данните на ЕС (GDPR) и Калифорнийския закон за защита на личните данни на потребителите (CCPA). Други включват HIIPA, DPA, PIPEDA, LGPD и много специфични за индустрията разпоредби.

2. Уважавайте поверителността

Адреси, имейли и идентификатори са идентификатори, които не трябва да бъдат публични, тъй като представляват реални рискове за хората. Затова се уверете, че сте направили тези подробности възможно най-поверителни.

Ако бъдат разкрити, жертвите могат да пострадат от кражба на самоличност или измама. Те също могат да бъдат изнудвани от хора, заплашващи да разкрият поверителна информация. Освен това професионалистите могат да претърпят щети по репутацията и онлайн тормоз, след като личните им предпочитания станат публични. Те могат да повлияят на техните взаимоотношения, възможности за кариера и социално положение.

Така че имайки това предвид, проучете и изберете ефективни начини за подобряване сигурни онлайн самоличности и деидентифициране на данни. Например, можете да замените знаци, да премахнете директни идентификатори или да обобщите. Правейки това, защитавате чувствителни данни от киберпрестъпници, като същевременно помагате на организациите с вашите открития.

3. Елиминирайте пристрастията

Учените по данни разчитат на статистиката, за да бъдат възможно най-обективни. И все пак, въпреки тези усилия, пристрастието продължава, защото идеята, че по-големите данни са по-точни, е една от най- често срещани митове в науката за данните.

В това има известна истина, но за съжаление големите данни понякога съдържат ненужни или фалшиви елементи и статистики. Така че, вместо да се фокусирате само върху числата, уверете се, че вашите данни са чисти и представителни.

Почистването или филтрирането на данни преди употреба са отлични методи за борба с пристрастията. Например можете да проверите за грешки или да използвате стратифицирана извадка, за да осигурите представителни данни.

4. Не измисляйте и не измисляйте резултати

Измислянето е форма на злоупотреба с данни и изследователска измама, която включва измисляне на констатации и докладването им като верни.

Например, специалист по данни може да съобщи, че е установено, че дадено лекарство няма странични ефекти за повечето членове на определена възрастова група. Тези открития биха били измислени, ако нямаше първоначални медицински експерименти и събрани данни, които да ги подкрепят.

Измислянето има сериозни и отрицателни последици за учените по данни и тези, които разчитат на тяхната работа. Това може да унищожи доверието ви, да опетни репутацията на вашата организация, да навреди на обществото или да ви изложи на правни рискове.

5. Не фалшифицирайте и не манипулирайте доказателства

Фалшификацията е манипулиране на реалността, събрани данни, за да отговарят на дневен ред. Докато фабрикантите измислят резултати от несъществуващи данни, за да подкрепят твърденията си, фалшификаторите работят, за да опровергаят реални и съществуващи данни по лични причини. За да постигнат това, те могат да подправят изследователското оборудване, да променят или да пропуснат изцяло данните.

Фалшифицирането може да навреди на обществото чрез предоставяне на невярна информация, засягаща вземането на решения в различни сектори. Например, едно фалшифицирано проучване на лекарства може да изложи хората на ненужни рискове, неефективни лечения или вредни странични ефекти. Това може също да причини загуба на пари, време или материали, които биха могли да бъдат използвани за други цели.

Измислицата и фалшификацията са безскрупулни практики с неблагоприятни последици и множество санкции. Те могат да включват глоби, отнемане на пълномощията, загуба на финансиране за научни изследвания или лишаване от свобода.

6. Покажи прозрачност

Прозрачността за учените по данни означава да бъдат честни относно методите, прилагани за събиране, анализиране и представяне на данни. Учените по данни трябва да бъдат отворени и готови да споделят своите практики с други учени по данни и участници в проучването.

Освен това трябва да получите съгласието на участниците в проучването, тъй като публикуването на резултати без информирано съгласие може да прояви неуважение или да навреди на участниците по различни начини. Те могат да нарушат тяхното достойнство, личен живот и автономия или да ги изложат на вредни, ненужни рискове, произтичащи от изследването.

Прозрачността изгражда доверие с тези, които разчитат на вашите данни за прозрения. Той също така гарантира качество на данните, като позволява на другите да преглеждат вашите резултати.

Освен това откритостта сред учените по данни насърчава сътрудничеството и ученето. Можете да помогнете за насърчаване на иновациите, като споделите своя процес и съобщите най-добрите методи за визуализация на данни и техники за наука за данни на връстници, докато се учите от тях.

7. Събирайте данни сигурно

Учените по данни трябва да потвърдят безопасността на методите, използвани за събиране, анализиране и съхраняване на данни. Това предотвратява потенциални нарушения на данните, които могат да засегнат учените по данни и участниците в изследването.

Нарушенията на данните застрашават личната безопасност, подкопават общественото доверие и разкриват организационната некомпетентност, което води до зашеметяващи финансови загуби за компанията. Тези загуби могат да бъдат съдебни дела от жертвите на нарушаване на данните, по-малко клиенти и други.

В светлината на това трябва да проведете проучване, за да намерите най-ефективните решения за сигурност на данните и ги прилагайте. Например, можете да защитите връзките с TLS/SSL криптиране или да използвате ротационни проксита. Освен това можете да наложите мерки за контрол на достъпа и да създадете резервни копия в случай на атака. Когато намерите решения, не забравяйте да ги споделите с други, за да осигурите максимална сигурност.

8. Използвайте алгоритмите отговорно

Алгоритмите не са просто инструменти за анализ на данни. Те оказват силно влияние върху живота, поведението и възможностите на хората. Въпреки това, въпреки че помагат за решаването на проблеми и правят иновативни прогнози, те също са несъвършени.

Ако не са внимателно проектирани, тествани или внедрени, алгоритмите имат социални и етични въздействия, които могат да навредят на определени групи хора. Те също така въвеждат пристрастия, ако се обучават на данни, които отразяват съществуващите предразсъдъци и могат да бъдат непредвидими. Следователно учените по данни трябва да ги проектират и използват отговорно.

Винаги избирайте подходящи алгоритми, тествайте ефективността им и обяснявайте как работят. Също така се уверете, че идентифицирате потенциални източници на пристрастия и прилагате механизми, които актуализират или коригират, когато е необходимо.

9. Помислете за дългосрочните последици от вашата работа

Вашата работа като учен по данни ще повлияе значително на много аспекти на обществото. Така че винаги обмисляйте как вашите модели влияят на хората.

Например, опитайте се да поставите под въпрос дали вашата работа може да увековечи предразсъдъци и неравенство или да застраши поверителността в бъдеще. На следващо място, адресирайте адекватно тези опасения.

Имайте предвид, че ориентираната към бъдещето перспектива е по-важна от всеки коригиращ метод и мисленето за предстоящите дни е един от най-ефективните начини за вземане на етично обосновани решения.

Трябва да сте етични като специалист по данни

Като учен по данни вие получавате власт, която идва с пропорционална отговорност. Вашите умения са рядкост, така че вие ​​стоите в челните редици на вземането на организационни решения.

Вашите решения засягат всичко - от бизнес плановете на компанията до системите за наказателно правосъдие. Така че не трябва да ги правите леко. Винаги бъдете честни, етични и педантични в работата си, за да предпазите хората от съществуващи етични дилеми във вашата индустрия и други технологични области.