Докато използвате Google Таблици за работа с два набора от данни, може да искате да сравните двата, като определите степента, в която единият влияе на другия.

Корелациите могат да предложат представа дали има предсказваща връзка между равнините x и y, но те не показват непременно причинно-следствена връзка. Ето как можете да използвате Google Таблици, за да идентифицирате корелациите във вашите данни.

Какво е корелация и за какво можете да я използвате?

Когато две променливи са свързани, може да се определи как една променлива влияе върху другата. Но е изключително важно да запомните, че корелацията не предполага надеждност в този случай; просто показва колко тясно и бързо се сравняват или свързват две променливи.

Статистическите показатели помагат за разбирането на основните тенденции в анализа на данните. Корелацията е сред най-често използваните статистически показатели и определя колко тясно свързани или зависими са две променливи.

Разбиране на коефициента на корелация в Google Таблици

В Google Sheets коефициентът на корелация се изчислява с помощта на функцията CORREL. Коефициентът на корелация служи като мярка за това колко тясно са свързани наборите от данни. Може да се използва за получаване на коефициента на корелация продукт-момент на Pearson (r), ако имате два променливи набора от данни. Ако искате да научите повече за този коефициент, можете да прочетете повече в това ръководство от

instagram viewer
Статистика в Leard.

Човек може да срещне един от трите корелационни показателя. Всяко измерване дефинира връзките между променливите по различен начин. Стойността му е между -1 и +1:

  • -1 означава перфектна отрицателна корелация: Когато една корелация има коефициент на корелация, който е равен на или под -0,9, се посочва, че е силно отрицателна. Това е индикация, че данните корелират. Въпреки това, променливата x продължава да нараства, докато променливата y продължава да намалява.
  • 0 означава липса на връзка: Счита се, че променливите не корелират, ако коефициентът на корелация е по-голям от 0,01, но по-малък от 0,1, тъй като няма забележима връзка между всяка променлива. Те са независими един от друг.
  • +1 означава перфектна положителна корелация: Когато коефициентът на корелация падне между 0,9 и 1, той се счита за силно положителен. Това показва, че е имало увеличение в двата набора променливи.

Най-високата стойност на коефициент може да е корелационен коефициент 1. Когато стойността на корелация е 1, това означава, че ако трябва да начертаете данните в графика, те ще бъдат напълно подравнени, за да се създаде права линия.

Ако все още сте малко изгубени, не се притеснявайте. Ще обясним синтаксиса на функцията CORREL и след това ще се потопим в някои примери от реалния свят, за да ви помогнем да я разберете по-добре. Разбиране на най-подходящи линии и как да направите трендови линии в Google Таблици ще ви помогне с това.

Синтаксис на функцията CORREL в Google Таблици

=CORREL(данни_y, данни_x) 

Нека разделим това на части и да разберем по-добре какво означава всяка фраза:

  • =КОРЕЛ: Това е функцията на Google Sheet, която определя r (коефициента на корелация продукт-момент на набора от данни на Pearson).
  • данни_y: Това се отнася до групата клетки, съдържащи зависимите данни или диапазона от стойности за тези клетки.
  • данни x: Това е или препратка към масива от клетки с независими данни, или диапазона от стойности за тези клетки.

Ако трябваше да начертаете точките от данни в графика, data_y ще бъде оста Y, а data_x оста X. Ще забележите, че има два различни начина за въвеждане на диапазона от данни. Опции са или референтен диапазон от клетки, или директно въвеждане на данни във функцията.

В повечето случаи е за предпочитане използването на референтни клетки. Това е така, защото електронната таблица най-вероятно вече съдържа вашите данни. Използването на диапазон от референтни клетки може да избегне прекомерно въведено въвеждане, което може да доведе до потребителска грешка.

Примери за функция CORREL в Google Таблици

Нека разгледаме няколко примера, за да разберем как да използваме функцията CORREL в Google Таблици.

Пример 1: Силна положителна корелация

За този първи пример, нека се преструваме, че работим в индустрията за недвижими имоти. В електронната таблица по-долу имаме дялове на хектари земя, които продавате, и броя на продадените единици от данните за тези различни земи във вашия лист в Google.

  1. Ако следвате в лист, ще започнете с въвеждане на данните от променливите във вашата електронна таблица, както е показано по-долу:
  2. Щракнете върху клетка C2
  3. Тип =КОРЕЛ(
  4. След това ще продължите към въвеждане на data_y, което в нашия случай е референтният диапазон от клетки A2:A6, след това въведете запетая.
  5. Продължете към въвеждане на data_x, което в нашия случай е посочено като B2: B6.
  6. Завършете със затваряща скоба, както е показано по-долу:
  7. Накрая натиснете Въведете за връщане на коефициента на корелация на двете части от данни в клетката C2.

Използвайки примера, току-що показан по-горе, вие сте получили коефициент на корелация от 0,90, което е силна положителна корелация, тъй като стойността му пада между 0,9 и 1. Следователно, това показва, че докато y се променя, x също се променя по значително сравним начин.

По-долу е представяне на нашите примерни примерни данни на XY точкова графика. Както можете да видите, линията на най-добро прилягане е близо до точките с данни на графиката, което подкрепя идеята, че цифрите са силно свързани.

Можете да научите повече за създаване на XY точкови графики в Google Таблици в другата ни статия.

Пример 2: Слаба отрицателна корелация

Този път ще използваме по-генеричен пример за „променливи x и y“ в нашата електронна таблица. Нарочно сме включили цифри, за да демонстрираме отрицателна корелация, която функцията CORREL демонстрира по-долу:

Няма силна връзка между променливите y и x, така че резултатът, който получаваме, е по-малко значим корелационен коефициент, отколкото в предишния пример. Резултатът, който постигнахме е -0,47. Това обаче не означава, че изобщо няма корелация. Нека отново да разгледаме най-подходящата линия, за да я разберем.

Както можете да видите от диаграмата на разсейване, точките от данни са по-далеч от линията на най-добро прилягане. Следователно има по-малка корелация, отколкото в първия пример, но не никаква. Ще забележите също, че линията на най-добро прилягане намалява. Това показва отрицателна корелация, една стойност намалява, докато другата се увеличава.

Пример 3: Няма връзка

Тук имаме набор от напълно произволни числа. Нека набързо да разгледаме отново как да използваме функцията CORREL:

  1. Въведете Cell C2 формулата CORREL
  2. Нашите аргументи са A2:A10 и B2:B10
  3. Натиснете Enter

Стойността, върната на C2, е 0,02. Ако коефициентът на корелация падне между 0,01 и 0,1, се определя, че въпросните променливи не корелират, тъй като няма забележима връзка между тях. Връзките между променливите са напълно независими.

По-долу е представянето на същото на точкова графика. Линията на най-добро съвпадение е почти равна, което показва малка корелация между двата набора от данни.

Свържете лесно вашите данни в Google Таблици

Корелацията може да бъде предизвикателна тема, ако не сте работили много с нея в гимназията. Това ръководство обхваща всички основи, но ще трябва да продължите да използвате функцията CORREL в Google Таблици, за да я запазите свежа в съзнанието си.

Това е мощна функция, тъй като помага да се избегне изграждането на точкови графики и може бързо да открие тенденции във вашите данни. Все пак не се страхувайте да добавяте диаграми, за да помогнете на другите потребители да разберат по-добре данните във вашите електронни таблици.