Ето как да използвате вградените инструменти на Excel, за да улесните статистическия анализ.
Остатъчните графики играят съществена роля в регресионния анализ. Те ви казват колко точно вашата регресионна линия представя връзката между две променливи. Следното ръководство обяснява как да изчислите и начертаете остатъците в Excel с помощта на два метода.
Но преди да преминем към добрите неща, нека накратко разберем остатъците и тяхното значение в регресионния анализ.
Какво представляват остатъците и защо са важни?
Остатъкът е разликата между наблюдаваната (действителна) стойност и прогнозираната стойност. По-просто казано, остатъкът е грешка. Например, ако наблюдаваната стойност е 10 и вашият модел даде стойност 8, тогава остатъчната стойност ще бъде 2.
От друга страна, остатъчната диаграма е точкова диаграма, в която независимата променлива (възраст) е нанесена на хоризонталната ос, а остатъците (грешките) са нанесени на вертикалната ос.
Добре, знаете какво са остатъците, но защо са важни? За да разберете това, разгледайте следния случай:
Искаме да разберем връзката между възрастта и нивата на спестяване. За това ще начертаем регресионна линия. Не сме сигурни обаче дали регресионната линия точно представя връзката между двете променливи. Ето къде идват остатъците. Ние използваме остатъчен график, за да проверим точността на регресионната линия.
Сега, след като знаете какво представляват остатъците, нека научим как да създадем диаграма на остатъците в Excel:
Как да създадете остатъчна графика с помощта на уравнение на трендовата линия
Първият метод за начертаване на остатъци в Excel използва уравнение на трендовата линия за изчисляване на прогнозираните стойности за нашите данни. След като имаме това, можем да изчислим остатъците, като извадим прогнозираните стойности от наблюдаваните стойности. Накрая създаваме диаграма на разсейване с предикторите на хоризонталната ос и остатъците на вертикалната ос.
Въпреки че този метод изисква повече стъпки от втория метод, това е чудесен начин да разберете концепцията. След като придобиете прилично разбиране, можете да използвате втория метод, който изисква по-малко време и усилия.
Нека ви преведем през процеса стъпка по стъпка:
Стъпка 1: Въведете данните
Започваме с въвеждане на стойностите за предиктора (под х колона) и наблюдаваните стойности (под Y колона):
Стъпка 2: Създайте точкова диаграма на данните
Сега създаваме точкова диаграма на данните, като следваме стъпките по-долу:
Ако не сте запознати с точковите диаграми, ето изчерпателна статия за това създаване на точкова диаграма в Excel и представяне на вашите данни. Можете също така да се научите да използвайте точкова диаграма в Excel, за да предвидите поведението на данните.
- Изберете данните (под х и Y колони).
- Отидете на Лента на Excel и щракнете Поставете.
- В Графики щракнете върху стрелката под Точкова диаграма опция.
- Изберете първата точкова диаграма (Разпръснете само с маркери).
- Ще получите точкова диаграма, подобна на следната диаграма:
Стъпка 3: Добавяне на линия на тренд и показване на уравнението на линията на тренда на Scatterplot
Следвайте стъпките по-долу, за да добавите линия на тренда към точковата диаграма:
- Кликнете върху точковата диаграма.
- Отидете на Лента на Excel и щракнете Оформление.
- В Заден план раздел, щракнете върху стрелката под Линия на тенденция икона.
- Изберете Линеен тренд опция.
Сега ще видите линия (линия на тренда), пресичаща точките на вашата точкова диаграма. За да покажете уравнението на линията на тренда на диаграмата на разсейване, следвайте стъпките по-долу:
- Отидете отново на Линия на тенденция и щракнете върху стрелката под нея.
- Кликнете Още опции за Trendline.
- А Формат Trendline ще се появи диалогов прозорец.
- Проверете Показване на уравнението върху диаграмата опция в долната част на Формат Trendline диалогов прозорец. Уравнението на тренд линията ще се покаже на графиката.
Стъпка 4: Изчислете прогнозираните стойности
За да изчислите прогнозираните стойности, създайте друга колона (Z) до вашите данни и следвайте стъпките по-долу:
- Въведете формулата на линията на тренда, показана на графиката, и я поставете под колоната Z (клетка C2). Променете х във формулата със стойности под колоната X.
- Така че за първата прогнозирана стойност формулата ще бъде дадена, както следва:
=1,5115*A2+23,133
- Сменете A2 с A3 във формулата на линията на тренда за втората прогнозна стойност.
- За третата прогнозирана стойност заменете A3 с A4и така нататък, докато получите всички прогнозирани стойности за съответните им предиктори.
Стъпка 5: Намерете остатъчните стойности
Сега, след като имаме предвидените стойности, можем да намерим остатъчните стойности, като извадим прогнозираните стойности от наблюдаваните (действителни) стойности под колоната Y. Формулата за първата остатъчна стойност ще бъде =В2-С2. За второто формулата ще бъде =B3-C3, и така нататък.
Стъпка 6: Създайте остатъчната графика
За да създадем остатъчен график, имаме нужда от предиктор и остатъчни стойности. След като имаме и двете, следвайте стъпките по-долу:
- Изберете колони Y и З.
- Щракнете с десния бутон и изберете Крия.
- Сега изберете х и остатъци колони.
- Отидете на Поставете раздел в лентата на Excel.
- Щракнете върху стрелката под Скатер икона.
- Изберете Разпръснете само с маркери опция.
- Ще получите своя остатъчен график, както е показано по-долу.
За втория метод всичко, което трябва да направите, е да предоставите на Excel данните и той ще свърши цялата работа. Можете да създадете остатъчен график само с няколко кликвания. Но за това ще трябва да заредите пакета с инструменти за анализ на Excel. Да започваме:
- Отидете на Файл раздел и щракнете върху Настроики.
- The Опции на Excel ще се появи диалогов прозорец.
- Отидете на Управлявайте кутия (в долната част), изберете Excel добавкии щракнете Отивам.
- Ан Добавки ще се появи диалогов прозорец.
- Проверете Пакет с инструменти за анализ кутия и щракнете Добре.
- Сега отидете на Лента на Excel и щракнете Данни.
- Ще намерите Анализ на данни икона в Анализ раздел.
Стъпка 2: Въведете данните
- Изберете колони А и д, и щракнете с десния бутон на мишката. Кликнете Показване.
- Сега копирайте х и Y колони.
Ще забележите, че графиката се е променила, след като разкриете колоните. За да го променим обратно към оригиналния остатъчен график, ще трябва да скрием Y и З колони (като изберете Y и З колони, щракнете с десния бутон на мишката и изберете Крия).
- Отворете нов лист на Excel и поставете х и Y колони.
- Щракнете върху новопоявилото се Анализ на данни опция в Анализ раздел на Данни раздел.
- А Анализ на данни ще се появи диалогов прозорец.
- Намерете и изберете Регресия под Инструменти за анализ.
- Кликнете ДОБРЕ. The Регресия ще се появи диалогов прозорец.
- Въведете стойностите в Y колона (предсказателите, B2:B11) в Въведете диапазон Y поле.
- Въведете диапазона от клетки в х колона (независимите променливи, A2:A11) в Обхват на въвеждане на X поле.
Стъпка 3: Създайте остатъчната графика
В Регресия диалогов прозорец, под Изходни опции, проверете Нов работен лист Plyи щракнете Добре.
Excel автоматично ще създаде остатъчната диаграма заедно със следните резултати, които можете да използвате, за да проверите надеждността на вашия регресионен модел:
- Регресионна статистика
- ANOVA Таблица
- Таблица с коефициенти
- Остатъчен изход
Пакетът с инструменти за анализ на Excel предлага набор от ценни статистически функции, които можете да използвате, за да анализирате своите набори от данни. След като създадете остатъчната диаграма чрез пакета с инструменти за анализ на Excel, може да започнете да се чешете по главата, докато разглеждате всички сложни таблици. Но след като научите как да правите фундаментален анализ на данни в Excel, числата не изглеждат толкова плашещи.