Дисперсия срещу стандартно отклонение
Вариацията е често срещано явление при изучаването на статистиката, защото ако нямаше промяна в данните, вероятно нямаше да имаме нужда от статистика. Вариацията се описва като дисперсия в статистиката, която е мярка за разстоянието на стойностите от тяхната средна стойност. Дисперсията е малка или малка, ако стойностите са групирани по-близо до средната стойност. Стандартното отклонение е друга мярка за описване на разликата между очакваните резултати и техните действителни стойности. Въпреки че и двете са тясно свързани, има разлики между дисперсията и стандартното отклонение, които ще бъдат обсъдени в тази статия.
Необработените стойности са безсмислени във всяко разпределение и ние не можем да извадим никаква значима информация от тях. Именно с помощта на стандартното отклонение можем да оценим значимостта на дадена стойност, тъй като тя ни казва колко далеч сме от средната стойност. Дисперсията е подобна по концепция на стандартното отклонение, с изключение на това, че е квадратна стойност на SD. Има смисъл да се разберат концепциите за дисперсия и стандартно отклонение с помощта на пример.
Да предположим, че има фермер, който отглежда тикви. Той има десет тикви с различно тегло, които са както следва.
2.6, 2.6, 2.8, 3.0, 3.1, 3.2, 3.3, 3.5, 3.6, 3.8. Лесно е да се изчисли средното тегло на тиквите, тъй като то е сумата от всички стойности, разделена на 10. В този случай то е 3,15 паунда. Въпреки това, никоя от тиквите не тежи толкова много и те варират в тегло, вариращо от 0,55 паунда по-леки до 0,65 паунда по-тежки от средното. Сега можем да запишем разликата на всяка стойност от средната по следния начин
-0,55, -0,55, -0,35, -0,15, -0,05, 0,15, 0,35, 0,45, 0,65.
Какво да направим от тези разлики от средната стойност., Ако се опитаме да намерим средната разлика, виждаме, че не можем да намерим средна стойност, тъй като при добавяне отрицателните стойности са равни на положителните стойности и средната разлика не може да бъде изчислена по този начин. Ето защо беше решено всички стойности да бъдат повдигнати на квадрат, преди да се сумират и да се намери средната стойност. В този случай стойностите на квадрат излизат както следва
0.3025, 0.3025, 0.1225, 0.0225, 0.0025, 0.0025, 0.1225, 0.2025, 0.4225.
Сега тези стойности могат да се събират и разделят на десет, за да се получи стойност, известна като дисперсия. Тази дисперсия е 0,1525 паунда в този пример. Тази стойност няма голямо значение, тъй като бяхме повдигнали разликата на квадрат, преди да намерим тяхната средна стойност. Ето защо трябва да намерим корен квадратен от дисперсията, за да стигнем до стандартното отклонение. В този случай това е 0,3905 паунда.
Накратко:
• Както дисперсията, така и стандартното отклонение са мерки за разпространение на стойностите във всякакви данни.
• Дисперсията се изчислява, като се вземе средната стойност на квадратите на индивидуалните разлики от средната стойност на извадката
• Стандартното отклонение е корен квадратен от дисперсията.