Отклонение срещу стандартно отклонение
Отклонение срещу стандартно отклонение
В описателната и инференциалната статистика се използват няколко индекса за описание на набор от данни, съответстващ на неговата централна тенденция, дисперсия и неравномерност. В статистическите изводи те са известни като оценители, тъй като оценяват стойностите на параметрите на популацията.
Дисперсията е мярката за разпространението на данните около центъра на набора от данни. Стандартното отклонение е една от най-често използваните мерки за дисперсия. Отклоненията на всяка точка от данните от средната стойност се вземат предвид при изчисляване на стандартното отклонение. Следователно може да се твърди, че стандартното отклонение заедно със средната стойност ще предостави почти достатъчна картина за набор от данни.
Разгледайте следния набор от данни. Теглото на 10 души (в килограми) се измерва на 70, 62, 65, 72, 80, 70, 63, 72, 77 и 79. Тогава средното тегло на десетте души (в килограми) е 71 (в килограми).
Какво е отклонение?
В статистиката отклонението означава количеството, с което отделна точка от данни се различава от фиксирана стойност като средната стойност. Като цяло, нека k е фиксирана стойност и x1, x2, …, xn означават данни комплект. След това отклонението на xj от k се определя като (xj– k).
Например, в горния набор от данни съответните отклонения от средната стойност са (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 и (79 – 71)=8.
Какво е стандартно отклонение?
Когато могат да се вземат предвид данни от цялото население (например в случай на преброяване), е възможно да се изчисли стандартното отклонение на населението. За да се изчисли стандартното отклонение на популацията, първо се изчисляват отклоненията на стойностите на данните от средната популация. Средноквадратичният корен (квадратичното средно) на отклоненията се нарича стандартно отклонение на популацията. В символи σ=√{ ∑(xi-µ)2 / n}, където µ е средната популация и n е размерът на популацията.
Когато данни от извадка (с размер n) се използват за оценка на параметрите на съвкупността, се изчислява стандартното отклонение на извадката. Първо се изчисляват отклоненията на стойностите на данните от средната стойност на извадката. Тъй като средната стойност на извадката се използва вместо средната стойност на популацията (която е неизвестна), вземането на квадратичната средна стойност не е подходящо. За да се компенсира използването на средната стойност на извадката, сумата от квадратите на отклоненията се разделя на (n-1) вместо на n. Примерното стандартно отклонение е корен квадратен от това. В математически символи S=√{ ∑(xi-ẍ)2 / (n-1)}, където S е стандартното отклонение на извадката, ẍ е средната стойност на извадката и xi са точките от данни.
В предишния набор от данни сумата от квадратите на отклонението е (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1) 2 + (-8)2 + 12 + 62 + 82=366. Така стандартното отклонение на популацията е √(366/10)=6,05 (в килограми). (Ако приемем, че разглежданата популация се състои от 10 души, от които са взети данните).
Каква е разликата между отклонение и стандартно отклонение?
• Стандартното отклонение е статистически индекс и оценка, но отклонението не е.
• Стандартното отклонение е мярка за разсейване на клъстер от данни от центъра, докато отклонението се отнася до количеството, с което една точка от данни се различава от фиксирана стойност.