Стандартно отклонение срещу средно
В описателната и инференциалната статистика се използват няколко индекса за описание на набор от данни, съответстващ на неговата централна тенденция, дисперсия и неравномерност. В статистическите изводи те са известни като оценители, тъй като оценяват стойностите на параметрите на популацията.
Централната тенденция се отнася до и локализира центъра на разпределението на ценностите. Средната стойност, модата и медианата са най-често използваните индекси при описване на централната тенденция на набор от данни. Дисперсията е количеството разпространение на данните от центъра на разпространението. Диапазонът и стандартното отклонение са най-често използваните мерки за дисперсия. Коефициентите на асиметрия на Пиърсън се използват при описание на асиметрията на разпределение на данни. Тук наклонеността се отнася до това дали наборът от данни е симетричен спрямо центъра или не и ако не е колко е наклонен.
Какво означава?
Средната стойност е най-често използваният индекс на централната тенденция. При даден набор от данни средната стойност се изчислява, като се вземе сборът от всички стойности на данните и след това се раздели на броя на данните. Например теглото на 10 души (в килограми) се измерва на 70, 62, 65, 72, 80, 70, 63, 72, 77 и 79. Тогава средното тегло на десетте души (в килограми) може да бъде изчислено по следния начин. Сборът на теглата е 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Средна стойност=(сума) / (брой данни)=710 / 10=71 (в килограми).
Както в този конкретен пример, средната стойност на набор от данни може да не е точка от данни в набора, но ще бъде уникална за даден набор от данни. Средната стойност ще има същите единици като оригиналните данни. Следователно той може да бъде маркиран на същата ос като данните и може да се използва при сравнения. Освен това няма ограничение за знака за средната стойност на набор от данни. Тя може да бъде отрицателна, нула или положителна, тъй като сумата от набора от данни може да бъде отрицателна, нула или положителна.
Какво е стандартно отклонение?
Стандартното отклонение е най-често използваният индекс на дисперсия. За да се изчисли стандартното отклонение, първо се изчисляват отклоненията на стойностите на данните от средната стойност. Средната квадратична стойност на отклоненията се нарича стандартно отклонение.
В предишния пример съответните отклонения от средната стойност са (70 – 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 и (79-71)=8. Сумата от квадратите на отклонението е (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. Стандартното отклонение е √(366/10)=6,05 (в килограми). От това може да се заключи, че по-голямата част от данните са в интервала 71±6.05, при условие че наборът от данни не е силно изкривен и наистина е така в този конкретен пример.
Тъй като стандартното отклонение има същите единици като оригиналните данни, то ни дава мярка за това колко са отклонени данните от центъра; по-голямо е стандартното отклонение, по-голяма е дисперсията. Освен това стандартното отклонение ще бъде неотрицателна стойност, независимо от естеството на данните в набора от данни.
Каква е разликата между стандартното отклонение и средната стойност?
• Стандартното отклонение е мярка за дисперсия от центъра, докато средната стойност измерва местоположението на центъра на набор от данни.
• Стандартното отклонение винаги е неотрицателна стойност, но средната стойност може да приеме всяка реална стойност.