Популация спрямо извадково стандартно отклонение
В статистиката се използват няколко индекса за описание на набор от данни, съответстващ на неговата централна тенденция, дисперсия и неравномерност. Стандартното отклонение е една от най-често срещаните мерки за разсейване на данните от центъра на набора от данни.
Поради практически трудности, няма да е възможно да се използват данни от цялата съвкупност, когато се тества хипотеза. Следователно ние използваме стойности на данни от извадки, за да направим изводи за популацията. В такава ситуация те се наричат оценители, тъй като оценяват стойностите на параметрите на популацията.
Изключително важно е да се използват безпристрастни оценки в изводите. Казва се, че един оценител е безпристрастен, ако очакваната стойност на този оценител е равна на параметъра на населението. Например, ние използваме средната стойност на извадката като безпристрастен оценител за средната стойност на съвкупността. (Математически може да се покаже, че очакваната стойност на средната стойност на извадката е равна на средната стойност на съвкупността). В случай на оценка на стандартното отклонение на популацията, стандартното отклонение на извадката също е безпристрастен оценител.
Какво е стандартното отклонение на популацията?
Когато данните от цялото население могат да бъдат взети предвид (например в случай на преброяване), е възможно да се изчисли стандартното отклонение на населението. За да се изчисли стандартното отклонение на популацията, първо се изчисляват отклоненията на стойностите на данните от средната популация. Средноквадратичният корен (квадратичното средно) на отклоненията се нарича стандартно отклонение на популацията.
В клас от 10 ученици могат лесно да се събират данни за учениците. Ако една хипотеза се тества върху тази популация от ученици, тогава няма нужда да се използват примерни стойности. Например теглото на 10-те ученици (в килограми) се измерва на 70, 62, 65, 72, 80, 70, 63, 72, 77 и 79. Тогава средното тегло на десетте души (в килограми) е (70+62+65+72+80+70+63+72+77+79)/10, което е 71 (в килограми). Това е средната популация.
Сега, за да изчислим стандартното отклонение на популацията, изчисляваме отклонения от средната стойност. Съответните отклонения от средната стойност са (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 и (79 – 71)=8. Сумата от квадратите на отклонението е (-1)2 + (-9)2 + (-6)2 + 1 2 + 92 + (-1)2 + (-8)2+ 12 + 62 + 82 =366. Стандартното отклонение на популацията е √(366/10)=6,05 (в килограми). 71 е точното средно тегло на учениците от класа и 6.05 е точното стандартно отклонение на теглото от 71.
Какво е извадково стандартно отклонение?
Когато данни от извадка (с размер n) се използват за оценка на параметрите на съвкупността, се изчислява стандартното отклонение на извадката. Първо се изчисляват отклоненията на стойностите на данните от средната стойност на извадката. Тъй като средната стойност на извадката се използва вместо средната стойност на популацията (която е неизвестна), вземането на квадратичната средна стойност не е подходящо. За да се компенсира използването на извадкова средна стойност, сумата от квадратите на отклоненията се разделя на (n-1) вместо на n. Примерното стандартно отклонение е корен квадратен от това. В математически символи S=√{∑(xi-ẍ)2 / (n-1)}, където S е примерното стандартно отклонение, ẍ е средната стойност на извадката и xi са точките с данни.
Сега приемете, че в предишния пример популацията е учениците от цялото училище. Тогава класът ще бъде само примерен. Ако тази извадка се използва в оценката, стандартното отклонение на извадката ще бъде √(366/9)=6.38 (в килограми), тъй като 366 беше разделено на 9 вместо на 10 (размерът на извадката). Фактът, който трябва да се отбележи, е, че не е гарантирано, че това е точната стойност на стандартното отклонение на популацията. Това е само приблизителна оценка.
Каква е разликата между стандартното отклонение на популацията и стандартното отклонение на извадката?
• Стандартното отклонение на популацията е точната стойност на параметъра, използвана за измерване на дисперсията от центъра, докато стандартното отклонение на извадката е безпристрастен оценител за него.
• Стандартното отклонение на населението се изчислява, когато са известни всички данни за всеки индивид от населението. В противен случай се изчислява извадковото стандартно отклонение.
• Стандартното отклонение на популацията се дава от σ=√{ ∑(xi-µ)2/ n} където µ е средната популация и n е размерът на популацията, но стандартното отклонение на извадката се дава от S=√{ ∑(xi-ẍ)2 / (n-1)}, където ẍ е средната извадка, а n е размерът на извадката.йени