Разлика между средна стойност, медиана и режим

Разлика между средна стойност, медиана и режим
Разлика между средна стойност, медиана и режим

Видео: Разлика между средна стойност, медиана и режим

Видео: Разлика между средна стойност, медиана и режим
Видео: Все свойства медианы в одной задаче. 2024, Юли
Anonim

Средно спрямо Медиана срещу Режим

Средната стойност, медианата и модата са основните мерки за централна тенденция, използвани в описателната статистика. Те са напълно различни един от друг и случаите, в които се използват за обобщаване на данните, също са различни.

Средно

Средната аритметична стойност е сумата от стойностите на данните, разделена на броя стойности на данните, т.е.

[латекс]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]

Ако данните са от извадково пространство, това се нарича извадково средно ([latex]\bar{x} [/latex]), което е описателна статистика на извадката. Въпреки че е най-често използваната описателна мярка за извадка, тя не е стабилна статистика. Той е много чувствителен към отклонения и колебания.

Например, помислете за средния доход на гражданите на даден град. Тъй като всички стойности на данните се сумират и след това се разделят, доходът на изключително богат човек влияе значително върху средната стойност. Следователно средните стойности не винаги са добро представяне на данните.

Също така, в случай на променлив сигнал, токът, преминаващ през даден елемент, периодично варира от положителна към отрицателна посока и обратно. Ако вземем средния ток, преминаващ през елемента за един период, той ще даде 0, което означава, че през елемента не е преминал ток, което очевидно не е вярно. Следователно и в този случай средноаритметичната стойност не е добра мярка.

Средната аритметична стойност е добър индикатор, когато данните са равномерно разпределени. За нормално разпределение средната стойност е равна на модата и медианата. Той също така има най-ниските остатъци, когато се взема предвид средната квадратна грешка; следователно, най-добрата описателна мярка, когато се изисква да се представи набор от данни с едно число.

Медиана

Стойностите на средната точка от данни след подреждането на всички стойности на данните във възходящ ред се определят като медиана на набора от данни. Медианата е 2-ри квартил, 5-ти децил и 50-ти персентил.

• Ако броят на наблюденията (точките с данни) е нечетен, тогава медианата е наблюдението точно в средата на подредения списък.

• Ако броят на наблюденията (точките с данни) е четен, тогава медианата е средната стойност на двете средни наблюдения в подредения списък.

Медианата разделя наблюдението на две групи; т.е. група (50%) от стойности по-високи и група (50%) от стойности по-ниски от медианата. Медианите се използват специално в изкривени разпределения и представят данните доста по-добре от средната аритметична стойност.

Режим

Mode е най-често срещаното число в набор от наблюдения. Режимът на набор от данни се изчислява чрез намиране на честотата на всеки елемент в набора.

• Ако нито една стойност не се среща повече от веднъж, тогава наборът от данни няма режим.

• В противен случай всяка стойност, която се появява с най-голяма честота, е режим на набора от данни.

Може да съществува повече от 1 режим в набор; следователно режимът не е уникална статистика на набор от данни. При равномерно разпределение има един режим. Режимът на дискретно разпределение на вероятностите е точката, в която функцията на вероятностната маса достига най-високата си точка. Въз основа на горните интерпретации можем да кажем, че глобалните максимуми са режими.

Разгледайте приложението и на трите мерки към следния набор от данни.

ДАННИ: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}

Средно=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12

Медиана=9 (13-ти елемент)

Режим=9 (честота от 9=5)

Каква е разликата между средна стойност, медиана и режим?

• Средната аритметична стойност е сумата от стойностите (наблюденията), разделена на броя на наблюденията. Това не е стабилна статистика и силно зависи от характера на нормалното разпределение в рамките на разглежданото разпределение. Едно отделно отклонение може да причини значителна промяна в средната стойност, което дава относително подвеждащи стойности. Концепцията може да се разшири до средно геометрично, средно хармонично, средно претеглено и т.н.

• Медианата е средните стойности на набора от наблюдения и е сравнително по-малко засегната от извънредни стойности. Може да даде добра оценка като обобщена статистика в силно изкривени случаи.

• Режимът е най-често срещаните стойности на наблюдение в набора от данни. Ако разпределението е положително изкривено, модата лежи вляво от медианата, а ако е отрицателно изкривено, модата лежи вдясно от медианата.

• Ако е положително изкривена, средната е точно до медианата; ако отрицателно изкривената средна стойност е отляво на медианата.

• При нормалното разпределение и трите, средната стойност, модата и медианата са равни.

Препоръчано: