Параметрични срещу непараметрични
Статистиката е един клон на изследванията, който ни позволява да разберем динамиката на популацията, като използваме проби, взети от определена популация, която ни интересува. От съществено значение е тези проби да бъдат произволни. Много формули са създадени с включване на математика, за да се направят изводи относно параметрите на населението. Естествено всяка популация може да има „нормално разпределение“, където дисперсията на данните/извадките има формата на камбана в честотната графика. При нормално разпределение повечето от пробите се концентрират около средната стойност и 68%, 95%, 99% от данните се намират съответно в рамките на 1, 2 и 3 стандартни отклонения. Параметричната и непараметричната статистика зависят от това дали се взема предвид нормалното разпределение.
Какво е параметрична статистика?
Параметричната статистика е статистиката, в която данните/извадките се считат за извлечени от нормално разпределение. Дефиницията на параметричната статистика е „статистиката, която предполага, че данните идват от тип вероятностно разпределение и прави изводи относно параметрите на разпределението“. Повечето от известните елементарни статистически методи принадлежат към тази група. В действителност те може да не са нормално разпределени. Следователно този тип статистика се основава на повече предположения. Ако данните/извадките са нормално разпределени или почти нормално разпределени, формулите могат да дадат точни резултати и заключения. Въпреки това, ако предположението за нормално разпределение е грешно, параметричната статистика може да бъде доста подвеждаща.
Какво е непараметрична статистика?
Непараметричната статистика е известна също като статистика без разпространение. Предимството на този тип статистика е, че не е необходимо да се правят предположения, както се правеше преди с параметри. Непараметричните статистически изчисления обръщат внимание на медианите, отколкото на средните. Следователно, ако една или две се отклоняват от средната стойност, техният ефект се пренебрегва. Като цяло параметричната статистика е предпочитана от тази, тъй като има повече сила да отхвърли невярна хипотеза, отколкото непараметричния метод. Един от най-известните непараметрични тестове е Хи-квадрат. Съществуват непараметрични аналози за някои параметрични тестове като Wilcoxon T тест за t-тест на сдвоени проби, Mann-Whitney U тест за независими проби t-тест, корелация на Spearman за корелация на Pearson и др. За една проба t-тест няма сравним непараметричен тест.
Каква е разликата между параметрични и непараметрични?
• Параметричната статистика зависи от нормалното разпределение, но непараметричната статистика не зависи от нормалното разпределение.
• Параметричните статистики правят повече предположения от непараметричните статистики.
• Параметричните статистики използват по-прости формули в сравнение с непараметричните статистики.
• Когато се смята, че съвкупността е нормално разпределена или близка до нормално разпределена, най-добре е да се използва параметрична статистика. Ако не, най-добре е да се използва непараметричен метод.
• Повечето от общоизвестните елементарни статистически методи принадлежат към параметричната статистика. Непараметричната статистика се използва пестеливо и се прилага за специални случаи.