Регресия срещу ANOVA
Регресията и ANOVA (Анализ на дисперсията) са два метода в статистическата теория за анализиране на поведението на една променлива в сравнение с друга. При регресията това често е вариация на зависима променлива на базата на независима променлива, докато при ANOVA това е вариация на атрибутите на две проби от две популации.
Повече за регресията
Регресията е статистически метод, използван за начертаване на връзката между две променливи. Често, когато се събират данни, може да има променливи, които зависят от други. Точната връзка между тези променливи може да се установи само чрез регресионни методи. Определянето на тази връзка помага да се разбере и предвиди поведението на една променлива спрямо другата.
Най-често срещаното приложение на регресионния анализ е да се оцени стойността на зависимата променлива за дадена стойност или диапазон от стойности на зависимите променливи. Например, използвайки регресия, можем да установим връзката между цената на стоката и потреблението въз основа на данните, събрани от произволна извадка. Регресионният анализ ще създаде регресионна функция на набора от данни, която е математически модел, който най-добре отговаря на наличните данни. Това може лесно да бъде представено чрез диаграма на разсейване. Графично регресията е еквивалентна на намирането на най-подходящата крива за дадения набор от данни. Функцията на кривата е регресионна функция. Използвайки математическия модел, употребата на дадена стока може да бъде предвидена за дадена цена.
Следователно регресионният анализ се използва широко при прогнозиране и прогнозиране. Използва се и за установяване на връзки в експериментални данни в областта на физиката, химията и много природни науки и инженерни дисциплини. Ако връзката или регресионната функция е линейна функция, тогава процесът е известен като линейна регресия. В точковата диаграма тя може да бъде представена като права линия. Ако функцията не е линейна комбинация от параметрите, тогава регресията е нелинейна.
Повече за ANOVA (Анализ на дисперсията)
ANOVA не включва изрично анализ на връзка между две или повече променливи. По-скоро проверява дали две или повече проби от различни популации имат една и съща средна стойност. Например, помислете за резултатите от изпит, проведен за клас в училище. Въпреки че тестовете са различни, представянето може да е еднакво от клас до клас. Един метод за проверка на това е чрез сравняване на средните стойности на всеки клас. ANOVA или ANAlysis Of Variance позволява тази хипотеза да бъде тествана. В основата си ANOVA може да се разглежда като разширение на t-теста, където се сравняват средните стойности на двете проби, взети от две популации.
Фундаменталната идея на ANOVA е да се вземат предвид вариациите в извадката и вариациите между пробите. Вариацията в извадката може да се припише на случайността, докато вариацията между пробите може да се отдаде както на случайността, така и на други външни фактори. Дисперсионният анализ се основава на три модела; модел с фиксирани ефекти, модел с произволни ефекти и модел със смесени ефекти.
Каква е разликата между регресия и ANOVA?
• ANOVA е анализът на вариацията между две или повече проби, докато регресията е анализът на връзката между две или повече променливи.
• Теорията на ANOVA се прилага с помощта на три основни модела (модел с фиксирани ефекти, модел на произволни ефекти и модел на смесени ефекти), докато регресията се прилага с помощта на два модела (модел на линейна регресия и модел на множествена регресия).
• ANOVA и регресията са две версии на Общия линеен модел (GLM). ANOVA се основава на категорични предикторни променливи, докато регресията се основава на количествени предикторни променливи.
• Регресията е по-гъвкавата техника и се използва при прогнозиране и прогнозиране, докато ANOVA се използва за сравняване на равенството на две или повече популации.