Корелация срещу ковариация
Корелацията и ковариацията са тясно свързани понятия в теоретичната статистика. Те са важни за определяне на връзката между две случайни променливи.
Какво е корелация?
Корелацията е мярка за силата на връзката между две променливи. Коефициентът на корелация количествено определя степента на промяна на една променлива въз основа на промяната на другата променлива. В статистиката корелацията е свързана с концепцията за зависимост, която е статистическата връзка между две променливи
Корелационният коефициент на Pearson или само коефициентът на корелация r е стойност между -1 и 1 (-1≤r≤+1). Това е най-често използваният корелационен коефициент и е валиден само за линейна връзка между променливите. Ако r=0 не съществува връзка, а ако r≥0 връзката е правопропорционална; стойността на една променлива нараства с нарастването на другата. Ако r≤0 връзката е обратно пропорционална; една променлива намалява, докато другата нараства.
Поради условието за линейност, корелационният коефициент r може също да се използва за установяване на наличието на линейна връзка между променливите.
Какво е ковариация?
В статистическата теория ковариацията е мярка за това колко две случайни променливи се променят заедно. С други думи, ковариацията е мярка за силата на корелацията между две случайни променливи.
В друга перспектива може да се види, че корелацията е просто нормализираната версия на ковариацията, където ковариацията е разделена на произведението на стандартните отклонения на двете случайни променливи. Диапазонът на ковариацията може да бъде голям; следователно не е лесно да се сравнява. Тази трудност се преодолява чрез довеждане на стойностите на ковариацията до диапазон, в който могат да бъдат сравнени чрез нормализиране (нещо като това, което прави z-резултатът). Въпреки че ковариацията и дисперсията са свързани една с друга по горния начин, техните вероятностни разпределения не са свързани едно с друго по прост начин и трябва да се разглеждат отделно.
Каква е разликата между корелация и ковариация?
• Както корелацията, така и ковариацията са мерки за връзката между две случайни променливи. Корелацията е мярка за силата на линейността на двете променливи, а ковариацията е мярка за силата на корелацията.
• Стойностите на коефициента на корелация са стойност между -1 и +1, докато обхватът на ковариацията не е постоянен, но може да бъде положителен или отрицателен. Но ако случайните променливи са стандартизирани преди изчисляването на ковариацията, тогава ковариацията е равна на корелацията и има стойност между -1 и +1.