Асоциация срещу корелация
Асоциацията и корелацията са два метода за обяснение на връзка между две статистически променливи. Асоциацията се отнася до по-обобщен термин и корелацията може да се разглежда като специален случай на асоциация, където връзката между променливите е линейна по природа.
Какво е асоцииране?
Статистическият термин асоциация се определя като връзка между две случайни променливи, което ги прави статистически зависими. Отнася се по-скоро за обща връзка, без да се споменава спецификата на връзката и не е необходимо да е причинно-следствена връзка.
Много статистически методи се използват за установяване на връзката между две променливи. Коефициентът на корелация на Пиърсън, съотношението на шансовете, корелацията на разстоянието, ламбда на Гудман и Крускал и ро (ρ) на Спирман са няколко примера.
Какво е корелация?
Корелацията е мярка за силата на връзката между две променливи. Коефициентът на корелация количествено определя степента на промяна на една променлива въз основа на промяната на другата променлива. В статистиката корелацията е свързана с концепцията за зависимост, която е статистическата връзка между две променливи
Корелационният коефициент на Pearson или само коефициентът на корелация r е стойност между -1 и 1 (-1≤r≤+1). Това е най-често използваният корелационен коефициент и е валиден само за линейна връзка между променливите. Ако r=0, няма връзка, а ако r≥0, връзката е правопропорционална; стойността на една променлива се увеличава с увеличаването на другата. Ако r≤0, връзката е обратно пропорционална; едната променлива намалява, докато другата нараства.
Поради условието за линейност, корелационният коефициент r може също да се използва за установяване на наличието на линейна връзка между променливите.
Коефициентът на рангова корелация на Spearman и коефициентът на рангова корелация на Kendrall измерват силата на връзката, с изключение на линейния фактор. Те вземат предвид степента, в която една променлива се увеличава или намалява с другата. Ако двете променливи се увеличават заедно, коефициентът ще бъде положителен и ако едната променлива се увеличава, докато другата намалява, стойността на коефициента ще бъде отрицателна.
Коефициентите на рангова корелация се използват само за установяване на типа на връзката, но не и за подробно изследване като коефициента на корелация на Pearson. Те се използват също така, за да се намалят изчисленията и да се направят резултатите по-независими от ненормалността на разглежданите разпределения.
Каква е разликата между асоцииране и корелация?
• Асоциацията се отнася до общата връзка между две случайни променливи, докато корелацията се отнася до повече или по-малко линейна връзка между случайните променливи.
• Асоциацията е концепция, но корелацията е мярка за асоциация и са предоставени математически инструменти за измерване на величината на корелацията.
• Корелационният коефициент на момента на продукта на Pearson установява наличието на линейна връзка и определя естеството на връзката (дали са пропорционални или обратно пропорционални).
• Коефициентите на рангова корелация се използват само за определяне на естеството на връзката, като се изключва линейността на връзката (тя може или не може да бъде линейна, но ще покаже дали променливите се увеличават заедно, намаляват заедно или една се увеличава докато другият намалява или обратно).