Разлика между вариация и ковариация

Разлика между вариация и ковариация
Разлика между вариация и ковариация

Видео: Разлика между вариация и ковариация

Видео: Разлика между вариация и ковариация
Видео: Корреляция и ковариация двумерной случайной величины 2024, Ноември
Anonim

Вариация срещу Ковариация

Дисперията и ковариацията са две мерки, използвани в статистиката. Дисперсията е мярка за разсейването на данните, а ковариацията показва степента на промяна на две случайни променливи заедно. Дисперсията е по-скоро интуитивна концепция, но ковариацията се дефинира математически в началото не е толкова интуитивна.

Повече за отклонението

Дисперсията е мярка за разсейване на данните от средната стойност на разпределението. Той показва колко далеч са точките от данни от средната стойност на разпределението. Това е един от основните дескриптори на разпределението на вероятностите и един от моментите на разпределението. Освен това дисперсията е параметър на популацията и дисперсията на извадка от популацията действа като оценител за дисперсията на популацията. От една гледна точка се определя като квадрат на стандартното отклонение.

На разбираем език може да се опише като средната стойност на квадратите на разстоянието между всяка точка от данни и средната стойност на разпределението. За изчисляване на дисперсията се използва следната формула.

Var(X)=E[(X-µ)2] за популация и

Var(X)=E[(X-‾x)2] за проба

Може допълнително да се опрости, за да се даде Var(X)=E[X2]-(E[X])2.

Variance има някои характерни свойства и често се използва в статистиката, за да направи използването по-лесно. Дисперсията е неотрицателна, защото е квадрат на разстоянията. Обхватът на дисперсията обаче не е ограничен и зависи от конкретното разпределение. Дисперсията на постоянна случайна променлива е нула и дисперсията не се променя по отношение на параметър за местоположение.

Повече за ковариацията

В статистическата теория ковариацията е мярка за това колко две случайни променливи се променят заедно. С други думи, ковариацията е мярка за силата на корелацията между две случайни променливи. Също така може да се разглежда като обобщение на концепцията за дисперсия на две случайни променливи.

Ковариацията на две случайни променливи X и Y, които са съвместно разпределени с краен втори импулс, е известна като σXY=E[(X-E[X])(Y-E[Y])]. От това дисперсията може да се разглежда като специален случай на ковариация, където две променливи са еднакви. Cov(X, X)=Var(X)

Чрез нормализиране на ковариацията може да се получи коефициентът на линейна корелация или коефициентът на корелация на Pearson, който се определя като ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )

Графично, ковариацията между двойка точки от данни може да се види като площта на правоъгълника с точките от данни в противоположните върхове. Може да се тълкува като мярка за величината на разделяне между двете точки от данни. Като се имат предвид правоъгълниците за цялата популация, припокриването на правоъгълниците, съответстващи на всички точки от данни, може да се счита за сила на разделянето; дисперсия на двете променливи. Ковариацията е в две измерения поради две променливи, но опростяването й до една променлива дава дисперсията на единично като разделяне в едно измерение.

Каква е разликата между вариация и ковариация?

• Дисперсията е мярката за разпространение/дисперсия в популация, докато ковариацията се разглежда като мярка за вариация на две случайни променливи или силата на корелацията.

• Дисперсията може да се разглежда като специален случай на ковариация.

• Дисперсията и ковариацията зависят от големината на стойностите на данните и не могат да се сравняват; следователно те са нормализирани. Ковариацията се нормализира в коефициента на корелация (разделен на произведението на стандартните отклонения на двете случайни променливи), а дисперсията се нормализира в стандартното отклонение (чрез вземане на корен квадратен)

Препоръчано: