Дисперсия против Ковариации
Дисперсия и ковариация являются двумя показателями, используемыми в статистике. Дисперсия является мерой разброса данных, а ковариация указывает на степень изменения двух случайных величин вместе. Дисперсия - это скорее интуитивное понятие, но ковариация определяется математически вначале не так интуитивно.
Подробнее о дисперсии
Дисперсия - это мера дисперсии данных от среднего значения распределения. Он говорит, как далеко точки данных лежат от среднего значения распределения. Это один из основных дескрипторов распределения вероятностей и один из моментов распределения. Кроме того, дисперсия является параметром совокупности, а дисперсия выборки из совокупности выступает в качестве оценки дисперсии совокупности. С одной стороны, он определяется как квадрат стандартного отклонения.
Простым языком это может быть описано как среднее квадратов расстояния между каждой точкой данных и среднего значения распределения. Следующая формула используется для расчета дисперсии.
Вар (Х) = Е [(X-μ)2 ] для населения и
Вар (Х) = Е [(Х-~x)2 ] для образца
Далее можно упростить, чтобы Var (X) = E [X2 ] - (Е [Х])2.
Дисперсия имеет некоторые свойства подписи и часто используется в статистике для упрощения использования. Дисперсия неотрицательна, потому что это квадрат расстояний. Однако диапазон дисперсии не ограничен и зависит от конкретного распределения. Дисперсия постоянной случайной величины равна нулю, и дисперсия не изменяется относительно параметра местоположения.
Подробнее о Ковариантности
В статистической теории ковариация является мерой того, насколько две случайные величины изменяются вместе. Другими словами, ковариация является мерой силы корреляции между двумя случайными переменными. Также это можно рассматривать как обобщение понятия дисперсии двух случайных величин.
Ковариантность двух случайных величин X и Y, которые совместно распределены с конечным вторым импульсом, называется σXY= Е [(Х-Е [Х]) (У-Е [Y])]. Отсюда дисперсию можно рассматривать как частный случай ковариации, когда две переменные одинаковы. Cov (X, X) = Var (X),
Нормализуя ковариацию, можно получить коэффициент линейной корреляции или коэффициент корреляции Пирсона, который определяется как ρ = E [(X-E [X]) (Y-E [Y])] / (σИкс σY ) = (Cov (X, Y)) / (σИкс σY)
Графически ковариацию между парой точек данных можно рассматривать как область прямоугольника с точками данных в противоположных вершинах. Это может быть интерпретировано как мера величины разделения между двумя точками данных. Принимая во внимание прямоугольники для всего населения, перекрытие прямоугольников, соответствующих всем точкам данных, можно рассматривать как силу разделения; Дисперсия двух переменных. Ковариантность в двух измерениях, из-за двух переменных, но упрощение ее до одной переменной дает дисперсию единичного в качестве разделения в одном измерении.
В чем разница между дисперсией и ковариацией?
• Дисперсия - это мера распространения / дисперсии в популяции, в то время как ковариация рассматривается как мера вариации двух случайных величин или сила корреляции..
• Дисперсия может рассматриваться как частный случай ковариации.
• Дисперсия и ковариация зависят от величины значений данных и не могут сравниваться; следовательно, они нормализуются. Ковариация нормализуется на коэффициент корреляции (деление на произведение стандартных отклонений двух случайных величин), а дисперсия нормализуется на стандартное отклонение (путем взятия квадратного корня)