И корреляция, и регрессия являются статистическими инструментами, которые имеют дело с двумя или более переменными. Хотя оба они относятся к одному и тому же предмету, между ними есть различия. Различия между ними объясняются ниже.
Термин корреляция со ссылкой на две или более переменных означает, что переменные связаны каким-либо образом. Корреляционный анализ определяет, существует ли связь между двумя переменными, и сила связи. Если две переменные x (независимая) и y (зависимая) связаны между собой так, что изменение величины независимой переменной сопровождается изменением величины зависимой переменной, то две переменные называются коррелированными.
Корреляция может быть линейной или нелинейной. Линейная корреляция - это такая, где переменные связаны так, что изменение значения одной переменной будет вызывать постоянное изменение значения другой переменной. В линейной корреляции рассеянные точки, связанные с соответствующими значениями зависимых и независимых переменных, будут группироваться вокруг не горизонтальной прямой линии, хотя горизонтальная прямая линия также будет указывать на линейную связь между переменными, если прямая линия может соединить точки, представляющие переменные.
С другой стороны, регрессионный анализ использует существующие данные для определения математической взаимосвязи между переменными, которая может использоваться для определения значения зависимой переменной по отношению к любому значению независимой переменной.
Корреляция связана с измерением силы ассоциации или интенсивности отношений, где регрессия связана с прогнозированием значения зависимой переменной по отношению к известному значению независимой переменной. Это можно объяснить следующими формулами.
Коэффициент корреляции или коэффициент корреляции (r) между x & y определяется по следующей формуле:
r = ковариация (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx & σy - стандартные отклонения x и y соответственно, и, - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Коэффициент корреляции r является чистым числом и не зависит от единицы измерения. Таким образом, если x - рост (дюймы), а y - вес (фунты) людей определенного региона, то r - ни в дюймах, ни в фунтах, а просто число.
Уравнение регрессии находится по следующей формуле:
Уравнение регрессии y на x (чтобы узнать оценку y) имеет вид y - y '= byx (x-x‾), byx называется коэффициентом регрессии y на x. Уравнение регрессии x на y (чтобы узнать оценку x) имеет вид x - x '= bxy (y-y‾), bxy называется коэффициентом регрессии x на y.
Корреляционный анализ не предполагает зависимости какой-либо переменной от другой переменной, а также не пытается выяснить взаимосвязь между ними. Он просто оценивает степень ассоциации между переменными. Другими словами, корреляционный анализ проверяет взаимозависимость переменных. Регрессионный анализ, с другой стороны, описывает зависимость зависимой переменной или переменной отклика от независимой или объясняющей переменной (ей). Регрессионный анализ предполагает наличие односторонней причинно-следственной связи между объясняющими и ответными переменными и не учитывает, является ли эта причинная связь положительной или отрицательной. Для корреляции значения как зависимых, так и независимых переменных являются случайными, но для значений регрессии независимых переменных не обязательно должны быть случайными.
1. Корреляционный анализ - это тест взаимозависимости между двумя переменными. Регрессионный анализ дает математическую формулу для определения значения зависимой переменной относительно значения независимой переменной / с.
2. Коэффициент корреляции не зависит от выбора происхождения и масштаба, но коэффициент регрессии не так.
Для корреляции значения обеих переменных должны быть случайными, но это не так для коэффициента регрессии..
1. Дас, Н. Г., (1998), Статистические методы, Калькутта
2. Корреляция и регрессия, доступны по адресу www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Регрессия и корреляция, доступны на www.abyss.uoregon.edu