Линейный против Логистической регрессии
В статистическом анализе важно определить отношения между переменными, относящимися к исследованию. Иногда это может быть единственной целью самого анализа. Одним из сильных инструментов, используемых для установления существования взаимосвязи и ее выявления, является регрессионный анализ..
Простейшей формой регрессионного анализа является линейная регрессия, где отношение между переменными является линейным отношением. В статистическом выражении это выявляет связь между объясняющей переменной и переменной ответа. Например, используя регрессию, мы можем установить связь между ценой товара и потреблением на основе данных, собранных из случайной выборки. Регрессионный анализ создаст функцию регрессии набора данных, которая представляет собой математическую модель, которая наилучшим образом соответствует имеющимся данным. Это можно легко представить с помощью точечной диаграммы. Графически регрессия эквивалентна поиску наилучшей кривой соответствия для данного набора данных. Функция кривой является функцией регрессии. Используя математическую модель, можно прогнозировать использование товара по заданной цене..
Поэтому регрессионный анализ широко используется при прогнозировании и прогнозировании. Он также используется для установления взаимосвязей в экспериментальных данных, в областях физики, химии, а также во многих естественных и технических дисциплинах. Если отношение или функция регрессии является линейной функцией, то этот процесс называется линейной регрессией. На графике рассеяния его можно представить в виде прямой линии. Если функция не является линейной комбинацией параметров, то регрессия является нелинейной.
Логистическая регрессия сравнима с многомерной регрессией, и она создает модель для объяснения влияния нескольких предикторов на переменную ответа. Однако в логистической регрессии переменная конечного результата должна быть категориальной (обычно разделенной; то есть парой достижимых результатов, таких как смерть или выживание, хотя специальные методы позволяют моделировать более категоризованную информацию). Непрерывная исходная переменная может быть преобразована в категориальную переменную, которая будет использоваться для логистической регрессии; однако, коллапс непрерывных переменных таким образом, в основном, не рекомендуется, потому что это снижает точность.
В отличие от линейной регрессии, к среднему значению прогнозирующие переменные в логистической регрессии не обязательно должны быть линейно связаны, обычно распределены или иметь одинаковую дисперсию внутри каждого кластера. В результате связь между предиктором и исходными переменными вряд ли будет линейной функцией.
В чем разница между логистической и линейной регрессией?
• В линейной регрессии предполагается линейная зависимость между объясняющей переменной и переменной отклика, и параметры, удовлетворяющие модели, определяются путем анализа, чтобы дать точное соотношение.
• Линейная регрессия выполняется для количественных переменных, а результирующая функция является количественной.
• В логистической регрессии используемые данные могут быть категориальными или количественными, но результат всегда является категоричным.