ключевое отличие между классификацией и деревом регрессии является то, что в классификации зависимые переменные являются категориальными и неупорядоченными, в то время как в регрессии зависимые переменные являются непрерывными или упорядоченными целыми значениями.
Классификация и регрессия - это методы обучения для создания моделей прогнозирования на основе собранных данных. Оба метода графически представлены как деревья классификации и регрессии, или, скорее, блок-схемы с разделением данных после каждого шага, или, скорее, «ветвью» в дереве. Этот процесс называется рекурсивным разбиением. В таких областях, как майнинг, используются эти методы классификации и регрессионного обучения. Эта статья посвящена дереву классификации и дереву регрессии.
1. Обзор и основные отличия
2. Что такое классификация
3. Что такое регрессия
4. Сравнение бок о бок - классификация и регрессия в табличной форме
5. Резюме
Классификация - это метод, используемый для получения схемы, которая показывает организацию данных, начиная с переменной-предшественника. Зависимые переменные - это то, что классифицирует данные.
Рисунок 01: Data Mining
Дерево классификации начинается с независимой переменной, которая разветвляется на две группы в соответствии с существующими зависимыми переменными. Он предназначен для выяснения ответов в форме категоризации, вызванной зависимыми переменными.
Регрессия - это метод прогнозирования, основанный на предполагаемом или известном числовом выходном значении. Это выходное значение является результатом серии рекурсивного разбиения, причем каждый шаг имеет одно числовое значение и другую группу зависимых переменных, которые разветвляются на другую пару, такую как эта.
Дерево регрессии начинается с одной или нескольких переменных-предшественников и заканчивается одной конечной выходной переменной. Зависимые переменные являются либо непрерывными, либо дискретными числовыми переменными.
Классификация против регрессии | |
Древовидная модель, в которой целевая переменная может принимать дискретный набор значений. | Древовидная модель, в которой целевая переменная может принимать непрерывные значения, как правило, действительные числа. |
Зависимая переменная | |
Для дерева классификации зависимые переменные являются категориальными. | Для дерева регрессии зависимые переменные являются числовыми. |
Ценности | |
Имеет установленное количество неупорядоченных значений. | Имеет либо дискретные, но упорядоченные значения, либо недискретные значения. |
Цель строительства | |
Цель построения дерева регрессии состоит в том, чтобы подогнать систему регрессии к каждой ветви детерминанты таким образом, чтобы получить ожидаемое выходное значение. | Дерево классификации разветвляется, как определено зависимой переменной, полученной из предыдущего узла. |
Деревья регрессии и классификации являются полезными методами для составления схемы процесса, который указывает на изучаемый результат, будь то в классификации или едином числовом значении. Разница между деревом классификации и деревом регрессии является их зависимой переменной. Деревья классификации имеют зависимые переменные, которые являются категориальными и неупорядоченными. Деревья регрессии имеют зависимые переменные, которые являются непрерывными значениями или упорядоченными целыми значениями.
1. «Изучение дерева решений». Википедия, Фонд Викимедиа, 13 мая 2018 года. Доступно здесь
1. 'Data Mining' от Arbeck - собственная работа (CC BY 3.0) через Commons Wikimedia